分享

iGame RTX 4080 Neptune OC评测:静音多面手,全能新体验

 爱极物 2022-11-17 发布于上海

随着GPU功耗与散热预期的不断增长,风冷显卡义无反顾奔向了3槽时代,加框加厚的散热模组开始挑战主板PCIe槽、前段硬盘支架、整体机箱的散热布局,这时候如果能像CPU一体水冷一样,将散热与板卡分开,似乎是个不错的选择。因此我们眼前的这款iGame GeForce RTX 4080 16GB Neptune OC就成了很好的例子。

作为今晚GeForce RTX 4080评测解禁中的一体水冷产品,iGame GeForce RTX 4080 16GB Neptune OC光是设计外形和理念就给人留下了很深的印象,高端显卡阵营中少见的短卡设计,只占据2个槽位,顿时让这块显卡显得格外清爽。

但三风扇一体式水冷设计暗示着iGame GeForce RTX 4080 16GB Neptune OC并不一般,它是目前首发GeForce RTX 4080阵营中拥有最高频率的AIC显卡,也是外观设计最为亮眼的显卡。左手性能,右手颜值,iGame GeForce RTX 4080 16GB Neptune OC表现究竟如何,现在就让我们奉上首发评测。

进击的AD103

AD103是个比较有意思的代号,以往型号交替尾数一般以双数结尾,例如GA102、GA104,TU102、TU104等等,而这一次RTX 40系列是第一次使用了103单数作为结尾。

iGame GeForce RTX 4080 16GB Neptune OC的核心型号为AD103-300-A1,自于台积电4N定制工艺的Ada Lovelace。AD103保留了所有AD102的主要功能,例如流式多处理器(Streaming Multiprocessors,SM)中的所有改变。因此GeForce RTX 4080的提升来自于工艺升级,架构更新后带来的第三代RT Core、第四代Tensor Core以及围绕核心建立的新技术进行。

我们已经知道,Ada Lovelace架构GPU中包含了若干个GPC(Graphics Processing Clusters,图形处理集群),GPC下包含若干个TPC(Texture Processing Clusters,纹理处理簇),再往下就是SM、CUDA、RT Core、Tensor Core等等。每个GPC之间包含的TPC数量相等,当GPU进行定位区分的时候再进行GPC、TPC的物理屏蔽实现。

但完整的AD103不一样,虽然包含7个GPC,但每个GPC包含的TPC并不相同。如下图所示,在6个GPC各拥有6组TPC的同时,还有1个GPC仅有4组TPC。包含7个GPC,40个TPC、80个SM,以及8个32-bit内存控制器,总共带来256-bit位宽。

最终整个AD103上限应该是包含10,240个CUDA核心、80个RT Core、320个Tensor Core、320个纹理单元和112个ROPs。在内存子系统上则总共包含10,240KB L1缓存,20,480KB寄存器堆,以及65,536KB的L2缓存。

这时候如果放出iGame GeForce RTX 4080 16GB Neptune OC的AD103-300-A1进行对比,会发现显卡实际上仅在完整的AD103基础上再屏蔽1组TPC。因此显卡最终拥有9,728个CUDA核心,76个RT Core、304个Tensor Core、304个纹理单元和112个ROPs。并总共包含9,728KB L1缓存,19,456KB寄存器堆,以及65,536KB的L2缓存。可以看到在L2缓存上没有删减,为GeForce RTX 4080后续的性能发挥奠定基础。

最后让我们放出对比简约明了的对比表格作为参考:

现在我们知道AD103同样继承了L1和L2缓存设计,其中L1共享缓存可以通过驱动实现与1个线程块内的CUDA线程共享数据,如果当共享存储设置为0,那么所有空间将归L1缓存所有,每个SM中具备128KB L1缓存,从而得到9,728KB的L1缓存容量,比GeForce RTX 3080 Ti的L1缓存少了512KB。

但L2缓存就不一样了,不做删减的65,536KB缓存比GeForce RTX 3080 Ti提升了将近10倍,这让光线追踪,尤其是路径追踪从中获得巨大收益,最终让第三代RT Core的射线/三角形求交测试模块数量直接翻倍。

这样我们就引出了第三代RT Core。在Ada Lovelace架构分析中,我们已经详尽阐述了第三代RT Core的变化,这里只需要知道第三代RT Core在第二代RT Core的基础上,再次将射线/三角形求交测试吞吐量。意味着射线/三角形求交测试模块由原来的2个再次增加到4个,相对Turing架构的1个射线/三角形求交测试模块翻了4倍,并额外增加了下图左下角的透明度微图引擎(Opacity Micro-Map,OMM)和右下角的位移式微型网面引擎(Displaced Micro-Mesh,DMM)。

同时第三代RT Core还引入了着色器执行重排序(Shader Execution Reordering,SER)技术,通过与游戏设计团队配合,更有效的分配次级射线的排序权重,从而获得更高效的线程排序执行,避免光追运算陷入无意义的次级射线运算深渊。

而第四代Tensor Core在效率提升的同时,更进一步与DLSS 3、光流加速器、NVIDIA Reflex强绑定,进而获得一个不依赖GPU渲染工作,也能生成其中大部分像素和帧的神奇操作,这里我们会在DLSS 3游戏测试中做进一步解释。

水冷一体到位

回到iGame GeForce RTX 4080 16GB Neptune OC本身,显卡使用了一体式合金散热外甲,浅色系外形也更适合搭配白色主题的主板与内存,就比如七彩虹CVN Z790D5 GAMING FROZEN V20和CNV DDR5-6000 16GB内存条的浅色调都很合适。

为了强调Neptune所希望呈现出来的深海亚特兰蒂斯效果,iGame GeForce RTX 4080 16GB Neptune OC外观使用了两条RGB曲线作为波动装饰,配合iGame Center可以实现出更好的灯光流动效果,没有过于耀眼,并且恰到好处。

于此同时iGame GeForce RTX 4080 16GB Neptune OC背面也使用了合金外甲背板作为PCB和GPU的压力平衡,同时也增添了显卡的质感。

RGB装饰面板下则是Neptune OC的精髓,GPU使用了一套全覆盖铜底,通过大尺寸与GPU热源完全接触,确保快速导热。与铜底内的冷却液由水泵腔体搭配叶轮、电机加速驱动,从而形成水路循环。

对于玩家而言,一体水冷设定甚至不需要知道那么多,只需要接通电源,拧紧螺丝即可。,iGame GeForce RTX 4080 16GB Neptune OC使用了一套可转动水冷头,给予了360冷排散热模组很大的摆放空间,冷排规格为394 x 119.2 x 54.4mm,水管长度420mm,在安装的过程中可以更轻松的完成布线。

同时冷排风扇也使用了可拆卸设计,你也可以根据需求更换新的风扇,而从实际体验来看,原版的RGB风扇表现已经非常好。

比如在按下超频键之后,iGame GeForce RTX 4080 16GB Neptune OC最高频率可以来到2.640GHz,显卡功耗最高接近470W,红外线测温可以看到整张显卡在压力测试下仍然保持着凉爽的温度,同时风扇噪音不大,仅在40dB左右。由此可见iGame GeForce RTX 4080 16GB Neptune OC利用水冷的优势,做到性能、散热、噪音多手抓。

不仅如此,与iGame GeForce RTX 4080 16GB Neptune OC搭配的iGame Center也升级到了2.0版本,在保留硬件调教、监控的同时,也增加了成就功能增加用户粘性。

有意思的是,iGame Center还额外增加了一个游戏领域栏目,在游戏购买之前,就能够根据当前配置预估游戏在1080p、2K和4K下帧率,看完帧率再买游戏似乎是个不错的选择,不过目前这个栏目正在测试中,相信随后的升级我们就能在游戏领域看到丰富的对比内容。

DLSS 3的胜利

现在让我们进入喜闻乐见的跑分环节,为了不拖水神后退,这里引用了围绕iGame打造的平台,其中CPU采用Intel Core i9-13900K @5.8GHz,内存使用七彩虹Colorful CNV DDR5-6000 16GB x2,主板使用CVN Z790D5 GAMING FROZEN V20,电源为1250W。同时我们也奉上GeForce RTX 3080 Ti作为对比。

在基础性能测试中,惯例引入检测DirectX 11和DirectX 12的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal和VRMark Blue Room进行检测。可以看到常规测试中iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti提升40%左右。

在常规游戏测试中,我们同样将分辨率提升至4K,开启最高特效以及光线追踪,可以看到iGame GeForce RTX 4080 16GB Neptune OC的提升同样在40%左右,符合我们预期。

现在让我们加快进度,让iGame GeForce RTX 4080 16GB Neptune OC进入DLSS 3测试环节,这也是这张显卡真正发挥魅力的地方。

 

从DLSS 3开始,再是依赖于Tensor Core实现的技术,相反成为了一套AI帧率提升的集合体,前面提到的Tensor Core、光流加速器、NVIDIA Reflex支持都融入到了DLSS 3中。

其中光流加速器(Optical Flow Acceleration,OFA)在Turing、Ampere架构中已经出现并独立于CUDA,主要用于利用重采样提升图形生成效率和视频帧率。比如当年NVIDIA用于VR的Texture Space Shading技术就是将左眼的画面重采样至右眼,并添加右眼看到的其他细节,以此节省了大量的渲染时间,在短时间内提升了VR画面的效率,事实上这套方式至今仍然非常奏效。

到了Ada Lovelace,新光流加速器与DLSS 3搭配,能够计算出场景中的所有像素是如何从一个像素移动到另一个像素的,其中就包括阴影、光反射和粒子等光流场信息。同时通过神经网络分析,分析之前帧与当前帧,最终获得一个高清且自然的效果。

DLSS 3在光流加速器的搭配下实现了脱离GPU渲染重建高分辨率方法,让GPU渲染的部分大幅减少,以两帧为例,DLSS 3会承担起第一帧的3/4的工作和第二帧的所有工作,实际上GPU只需要完成其中的1/8的渲染即可,从而节省了大量的计算资源。

这里我们先引入3DMark DLSS 2 2K、3DMark DLSS 3 4K、3DMark DLSS 3 8K进行对比,在2K分辨率下iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti提升40%,似乎比较常规。但不要着急,一旦分辨率来到4K和8K,DLSS 3开启,那么iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti轻松提升80%和105%性能,非常离谱。

凭借着NVIDIA与游戏工作室的深度合作以及强大号召力,已有超过35款游戏和应用宣布支持DLSS 3,其中10款游戏已经上市。同时包括《暗影火炬城》、《光明记忆》、《生死轮回》这样的国产游戏也火速加入到DLSS 3的支持中,后续《WRC Generations》、《极品飞车:不羁》和《战锤40K:暗潮》三款支持DLSS 3的游戏也将在RTX 4080推出后不久发布。

这里可以看到游戏之间的差距非常大,特别是开启DLSS 3之后,iGame GeForce RTX 4080 16GB Neptune OC将差距从36%一直拉到140%以上,游戏对硬件要求越高,提升越明显。

同样,当DLSS 3与NVIDIA Reflex配合,系统响应也会获得进一步降低,在生成更多的帧之后通过Reflex抓住关键帧,并跳过渲染队列,从而获得更低的系统延迟。NVIDIA表示DLSS 3可以将系统延迟降低最多2倍。

为了让DLSS 3能够在游戏和应用中得到快速部署,NVIDIA已经完成了Streamline SDK对DLSS 3的集成工作,包括AI超级分辨率、AI帧生成以及NVIDIA Reflex组件。由于Ada Lovelace与Turing、Ampere的差异,DLSS 2.X与DLSS 3注定会共存上一段时间,但不会添加开发工作量。DLSS会根据硬件的支持情况启动对应的功能,比如AI帧生成是GeForce RTX 40系列独占,但之前的AI超级分辨率则是所有GeForce RTX系列都能使用,NVIDIA Reflex则是GeForce GTX 900系列以后的GPU都能开启。

同时也可以看到,系统响应延迟随着帧率提升,以及NVIDIA Reflex加持,会有不同程度的缩减,比如《生死轮回》从93ms压缩到了33ms,提升幅度很大。

最后再让我们探讨一下大伙关心的TGP话题。虽然GPU功耗与性能表现指标同等重要,但GeForce RTX 4080的320W TGP反应的是GPU Boost运行功耗上限,也就是我们常说的功耗墙。事实上GPU Boost后的时钟频率是由功耗、散热情况决定,GPU功耗也由实际负载而有所不同。

换而言之,当GPU达到最大频率的时候,功耗未必接近TGP功耗墙表现,特别是新工艺加持后GeForce RTX 40系列效能远低于TGP,在1080p、2K分辨率下可以远低于TGP全速运作,只有在4K分辨率以上开始相对接近TGP的表现。

这里提供数款游戏1080p、2K、4K分辨率最高画质的功耗检测进行比较,参考如下。特别对于iGame GeForce RTX 4080 16GB Neptune OC这样的显卡而言,应付3A游戏的同时控制实际散热温度,保持冷排的安静变得顺理成章。

把创意拉满

得益于NVIDIA在专业领域的布局,GeForce RTX系列GPU在内容创作领域也早已能够大展拳脚。iGame GeForce RTX 4080 16GB Neptune OC同样也不局限于游戏,依靠第三代RT Core和第四代Tensor Core,以及海量的CUDA核心和GPU频率,重点是在创作过程中也更为安静。

与此同时iGame GeForce RTX 4080 16GB Neptune OC也引入了对AV1编码器的硬件支持,依照NVIDIA对GeForce RTX 40系列12GB显存以上的GPU采用双AV1编码器的策略,GeForce RTX 4080同样也具备AV1双编码功能。

换而言之,iGame GeForce RTX 4080 16GB Neptune OC不进效率比GeForce RTX 30系列更高,速度还将翻倍的提升。RTX 40系列的AV1编码器能比H.264编码器效率高出40%。这意味着AV1编码器能够利用现阶段可以进行1080p串流视频的带宽,实现1440p甚至更好的画质,比如同样的带宽占用下,在哔哩哔哩可以轻松播放2K或者4K的视频,而播放4K的带宽也将可以用来播放更高分辨率的内容,前提是网站能有所提供。

在众多专业软件中,DaVinci Resolve 18是率先对GeForce RTX 40系列提供全面支持的软件。作为好莱坞电影工程最常见的专业软件之一,我们在电影院线看到的大成本特效制作、剪辑、调色有很多都来自于DaVinci Resolve的支持,是一套同时具备剪辑、调色、视觉特效、动态图形和音频后期制作打包整体解决方案。

拍摄RAW格式视频后期重新调色已经成为每一个专业摄影的必备操作,DaVinci Resolve 18的调色闻名业界。由于动则4K、8K视频后期调色将会耗费大量的系统计算资源和时间,利用AI实现加速成了必选项。这里我们对一段28秒的4K视频进行平衡、偏倚、Log调色、模糊、神奇遮罩调整,使用质量优先模式,计算GeForce RTX 4080与GeForce RTX 3080 Ti使用的时间。

通过对比可以发现,iGame GeForce RTX 4080 16GB Neptune OC在DaVinci Resolve 18中的AI性能能够比GeForce RTX 3080 Ti快了大约35%。

然后是DaVinci Resolve 18的编码测试,动则4K、8K分辨率的视频编码如果利用传统的软件编码效率将会十分低下。这里我们对4K 30FPS和8K 30FPS的视频进行编码,由于GeForce RTX 3080 Ti不支持AV1编码,这里使用H.265替代。能够看到,iGame GeForce RTX 4080 16GB Neptune OC的效率加速差距将近40%,可见效率非常高。

接下来是画面渲染测试。我们先使用了Blender Benchmark检测GeForce RTX 4080的输出能力,在Moster、Junkshop、Classroom三个场景中,可以看到iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti提升了30%到60%。

同样在V-Ray 5 Benchmark中会分别考验CUDA和光线追踪性能,iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti提升了40%左右。

Octane Render RTX是同样是测试GPU的光线追踪性能表现,在一个复杂场景下考验GPU每秒产生的样本率,iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti提升31%到60%。

然后是利用AI提升分辨率的ON1 Resize AI 2022,原理是对低分辨率图片无损提升至高分辨率图片,用于巨幅海报输出,依靠AI性能可以获得更快的出图。

SPECviewperf 2020则是通过建模对象或渲染体的旋转和缩放检视,来检测在各种专业设计领域(包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计等各种领域)的图形性能,这里包含了我们从大学专业软件课开始就接触的3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。

可以看到iGame GeForce RTX 4080 16GB Neptune OC相对GeForce RTX 3080 Ti提升在38%到66%之间,特别是在消费级显卡上运算底下的Medical、SNX也已经到了能够流畅运行的程度。

最后少不了大家更常用的Adobe Photoshop、Lightroom、Premiere测试,这里我们引入Procyon Photoshop Editing和Procyon Video Editing作为比较,从目前来看Adobe的给予RTX 40系列的优化不算多,提升最高为10%左右。但需要注意的是,随着后续专业软件的跟上,引入对新AI功能支持的Adobe在新GPU上也将越来越快。

写在最后:静音多面手

在众多首发GeForce RTX 4080显卡阵营中,iGame GeForce RTX 4080 16GB Neptune OC无疑是最特例独行且最让人深刻的显卡,它用一体水冷设计巧妙的避开了机箱空间安排、GPU散热、风扇噪音等诸多考量,给予了玩家足够多的自由度,无论是安装体验、使用体验还是颜值,都能轻松让人眼前一亮。

不仅如此,iGame GeForce RTX 4080 16GB Neptune OC也让GeForce RTX 4080发挥更进一步,并成为当前频率最高的RTX 4080 GPU之一,为4K游戏、8K内容创作奠定了基础。

而在接下来一波DLSS 3游戏井喷潮的到来,也注定让GeForce RTX 4080变成炙手可热的产品,相比RTX 4090相对高昂的价格,RTX 4080其实做到了在性能、价格与体验之间的新平衡。而iGame GeForce RTX 4080 16GB Neptune OC的一提水冷设计,搭配全新iGame Center,更是让体验再进一步。如果你对这款纯白且战斗力爆表的海神感兴趣,建议不要犹豫,先买为敬。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章