北京时间11月15号晚上9点,NVIDIA正式解禁了RTX4080显卡的性能表现。9728个CUDA核心到底能够带来多强的性能表现?关于这个焦点话题,笔者此次便一探究竟!

  此次RTX4080首发评测,笔者选用的显卡为映众RTX4080冰龙超级版,它是一款主打优质散热设计的非公版RTX4080,采用了映众全新研发的第八代冰龙散热系统,拥有三风扇、8热管的出色堆料。

  此外,映众RTX4080冰龙超级版还是一款高频版显卡,拥有高于RTX4080创始人版的出厂频率设置。映众自家的INNO3D TuneIT超频软件目前已适配RTX40系列显卡,喜欢超频的玩家们还可以借助INNO3D TuneIT自带的一键智能超频功能,进一步提升这款显卡的性能。

  提前透个底儿,映众RTX4080冰龙超级版是比较能超的!

  全新的Ada Lovelace架构与RTX4080

  RTX40系列显卡基于英伟达新一代的Ada Lovelace架构设计。为了让大家更好地了解到这一显卡的升级,笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。

  (一) Ada Lovelace架构核心

(Ada Lovelace架构核心)

(完整规格的AD102显示核心,具备144组SM单元)

(Ada Lovelace架构核心GPC单元)

  Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍,还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。

(第三代RT Core结构示意图,相比前代,增加了2个功能)

  Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入至高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级,这一项升级不可谓不小。

(Ada Lovelace架构核心SM结构图)

  Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外,带来了全新的第八代NVENC双硬件编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。

  而除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存,完成版的Ada Lovelace架构核心(AD102)拥有96MB的L2缓存,大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以进一步提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。

  (二) DLSS 3与NVIDIA Reflex

  Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。

  DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。

  DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。

  而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

  (三) 40系显卡第二弹——RTX4080

(RTX4080显示核心架构图,具备76组SM单元)

  RTX4080采用的是AD103-300显示核心,拥有9728个CUDA核心,CUDA核心数量不到RTX4090的60%。芯片规格差距不小,这也是广大网友们热议的焦点话题。

  除了核心规格差距较大之外,RTX4080在显存配置方面相比RTX4090也是要明显削减的。RTX4080搭配的是16GB容量、256bit位宽的GDDR6X显存,而RTX4090配备的是24GB容量、384bit位宽的GDDR6X显存。

  显存速度RTX4080比RTX4090略高,这一点倒是比较有意思。老黄这样做估计是为了精准的性能卡位。

  映众RTX4080冰龙超级版的Boost默认设置为2565MHz,相比RTX4080创始人版的2505MHz高出了60MHz。

(完整规格的AD103显示核心,具备80组SM单元)

  值得注意的是,现阶段发布的RTX4080采用的并非是满血版的AD103核心,而是在满血版AD103核心上进行定向削减而来的产品。因此笔者猜测,未来或有可能存在使用完整AD103核心的显卡,例如RTX4080Ti。

  映众RTX4080冰龙超级版显卡欣赏

  映众RTX4080冰龙超级版延续了冰龙系列的酷黑外观设计。三风扇散热设计,三插槽厚度。

  经过笔者实测,这款显卡的重量约为1.8kg,确实很有分量。

  显卡背面设计了金属背板,其上面有一些镂空设计,以便兼顾散热效果。

  输出接口为三个DP 1.4a以及一个HDMI 2.1。

  散热器顶部上面印有“GEFORCE RTX”的字样。

  显卡供电接口为12VHPWR接口。玩家在装机时一定要接上这部分的供电线缆。

  将散热器拆卸下来,露出显卡PCB,我们来接着瞧一瞧它的用料。

  这款显卡虽然长度接近33.5cm,但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。

  毕竟是高端显卡,映众RTX4080冰龙超级版的供电设计依旧强悍。GPU左右周围共设计了17相供电,搭配全封闭式电感、富士通FP固态电容等高品质元器件,用料值得信赖。

  全新的AD103-300显示核心,芯片面积为378平方毫米。

  相对于RTX4090显卡AD102芯片的608平方毫米,RTX4080显卡GA103芯片面积明显小了不少。

  显存是来自美光的GDDR6X,型号为2PU47 D8BZF,单颗2GB容量。这款显卡PCB正面共设计有8颗显存,组建了16GB显存容量。

  再来瞧瞧它的冰龙散热器。这款第八代冰龙散热系统采用三枚直径约10cm的大尺寸散热风扇。同时,这款散热器支持智能风扇停转功能,在待机状态下或者轻负载状态下,它的这3枚风扇会全部停转,以便实现安静的运行效果。

  还有,中间风扇与两侧风扇设计方向相反,这样能够减少冷却阵列内部的气流紊流,从而进一步提高显卡的整体散热性能。

  这款散热器的金属主体也是相当的庞大,不仅能够为GPU进行散热,而还能够为显存、电感以及MOS管进行散热。

  超大面积的纯铜底座全面覆盖GPU核心,结合8根6mm热管,可以快速将热量传导至鳍片上。高达6cm高度的鳍片矩阵提供了高达0.99平方米的散热面积,可以快速散发热量。

  纯铜底座经过了镀镍处理。

  这款显卡的散热器上面还采用大面积IML模内印刷RGB灯箱设计,令这款显卡运行时炫酷有型。

  RGB灯效可以利用映众研发的INNO3D TuneIT软件进行调节。

  这款显卡还支持炫光同步功能。散热器尾端设计了灯效控制接针。

  附件里面自带一条灯效同步连接线。将这条线缆的一头连接显卡(灯效控制接针),另一头连接主板的RGB灯效接针,便可调节这款显卡的RGB灯效。

  包装盒附件里面还带有一根显卡支架,以及一条3×8Pin转12VHPWR的转接线。

  测试平台介绍

  笔者组建了一套性能出色的13代酷睿i9测试平台,用来测试显卡的性能。为了对比映众RTX4080冰龙超级版的性能,笔者此次测试还加入新一代卡皇RTX4090以及上一代卡皇RTX3090Ti的成绩。

  此次测试所选用的这款RTX4090是一款非公版显卡,其GPU频率为2235MHz,Boost频率为2580MHz,显存频率为1313MHz(等效21008MHz)。

  此次测试所选用的这款RTX3090Ti是一款非公版显卡,其GPU频率为1560MHz,Boost频率为1890MHz,显存频率为1313MHz(等效21008MHz)。

  英特尔13代酷睿处理器搭配RTX40系列独立显卡是支持Resizable BAR技术的。为了充分发挥映众RTX4080冰龙超级版显卡的性能表现,以下测试环节均是在Resizable BAR开启状态下进行的。

  DLSS 3是RTX40系列显卡带来的全新技术,在维持高画质的情况下也可以实现更为流畅的游戏表现,这也让玩家可以更好的享受4K光追游戏带来的出色画质体验。为了更好的感受RTX40系列显卡在游戏方面的升级,我们在测试RTX40系列显卡时特意选择了爱攻&保时捷(Porsche Design)联合设计的PD32M显示器。

  这款显示器为31.5英寸,采用MIni LED背光技术,拥有1152个独立分区,拥有1600尼特峰值亮度,8000万:1动态对比度,并通过HDR1400认证,在画质上有着更为出色的表现。此外,PD32M拥有4K分辨率以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆盖,并且拥有HDMI 2.1接口,是一款旗舰级电竞显示器。

  俗话说好马配好鞍,此次测试平台的主板部分,笔者选用的是华硕ROG MAXIMUS Z790 HERO。华硕ROG新一代Z790主板采用了高效整合的供电设计,以及全方位散热及解决方案,同时还拥有全新的AEMP 2.0、AI智能优化和EZ DIY贴心设计,带来更强的性能、更智能的优化和更好的装机体验。

  INNO3D TuneIT一键智能超频

  此次测试,除了常规的显卡默认性能测试之外,笔者还对其进行了超频测试。

  超频利用的是映众自家的INNO3D TuneIT超频软件。INNO3D TuneIT超频软件官方下载地址:http://www.inno3d.com.cn/support_download.php?refid=3

  点击INNO3D TuneIT界面上的“智能扫描”按键,该软件便会对显卡进行较长时间的智能扫描,最后对显卡进行智能超频,使用起来相当方便,即使是超频初学者也能够轻松上手,收获超频带来的性能提升。

  利用INNO3D TuneIT的一键智能超频,笔者手中的这块映众RTX4080冰龙超级版显卡最终的一键超频结果为:GPU频率达到了2270MHz,Boost频率达到了2630MHz,显存频率达到了1425MHz(等效22800MHz)。

  游戏性能测试

  (一) 3DMark基准测试

  让我们先来瞧瞧映众RTX4080冰龙超级版在3DMark基准测试当中的表现。性能到底有多强,大家一看便知。

  在3DMark Time Spy测试项目中,这款RTX4080的显卡成绩约为RTX4090的77.9%。

  在3DMark Port Royal光线追踪测试项目中,这款RTX4080的显卡成绩约为RTX4090的70%。

  显而易见,单从跑分成绩来看,RTX4080显卡明显强于上代卡皇RTX3090Ti,也明显落后于新一代卡皇RTX4090。

  (二) DLSS 3基准测试

  3DMark基准测试新增加了DLSS功能测试(DLSS 3)。

  根据实测来看,在开启DLSS 3之后,RTX40系列显卡实现了巨大的FPS提升。

  (三) DLSS 3游戏实测

  目前已有《赛博朋克2077》、《逆水寒》、《瘟疫传说:安魂曲》、《光明记忆:无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测,笔者将利用《赛博朋克2077》、《瘟疫传说:安魂曲》这2款游戏进行测试。注意,《赛博朋克2077》的DLSS 3版本目前均处于测试阶段,进行测试的话需要下载NVIDIA提供的测试版游戏。

  DLSS 3游戏测试版——《赛博朋克2077》

  DLSS 3游戏测试版——《瘟疫传说:安魂曲》

  通过上述2款DLSS 3游戏来看,DLSS 3技术为RTX40系列显卡带来的游戏帧数提升是巨大的。

  NVIDIA的DLSS 3技术除了能够助力游戏帧数的大幅提升之外,还能够助力游戏画质的提升。

  上图这个《赛博朋克2077》游戏场景,开启DLSS质量模式之后,篮球架上面的针叶树的树叶模型要更加精细。

  上图这个《瘟疫传说:安魂曲》游戏场景,开启DLSS画质模式之后,树叶的模型要更加精细。

  开启DLSS技术之后,不论DLSS 3还是DLSS 2,PC延迟也会明显降低,这也是DLSS技术的一大优势。

  PC延迟越低,游戏画面流畅度自然也就越好。

  (四) 其它游戏实测

  接下来,笔者再测试一些非DLSS 3游戏。

  游戏实测——《地铁:离去》

  游戏实测——《刺客信条:奥德赛》

  游戏实测——《战争机器5》

  游戏实测——《幽灵行动:荒野》

  游戏实测——《古墓丽影:暗影》

  游戏实测——《无主之地3》

  游戏测试结果跟3DMARK的测试结果差不多,RTX4080显卡明显强于上代卡皇RTX3090Ti,也明显落后于新一代卡皇RTX4090。

  生产力性能测试

  (一) AV1硬件加速编解码测试

  为什么AV1编解码技术越来越受欢迎?理由很简单,采用AV1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用AV1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。

  目前万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用达芬奇这款软件,将一部12GB容量的4K视频,利用N卡AV1硬件加速编解码导出一部MP4视频。

  最终,RTX4080和RTX4090的加速效果都是相当快的。

  RTX4080甚至比RTX4090还要快一点。笔者猜测,可能是RTX4080显存速度更快的缘故。

  (二) H.265硬件加速编解码测试

  继续利用达芬奇这款软件,将一部12GB容量的4K视频,利用H.265编解码导出一部MP4视频。此项测试对比了RTX3090Ti的成绩。

  相比上代卡皇RTX3090Ti,RTX4080和RTX4090的加速效果都是要更快的。

  散热器测试

  (注:笔者所处的室温维持在26℃)

  利用FurMark,笔者将对映众RTX4080冰龙超级版显卡进行压力测试。

(默频表现)

  默认频率下,满载时GPU温度稳定在约64℃。GPU频率稳定在约2850MHz。

(一键智能超频表现)

  在智能超频状态下,满载时GPU温度稳定在约64℃。GPU频率稳定在约2910MHz。

  显而易见,这款显卡的散热器表现很不错,应对适当的超频操作也不在话下。同时静音效果也不错,笔者很满意。

  全文总结

  力压30系卡皇,并且超越的幅度还不小,RTX4080的性能是值得肯定的。虽然与新卡皇RTX4090尚有不小的性能差距,但是别忘了RTX4080的CUDA核心数量还不到RTX4090的60%。老黄的刀法在未来还有很大的施展空间,让我们拭目以待。

  目前RTX4090显卡的价格已经被大量炒到1万5以上。对于全新的RTX4080,笔者估计价格大概率会紧跟RTX4090的步伐。RTX4080能不能大卖,就看市面上的实际价格了!

  作为本文的主角,映众RTX4080冰龙超级版散热非常给力,并且预留了一定的超频空间给玩家,INNO3D TuneIT软件自带的一键智能超频功能也非常的简单易用,可谓能战又能超!对于这么好的非公版RTX4080,笔者向广大用户们力推!

  好了,此次评测就写到这里了,希望大家喜欢。根据映众官方的消息,RTX4080冰龙超级版显卡将于北京时间10月16号正式开售,心仪的朋友们可以前往天猫商城映众旗舰店购买。

您可能感兴趣的文章