映众RTX4070Ti冰龙超级版显卡评测：AD104性能不凡，冰龙散热实力护航！

　　北京时间1月4号晚上10点，NVIDIA解禁了RTX4070Ti显卡的性能表现。CUDA核心数量不到RTX4090的一半，并且还采用的是192bit位宽的显存，这两点都是近期玩家们热议的焦点。

　　此次首发评测，笔者选用的RTX4070Ti显卡为映众RTX4070Ti冰龙超级版。之前的RTX4090和RTX4080冰龙超级版笔者都曾评测过，出色的散热性能令人满意。因此对于全新的映众RTX4070Ti冰龙超级版，笔者也非常看好它的散热表现。

　　RTX4070Ti的性能到底如何?映众RTX4070Ti冰龙超级版又能够带来怎样的性能体验?精彩即将开启，大家往下看便是了!

　　全新的Ada Lovelace架构与RTX4070Ti

　　RTX40系列显卡基于英伟达新一代的Ada Lovelace架构设计。为了让大家更好地了解到这一显卡的升级，笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。

　　(一) Ada Lovelace架构核心

(Ada Lovelace架构核心)

(完整规格的AD102显示核心，具备144组SM单元)

(Ada Lovelace架构核心GPC单元)

　　Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍，Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍，还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎，进一步提升了光追计算的性能以及减少计算开销，带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。

(第三代RT Core结构示意图，相比前代，增加了2个功能)

　　Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序，在使用上可以根据不同的负载需求来执行渲染，可对负载较为统一的画面进行渲染，降低工作开销。根据英伟达官方的介绍，这一个SER功能将作为API开放给开发者使用。英伟达官方宣称，SER功能的加入至高可带来两倍RT Core性能上的改善，对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据，全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级，这一项升级不可谓不小。

(Ada Lovelace架构核心SM结构图)

　　Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外，带来了全新的第八代NVENC双硬件编码器，这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持，可以在传统的H.264等格式之外，加入了对AV1这一主流新标准的支持，可以进行对于AV1格式的编码与解码，有效提升了生产力方面的表现，对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示，第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%，这一提升非常明显。

　　而除了核心上的升级以外，Ada Lovelace架构核心还大幅度提升了其L2缓存，完成版的Ada Lovelace架构核心(AD102)拥有96MB的L2缓存，大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下，通过升级更大容量的L2缓存，可以进一步提升数据命中表现，带来性能方面的升级，根据NVIDIA官方的说法，大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益，尤其是在光线追踪等场景下，表现更为明显。

　　(二) DLSS 3与NVIDIA Reflex

　　Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。

　　DLSS 3包含有DLSS 2(DLSS超分辨率技术)，以及全新加入的DLSS帧生成技术，这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中，其通过光流处理器所得到的一系列数据后，以光流加速技术(Optical Flow Acceleration，简称为OFA)来生成画面信息，而AI算力则负责来对画面进行进一步的优化，从而在游戏中加入了更多的帧画面，进行帧数的提升。

　　DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧，相当于使用1/8的算力，就完成了整个计算过程，而通过这一个流程的循环，可在提升帧数的同时节省资源开销，进一步带来更好游戏体验。

　　而在DLSS 3的帧生成技术上，由于可能带来延迟的增加，因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法，DLSS 3通过整合NVIDIA Reflex以及一系列的技术，可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

　　(三) 40系显卡第三弹——RTX4070Ti

(RTX4070Ti显示核心架构图，具备60组SM单元)

　　RTX4070Ti采用的是AD104-400显示核心，拥有7680个CUDA核心。此外，RTX4070Ti还搭配12GB容量、192bit位宽的GDDR6X显存。

　　映众RTX4070Ti冰龙超级版的Boost默认设置为2670MHz，相比RTX4070Ti创始人版的2610MHz高出了60MHz。

　　映众RTX4070Ti冰龙超级版显卡欣赏

　　映众RTX4070Ti冰龙超级版延续了冰龙系列的酷黑外观设计。三风扇散热设计，三插槽厚度。

　　显卡背面设计了金属背板，其上面有一些镂空设计，以便兼顾散热效果。

　　输出接口为三个DP 1.4a以及一个HDMI 2.1。

　　散热器顶部上面印有“GEFORCE RTX”的字样。

　　显卡供电接口为12VHPWR接口。玩家在装机时一定要接上这部分的供电线缆。

　　将散热器拆卸下来，露出显卡PCB，我们来接着瞧一瞧它的用料。

　　这款显卡虽然长度接近33.5cm，但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。

　　毕竟是高端显卡，映众RTX4070Ti冰龙超级版的供电设计依旧不错。GPU左右周围共设计了13相供电，搭配电容铁素体电感、固态电容、Dr.MOS等高品质元器件，用料值得信赖。

　　全新的AD104-400显示核心，芯片面积为294.5平方毫米，看上去尺寸比较小。

　　显存是来自美光的GDDR6X，单颗2GB容量。这款显卡PCB正面共设计有6颗显存，组建了12GB显存容量。

　　再来瞧瞧它的冰龙散热器。这款第八代冰龙散热系统采用三枚直径约10cm的大尺寸散热风扇。同时，这款散热器支持智能风扇停转功能，在待机状态下或者轻负载状态下，它的这3枚风扇会全部停转，以便实现安静的运行效果。

　　还有，中间风扇与两侧风扇设计方向相反，这样能够减少冷却阵列内部的气流紊流，从而进一步提高显卡的整体散热性能。

　　这款散热器的金属主体也是相当的庞大，不仅能够为GPU进行散热，而还能够为显存、电感以及MOS管进行散热。

　　8根纯铜复合热管以及大面积纯铜底座一体式散热，其中7根热管为核心散热，另外还有一根热管则用于连接供电部位的鳍片，搭配高达6cm的超大散热鳍片矩阵，可以快速发散热量。

　　这款显卡的散热器上面还采用大面积IML模内印刷RGB灯箱设计，令这款显卡运行时炫酷有型。

　　RGB灯效可以利用映众研发的INNO3D TuneIT软件进行调节。

　　包装盒附件里面还带有一根显卡支架。

　　测试平台介绍

　　笔者组建了一套性能出色的13代酷睿i5测试平台，用来测试显卡的性能。为了对比映众RTX4070Ti冰龙超级版的性能，笔者此次测试还加入RTX4080以及上一代卡皇RTX3090Ti的成绩。

　　此次测试所选用的这款RTX4080是一款非公版显卡，其GPU频率为2205MHz，Boost频率为2565MHz，显存频率为1400MHz(等效22400MHz)。

　　此次测试所选用的这款RTX3090Ti是一款非公版显卡，其GPU频率为1560MHz，Boost频率为1890MHz，显存频率为1313MHz(等效21008MHz)。

　　英特尔13代酷睿处理器搭配RTX40系列独立显卡是支持Resizable BAR技术的。为了充分发挥映众RTX4070Ti冰龙超级版显卡的性能表现，以下测试环节均是在Resizable BAR开启状态下进行的。

　　DLSS 3是RTX40系列显卡带来的全新技术，在维持高画质的情况下也可以实现更为流畅的游戏表现，这也让玩家可以更好的享受4K光追游戏带来的出色画质体验。为了更好的感受RTX40系列显卡在游戏方面的升级，我们在测试RTX40系列显卡时特意选择了爱攻&保时捷(Porsche Design)联合设计的PD32M显示器。

　　这款显示器为31.5英寸，采用MIni LED背光技术，拥有1152个独立分区，拥有1600尼特峰值亮度，8000万：1动态对比度，并通过HDR1400认证，在画质上有着更为出色的表现。此外，PD32M拥有4K分辨率以及144Hz的刷新率，支持97%DCI-P3色域以及99% Adobe RGB覆盖，并且拥有HDMI 2.1接口，是一款旗舰级电竞显示器。

　　俗话说好马配好鞍，此次测试平台的主板部分，笔者选用的是华硕ROG MAXIMUS Z790 HERO。华硕ROG新一代Z790主板采用了高效整合的供电设计，以及全方位散热及解决方案，同时还拥有全新的AEMP 2.0、AI智能优化和EZ DIY贴心设计，带来更强的性能、更智能的优化和更好的装机体验。

　　游戏性能测试

　　(一) 3DMark基准测试

　　让我们先来瞧瞧映众RTX4070Ti冰龙超级版在3DMark基准测试当中的表现。性能到底有多强，大家一看便知。

　　在3DMark测试项目中，这款RTX4070Ti与上一代卡皇RTX3090Ti互有胜负。

　　(二) DLSS 3基准测试

　　3DMark基准测试新增加了DLSS功能测试(DLSS 3)。

　　根据实测来看，在开启DLSS 3之后，RTX40系列显卡实现了巨大的FPS提升。

　　(三) DLSS 3游戏实测

　　目前已有《赛博朋克2077》、《逆水寒》、《瘟疫传说：安魂曲》、《光明记忆：无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测，笔者将利用《赛博朋克2077》、《瘟疫传说：安魂曲》等4款游戏进行测试。注意，《赛博朋克2077》的DLSS 3版本目前均处于测试阶段，进行测试的话需要下载NVIDIA提供的测试版游戏。

　　DLSS 3游戏测试版——《赛博朋克2077》

　　DLSS 3游戏——《瘟疫传说：安魂曲》

　　DLSS 3游戏——《巫师3：狂猎》

　　DLSS 3游戏——《传送门：光追版》

　　通过上述4款DLSS 3游戏来看，DLSS 3技术为RTX40系列显卡带来的游戏帧数提升是巨大的。

　　(四) 其它游戏实测

　　接下来，笔者再测试一些非DLSS 3游戏。

　　游戏实测——《地铁：离去》

　　游戏实测——《刺客信条：奥德赛》

　　游戏实测——《战争机器5》

　　游戏实测——《幽灵行动：荒野》

　　游戏实测——《古墓丽影：暗影》

　　游戏实测——《无主之地3》

　　非DLSS游戏中，款RTX4070Ti与上一代卡皇RTX3090Ti依旧互有胜负。

　　生产力性能测试

　　(一) AV1硬件加速编解码测试

　　为什么AV1编解码技术越来越受欢迎?理由很简单，采用AV1编解码的视频能够以更低的码率，实现其它主流编解码视频相同的画质。说白了，在视频画质相同的情况下，采用AV1编解码的视频文件体积会更小，以至于能够为视频创作者们节省大量的硬盘空间。

　　目前万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用达芬奇这款软件，将一部12GB容量的4K视频，利用N卡AV1硬件加速编解码导出一部MP4视频。

　　最终，RTX4070Ti和RTX4080的加速效果都是相当快的。

　　(二) H.265硬件加速编解码测试

　　继续利用达芬奇这款软件，将一部12GB容量的4K视频，利用H.265编解码导出一部MP4视频。此项测试对比了RTX3090Ti的成绩。

　　相比上代卡皇RTX3090Ti，RTX4070Ti和RTX4080的加速效果都是要更快的。

　　散热器测试

　　(注：笔者所处的室温维持在26℃)

　　利用FurMark，笔者将对映众RTX4070Ti冰龙超级版显卡进行压力测试。

　　通过10分钟的烤机，默认频率下满载时GPU温度稳定在约64℃，GPU频率稳定在约2820MHz。这款冰龙散热器的散热性能确实很棒，静音效果也很不错，令笔者很满意。

　　全文总结

　　别看RTX4070Ti的CUDA核心数量还不到RTX4090的一半，别看RTX4070Ti仅采用了192bit位宽的显存，但是论性能，这款新显卡还是挺不错的。特别是在DLSS 3技术的加持下，RTX4070Ti整体上是要超越上一代卡皇RTX3090Ti的。只要价格合适，笔者认为RTX4070Ti会大卖。

　　根据映众官方的消息，本文的主角映众RTX4070Ti冰龙超级版的参考价格为6999元。要知道现在很多RTX3090Ti显卡还得卖到7、8千块钱呢，因此对于这款散热优异的RTX4070Ti显卡，笔者向大家力推。

　　一句话，对于映众出品的RTX40系列冰龙超级版显卡，大家放心购买就是了!