分享

DLSS 3加持下的1440p游戏完美GPU——NVIDIA GeForce RTX 4070 Ti...

 瓜爷耶 2023-01-07 发布于湖北

GeForce RTX 4090和RTX 4080的先后上市让NVIDIA完成了顶级市场上相对于前一代NVIDIA Ampere架构产品的更新换代,4K+游戏市场也迎来了新的王者。不过一方面RTX 4090和RTX 4080的价格仍然有些偏高,另一方面AMD紧随其后推出的RX 7900 XTX和RX 7900 XT也给NVIDIA带来了一些压力。这时,NVIDIA就亟需一款次顶级的高端显卡产品,能够在4K及1440p游戏市场上站稳脚跟,而且还要在高端游戏显卡产品中具备不错的性价比。于是,GeForce RTX 4070 Ti就这样来到了台前。对它来说,肩负着两个重要任务——其一是重新定义1440p+光追游戏市场规则,其二则是正面硬刚AMD的Radeon RX 7900 XT,并在综合性能上战而胜之。GeForce RTX 4070 Ti,能否完成这些任务?

Image

由于此次GeForce RTX 4070 Ti显卡的首发评测时NVIDIA并未送测GeForce RTX 4070 Ti的FE公版显卡,而全部改为AIC厂商的产品。MC评测室收到的NVIDIA送测产品正是来自AIC厂商七彩虹的战斧GeForce RTX 4070 Ti豪华版(后文简称为战斧RTX 4070 Ti)。

当然,先把GeForce RTX 4070 Ti的解析评测放一边,在具体的评测之前,作为要了解传承NVIDIA Ada Lovelace架构的GeForce RTX 4070 Ti GPU的方方面面, 我们还是要先复习一下NVIDIA Ada Lovelace架构的核心要点。虽然在GeForce RTX 4090首发评测时我们专门做了万字的架构解析,在RTX 4080首发评测时也做过复习,但在这里,我们仍然坚持将Ada Lovelace核心架构的主要技术细节要点在这里罗列解析一下,这对于更好地理解后文的详细评测,是非常有必要的(这部分技术细节我们在GeForce RTX 4080首发评测时已有讲解,如果玩家朋友对这部分技术细节已有掌握和了解,可直接略过进入后文的评测部分。当然你如果实在懒,那就直接看最后的测试总结吧)。

如果玩家们想要对NVIDAI Ada Lovelace架构有更详细深入的了解,可以参考MC之前的万字详解文章:Ada架构与DLSS 3助推爆炸式性能增长!NVIDIA GeForce RTX 40系GPU架构详解

来自Ada架构的RTX 40系GPU技术创新

RTX 40系列GPU具有一系列新的技术创新,包括: 

缓存暴增

Image

Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。

更强的SM

Image

AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。 

第三代光追核心

Image

 第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。 

第四代AI核心

Image

新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。

Shader Execution Reordering着色器执行重排序

Image

SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。

DLSS 3与OFA光流加速器

Image

Image

基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:光学帧生成技术、超级分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。

双NVIDIA编码器(NVENC)

Image

RTX 40系GPU都实现了双NVENC编解码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。 

更强的Studio性能

Image

除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。

同时,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:

●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 

特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。 

●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 

2倍。 

●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。

●Modder可以重制经典游戏,并通过RTX Remix开启RTX。

7680 CUDA+12GB显存,1440p游戏GPU王者之相初显

Image

Image

和RTX 4080相比,GeForce RTX 4070 Ti的SM单元从76组降低到了60组,核心代号也从RTX 4080 GPU的AD103变为AD 104。从核心的架构图上可以看出,GeForce RTX 4070 Ti GPU拥有完整的5个GPC,每个GPC含12组SM单元,共计7680个CUDA核心(5×12×128),能够提供40TFlops的FP32着色能力,理论着色渲染性能相比RTX 4080低约22.5%。对比前一代的旗舰级产品GeForce RTX 3090 Ti来看,二者在FP16、FP32和FP64上的着色渲染能力基本相差无几,RTX 3090 Ti拥有更多的CUDA核心配置,但RTX 4070 Ti拥有更先进的架构和更高的核心频率,因此二者在光栅游戏性能上的差距或许应该不会太大,互有胜负是最可能的结果,RTX 3090 Ti应该就是RTX 4070 Ti想要直面竞争的自家兄弟。当然这些都需要后面的详细测试进行验证。至于和前一代名义上的对位产品GeForce RTX 3070 Ti相比,GeForce RTX 4070 Ti无论是核心规格、频率还是着色性能上都远远超过了后者,已经不具备可比性。

此外,GeForce RTX 4070 Ti配置了60个第三代光追核心RT Cores,能够提供约93TFLOPS的光追算力,相比RTX 4080的113RT-FLOPS仍然有22%左右的差距,不过相比配备第二代光追核心的RTX 3090 Ti的78 RT-FLOPS来说,第三代光追核心的高执行效率还是带来了20%左右的光追运算性能提升(理论值),这也意味着在光追环境下,GeForce RTX 4070 Ti是否有着比RTX 3090 Ti更好的性能?

GeForce RTX 4070 Ti一个比较明显的配置精简就在于显存位宽降低到了192bit,结合12GB的显存配置和504GB/s的总显存带宽,显然这也会直接导致它和256bit显存位宽、716.8GB/s带宽配置的RTX 4080拉开较为明显的差距。与前一代的旗舰RTX 3090 Ti相比,GeForce RTX 4070 Ti在显存容量、带宽、位宽上都全面落后,不过凭借更高效的核心架构,它与RTX 3090 Ti可能还有一战之力。

再来看与其定位相对接近的竞争产品Radeon RX 7900 XT,无论是着色渲染性能、显存带宽等核心指标上。Radeon RX 7900 XT都比RTX 4070 Ti要高不少,这也意味着在光栅游戏中RTX 4070 Ti可能并不会占优。在光追核心配置上,Radeon RX 7900 XT也拥有高达84个的光追核心,规格配置相比RTX 4070 Ti领先达到了40%。不过RDNA 3架构的光追性能相比Ada Lovelace来说要逊色不少,所以在光追游戏方面方面RX 7900 XT未必能占到优势地位,这些都需要后面的实际测试来验证了。

内敛却性能强悍,七彩虹战斧RTX 4070 Ti豪华版赏析

Image

作为主打性价比市场的七彩虹战斧系列产品线,在玩家群体中战斧一直都有着价格便宜量又足的不错口碑。

伴随RTX 4070 Ti上市推出的战斧系列也经过了七彩虹的重新锻造,黑红配色延续经典,撞色设计及全新的造型结构,打造低调奢华的造型。钻石三角元素的运用为产品增添力量感。方正硬朗是它的标志,诠释肌肉感十足的硬汉风 格。很酷,也很强。

Image

▲黑与红的撞色造就非凡的新颖外观,钻石状三角元素彰显具有力量感的气质。

Image

▲正面采用了三个98mm的散热风扇,能大幅度提升进气量和风压。

Image

▲在背板的尾部采用了大面积的镂空设计,通风效果更好,同时能提升热交换效率,在一定程度上提升散热效果。

Image

▲电源接口仍然是RTX 40系的标准16Pin PCIe 5.0规范供电接口,随卡附赠有转接头,方便老电源用户平滑升级。

Image

▲显示输出部分是标准的3DP 1.4a+1 HDMI 2.1的组合。

Image

七彩虹战斧RTX 4070 Ti的整体结构解析图

Image

▲散热部分采用的是七彩虹利斧散热器,散热片采用回流焊工艺制造,优化散热性能,能提供非常不错的散热性能

Image

▲七彩虹战斧RTX 4070 Ti采用了10+2相供电设计

Image

▲代号AD104-400-A1,GeForce RTX 4070 Ti GPU核心

Image

▲显存仍然是来自美光的GDDR6X颗粒,单颗容量2GB,共6颗。



七彩虹战斧GeForce RTX 4070 Ti豪华版产品资料

核心架构:Ada Lovelace

核心代号:AD104

制程工艺:TSMC 4N定制

SM单元(CU单元):60

CUDA核心数(流处理器):7680

光追核心数(RT Cores):60

AI核心数(Tensor Cores):240

核心频率:2310MHz~2715MHz

显存容量:12GB GDDR6X

显存速率:21Gbps

显存位宽:192bit

显存带宽:504GB/s

支持DLSS(FSR)版本:DLSS 3

TGP:285W

产品尺寸:326.5mm×149.7mm×60.5mm

显卡厚度:3槽

参考价格:6499元

实际测试,光追游戏性能强势击败RTX 3090 Ti和RX 7900 XT

接下来就让我们进入RTX 4070 Ti的实际性能测试环节。在这部分的测试中,我们主要测试GeForce RTX 4070 Ti在光栅、光追游戏性能上的表现,同时还会测试它在设计创作方面的性能。当然,作为玩家们都非常关心的能耗比和每瓦性能上,我们也会在不同的应用场合进行详细的评测。另外作为NVIDIA Ada Lovelace核心架构最重要的DLSS 3技术,我们也会对其进行详细的专项测试,并对比同代产品DLSS 2/3的差距以及跨代产品间DLSS 2/3的性能差异。

作为性能对比的产品选择,我们主要选择了RTX 4080、RTX 3090 Ti和Radeon RX 7900 XT三款产品来作为参考,衡量RTX 4070 Ti与上一级同代产品、前一代旗舰产品以及主要的目标竞争对手的性能优劣。由于RTX 4070 Ti在硬件规格上已经极大幅度地超越了GeForce RTX 3070 Ti,因此我们并未将RTX 3070 Ti列入对比参照评测,不过在部分测试中我们也加入了GeForce RTX 3080 Ti FE作为对比,通过一部分的代表性测试,来看看RTX 4070 Ti在对位取代上的是否有足够的资格。

通过评测,以下问题是我们最想解决的:

1.RTX 4070 Ti在综合游戏性能表现上是否能匹敌甚至胜过RTX 3090 Ti?

2.RTX 4070 Ti+DLSS 3相对于RTX 3090 Ti+DLSS 2的性能表现是否足够优秀?

3.在设计创作性能上,RTX 4070 Ti能否有比RTX 3090 Ti更好的表现?

4.秉承NVIDIA Ada Lovelace核心架构的RTX 4070 Ti在能耗比上表现如何?相比RTX 3090 Ti,是否有明显优势?

疑问已经提出,真相却只有一个,让实际测试数据来说话吧!



测试平台

GPU:NVIDIA GeForce RTX 4070 Ti(七彩虹战斧RTX 4070 Ti豪华版)、RTX 4080 FE、RTX 3090 Ti FE、RTX 3080 Ti FE(部分测试)、AMD Radeon RX 7900 XT(某型号非公版)

CPU:英特尔酷睿i9-13900K

主板:技嘉AORUS Z790 MASTER

内存:影驰名人堂DDR5 6000 32GB

电源:鑫谷昆仑冰山1250W(ATX 3.0)

显示器:戴尔UP3218K(7680×4320@60Hz)

操作系统:Windows 11 Pro 21H2

显卡驱动:NVIDIA Game Ready Driver 527.62

                AMD Software Adrenalin Edition 22.12.2

Image

▲七彩虹战斧RTX 4070 Ti的频率设置为2310MHz~2715MHz,略微比公版参考标准高一点。

3DMark理论3D性能测试

Image

Image

Image

相对于前一代的旗舰产品RTX 3090 Ti,战斧RTX 4070 Ti在非光追环境下的FireStrike三项和TimeSpy两项测试中基本与前者持平,总差距在1%以内。在光追性能的Port Royal及SpeedWay测试中则小有优势,性能领先约3%。

相对于竞争对手RX 7900 XT来说,战斧RTX 4070 Ti的理论性能皆有不同程度的落后,不过在SpeedWay光追性能测试部分胜过了RX 7900 XT。

而相对于“大哥”RTX 4080来看,RTX 4070 Ti在性能上仍然落后20%,与硬件规格配置的差距基本相符。相对于上一代的典型高端显卡RTX 3080 Ti,RTX 4070 Ti则全面领先,整体理论性能领先约15%左右。

光栅游戏性能测试

Image

Image

Image

Image

在4K非光追环境下,受限于自身的硬件规格所致,RTX 4070 Ti的游戏性能相比大哥RTX 4080 落后约为20%左右。相对于前一代的旗舰RTX 3090 Ti,4K光栅游戏上二者互有胜负,整体综合来看RTX 4070 Ti略小负于RTX 3090 Ti,不过差距在5%以内。在不开启DLSS的情况下,RTX 4070 Ti相比RX 7900 XT的4K光栅游戏游戏性能落后约在10%左右,不过开启DLSS 2之后就能够全面超越RX 7900 XT。而相对于RTX 3080 Ti,RTX 4070 Ti在4K光栅环境下的性能大多数游戏中则都有不同程度的领先,不过幅度不大,约为5%左右。

Image

Image

Image

Image

在1440p分辨率下的测试情况与4K环境相差不大,不过RTX 4070 Ti与RTX 4080之间的性能差距缩小到了15%左右,而在1440p非光追环境下,RTX 4070 Ti的性能也基本与RTX 3090 Ti持平,胜负在1%之内。同时与RX 7900 XT强势的光栅化游戏相比,在1440p分辨率下RTX 4070 Ti也努力迎头赶上,与RX 7900 XT的光栅游戏性能差距缩小到了5%左右。

光追游戏测试

Image

Image

Image

Image

Image

Image

在光追环境下,得益于Ada Lovelace架构的第三代光追核心与算法优化,RTX 4070 Ti的4K光追游戏性能相比前一代旗舰RTX 3090 Ti有近10%的性能提升。而且在DLSS开启的情况下,RTX 4070 Ti已经能够在绝大部分游戏中保持60fps+的流畅游戏帧率。

对比竞争对手RX 7900 XT来看,在都不开启DLSS或FSR的情况下,除了在《尘埃5》游戏中RTX 4070 Ti显得比较弱势之外,在其余的光追游戏中RTX 4070 Ti都几乎完胜RX 7900 XT,整体平均领先幅度达到了15%左右。而相对于大哥RTX 4080来说,RTX 4070 Ti的4K光追性能落后程度仍然在20%左右。

Image

Image

Image

Image

Image

Image

在1440p分辨率下,RTX 4070 Ti的游戏性能表现更上一层楼,和RTX 3090 Ti相比,在绝大部分游戏中都明显胜出,平均领先幅度约为10%。在1440p分辨率下,RTX 4070 Ti相互对于RX 7900 XT的光追性能领先更为明显,达到了25%左右。而相对于RTX 4080来说,在1440p分辨率下由于对显存的需求明显下降,RTX 4070 Ti和RTX 4080的性能差距也缩小到了12%左右。

DLSS 3,RTX 4070 Ti性能更上一层楼

如果说DLSS 2让NVIDIA显卡进入了“神之领域”的话,那么我们认为DLSS 3则完全让RTX 40系显卡进入了“超神”的境界。在RTX 4090和RTX 4080的首发评测时,我们已经测试过DLSS 3对RTX 4080、RTX 4090带来的巨大游戏性能增幅,那么在RTX 4070 Ti身上,有了DLSS 3的辅助,它又能迸发出怎样的性能表现呢?

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

▲DLSS 2/3性能对比汇总

首先来看RTX 4070 Ti在DLSS 2和DLSS 3下分别有怎样的性能表现。在基于七彩虹战斧RTX 4070 Ti的测试平台上,我们选择了11款支持NVIDIA DLSS 3的游戏进行了详细测试。最后可以很清晰地看到,在全部11款测试游戏中,4K分辨率下DLSS 2相对于原生游戏帧率的提升幅度在60%~400%之间,而开启DLSS 3之后,相同分辨率下相对于原生游戏帧率的提升幅度则达到了120%~700%,这也就意味着DLSS 3相对于DLSS 2在帧率的提升性能上又巨大的进步,而实际游戏测试中也显示在4K和1440p分辨率下,DLSS 3相对于DLSS 2有30%~100%不等的性能提升,十分可观。比如在《传送门:RTX版》游戏中,4K分辨率下关闭DLSS时游戏帧率仅能达到12fps,即使DLSS 2,游戏帧率也只能在30fps左右徘徊,但开启DLSS 3之后,游戏帧率能飙升到52fps的基本流畅程度。同样,在1440p分辨率下也是同样如此,DLSS 3相对于DLSS 2同样有30%~80%的性能增幅,很多在RTX 4070 Ti平台上于这一分辨率并不流畅的游戏,开启DLSS 3之后也能轻松达到60fps+的水准,如《Unity:Enemies》等。而对于大多数支持DLSS 3的游戏来说,我们可以发现在DLSS 3的支持下,即使在最高光追效果和最高画质的设置下,RTX 4070 Ti也能达到120fps+的绝对流畅高水平,可见DLSS 3可以说是为RTX 4070 Ti又插上了一双狂飙的飞翔翅膀。

Image

Image

Image

Image

Image

Image

前面我们测试显示在同样的DLSS 2设置下,光追游戏中RTX 4070 Ti相对于RTX 3090 Ti的性能领先约在10%左右。那么在开启DLSS 3的状态下,RTX 4070 Ti相对于RTX 3090 Ti的性能会不会迎来新的突飞猛进?在开启DLSS 3之后,可以看到RTX 4070 Ti相对于仅能开启DLSS 2的RTX 3090 Ti确实有了迅猛的性能上涨。在全部11款参测游戏中,无论是在4K分辨率还是在1440p分辨率下,RTX 4070 Ti开启DLSS 3之后的性能相对于DLSS 2模式下的RTX 3090 Ti有15%~120%的性能增幅,全部游戏的平均性能对比增幅也超过了50%。相对于同在DLSS 2模式下,二者的光追游戏性能10%左右的差距,DLSS 3确实为RTX 4070 Ti带来了巨幅的性能增长,也将其与仅支持DLSS 2的RTX 3090 Ti进一步拉开了性能上的差距。

DLSS 3 Vs. FSR,帧率、画质双赢

在前面的测试中我们针对不开启DLSS/FSR的情况下对比了RTX 4070 Ti和RX 7900 XT的光栅、光追游戏性能,结果发现它们“各打了半场好球”,在光栅游戏部分RTX 4070 Ti落后RX 7900 XT约10%(4K)、5%(1440p),而在光追游戏部分,RTX 4070 Ti则反超竞争对手约15%(4K)和25%(1440p)。虽然RTX 4070 Ti有DLSS 3的支持,但RX 7900 XT也支持AMD自家的FSR,那么在开启这两个游戏帧率提升技术之后,RTX 4070 Ti和RX 7900 XT各自表现又会如何?

Image

Image

我们选择了两款同时支持DLSS 3和FSR 技术的游戏《赛博朋克2077》(FSR 2.1)和《生死轮回》(FSR 1.0)在4K和1440p分辨率下进行了测试。最后的测试结果也基本在意料之中,开启FSR 2.1之后,在《赛博朋克2077》游戏中,4K分辨率下RX 7900 XT的游戏帧率从18fps提升到了44fps,提升幅度约为150%,在1440p分辨率下的提升幅度约为100%。而RTX 4070 Ti在开启DLSS 3之后,游戏帧率从23fps提升到了76fps,提升幅度达到200%以上,在1440p分辨率下的帧率提升幅度也达到了200%左右。《生死轮回》游戏中的测试结果同样如此。

测试结果很明显地指出了DLSS 3技术相对于目前的FSR确实在帧率提升性能上将后者远远地抛下了,只能期待AMD FSR 3.0能与DLSS 3掰一下手腕吧!

那么在帧率有了极大幅度的提升之后,DLSS 3相对于画质大幅度改进后的AMD FSR 2.1在画质上是否会有较大的损失?我们也在两款同时支持DLSS 3和FSR 2.1的游戏《赛博朋克2077》和《毁灭全人类2:重新探测》实际游戏中进行了对比。在这个部分,我们在同一游戏场景下截取了DLSS 3及FSR 2.1各不同模式下的画面,并在NVIDIA iCAT软件中进行了细致的对比。

Image

▲从左到右依次为4K原生画质、DLSS 3质量模式、DLSS 3平衡模式和DLSS 3超级性能模式

首先来看DLSS 3的情况。在《毁灭全人类2:重新探测》的游戏截图下,通过NVIDIA iCAT软件可以非常清楚地看到,DLSS 3下的各模式并未对游戏画质带来明显的影响,甚至开启DLSS 3之后,游戏画质还有一定程度的优化,更加清晰一些。即使在超级性能模式下,游戏画面也依然在放大200%后清晰可见,没有模糊的感觉。

Image

▲从左到右依次为原生4K画质、FSR 2.1质量模式、FSR 2.1平衡模式和FSR 2.1超级性能模式。

很明显,从iCAT的对比分析图中可以清晰看到,随着FSR 2.1模式从质量到超级性能的变化,游戏画质逐渐降低,画面逐渐变得模糊。尤其是在超级性能模式下,游戏画面已经比较模糊,严重影响到了字体的识别。

Image

▲从左到右依次为FSR 2.1性能模式(4K)、4K原生画质和DLSS 3性能模式(4K)。

再来看看在《赛博朋克2077》游戏中的实际表现。从iCAT的对比分析图中也可以非常直观地看到,开启DLSS 3的性能模式之后基本对游戏画质没有带来明显影响,游戏画质表现与原生画质相差无几。而开启FSR 2.1的性能模式之后,虽然帧率有较大幅度提升,但对游戏画质的影响也是立竿见影,远处广告牌上的字迹已经显得模糊不清,灯箱上的动物图标也变得模糊不堪。

所以,可以看出,DLSS 3的开启并不会对游戏画质带来实质性的影响,甚至在一些场合下还对游戏画质有优化作用。而FSR 2.1虽然在帧率提升方面也卓有成效,但在游戏画质上却有比较大的损失,这一点上和DLSS 3相比相去甚远。所以对于RTX 40系显卡的用户来说,在支持DLSS的游戏中,根本不需要犹豫和考虑,打开玩就完事儿了!而RTX 4070 Ti凭借DLSS 3,可以说进一步拉大了与RTX 3090 Ti和RX 7900 XT的距离。

Reflex助阵战场驰骋,PCL延迟测试

NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延迟技术,能够极大地改善游戏体验的流畅性,尤其是对FPS游戏来说更是意义重大,毕竟更低的延迟也就意味了更快速的反应操作。另外随着FrameView 1.4版本的更新,现在FrameView已经能够在支持的游戏中监测、记录游戏的PCL系统延迟时间与1%L fps低帧,这两个指标都是关系到游戏流畅与否的主要因素。

在RTX 4070 Ti的平台上,开启DLSS 3之后,游戏延迟是否能得到有效降低?1%L fps有没有明显的改善?

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

Image

在这个部分的测试中,我们一共选取了六款支持DLSS 3的游戏进行了全面的测试。而从测试结果来看也基本与我们此前测试RTX 4080和RTX 4090时相符。DLSS 3不只是在帧率表现上相对于Native原生帧率有100%~400%的提升,而且在1%L fps和PCL系统延迟上也有惊艳的表现。比如在1440p分辨率设置的《赛博朋克2077》游戏中,在DLSS关闭的情况下游戏帧率虽然能达到50fps左右,但游戏的1%L fps仅为37fps左右,说明游戏仍然会时不时产生卡顿的情况,而且PCL系统延迟在DLSS关闭时也高达63ms。在开启DLSS 3平衡模式之后,游戏帧率飙升到立刻150fps左右,达到了绝对流畅水准。同时1%L fps也提升到了104fps,说明已经不会在任何情况下影响到游戏的流畅运行。另一方面系统延迟也在开启DLSS 3之后从63ms下降到了34ms,让游戏更加丝滑顺畅,能有效提升游戏体验。在其余几款测试游戏中,包含了NVIDIA Reflex技术的DLSS 3也有着同样的表现,比如在《光明记忆:无限》测试中,开启DLSS 3之后游戏帧率从57fps飙升到169fps,同时在Reflex的作用下系统延迟也从78ms降低到了39ms左右,效果十分明显。

设计创作性能,小胜RTX 3090 Ti

Image

Image

Image

Image

在设计创作能力测试部分,我们选择了Davinci Resolve 18、Blender opendata benchmark、Blender 3.4以及V-Ray Benchmark等数款软件进行了视频编解码和模型渲染方面的测试。从全部的测试结果可以看出,在视频编解码的性能上,尽管RTX 3090 Ti的纸面硬件规格更高,但在实际应用中还是以10%左右的性能劣势不及RTX 4070 Ti,毕竟还是RTX 4070 Ti下一代的双NVENC编解码更胜一筹。而在模型渲染输出部分,无论是V-Ray Benchmark还是Blender模型渲染,综合成绩上RTX 4070 Ti相比RTX 3090 Ti仍有15%左右的性能领先。由于V-Ray Benchmark不支持AMD Radeon RX 7000系GPU的CUDA和RTX模式渲染,而Blender 3.4目前也尚未提供对RX 7000系显卡HIP硬件加速模式的支持,因此我们只能在Bledner Opendata Benchmark中将RX 7900 XT与RTX 4070 Ti做了对比。在这一测试中,RTX 4070 Ti表现出了相对于RX 7900 XT 2~2.5倍的性能,可以说是实力碾压RX 7900 XT。而相对于RTX 4080,RTX 4070 Ti仍然与前者有25%~30%的性能差距。

能耗比谁为王?

最后让我们来看看RTX 4070 Ti在能耗比上的表现。众所周知,厂商的TGP是对显卡给出了一个功耗的上限,但在实际应用场景中,不同的显卡却有不同的表现,比如4K游戏状态、1440p游戏状态、视频编辑处理状态,3D建模渲染状态等等,都有不同的功耗表现。那么对于RTX 4070 Ti来说,其在各种不同应用场合下的功耗表现又会怎样呢?我们用NVIDIA PCAT 2.0功耗测试仪针对不同应用场景测试了七彩虹战斧RTX 4070 Ti、RTX 3090 Ti FE以及Radeon RX 7900 XT的功耗。

Image

Image

Image

首先来看三个典型的应用场合,3DMark TimeSpy Extreme测试代表4K光栅游戏极限设置、3DMark Port Royal和《赛博朋克2077》4K光追设置下的游戏场景代表着光追游戏的极限应用场景,从这三个场景的测试情况来看,RTX 4070 Ti在这三个场景下的实际功耗基本相同,都在250W左右,与TGP的285W还有一定距离。而作为对比测试的AMD Radeon RX 7900 XT在这三个游戏应用中的功耗则达到了330W左右,而上一代的旗舰RTX 3090 Ti更是达到了430W的“高水平”。

Image

Image

接下来看Davinci Resolve的视频编解码测试,在进行8K源视频转H.265 MP4视频的过程中,RTX 4070 Ti的整体平均功耗仅为70W,远低于TGP的285W。而RX 7900 XT和RTX 3090 Ti在同一应用中的功耗分别为118W和137W。

再来看下Blender Opendata Benchmark,这代表的是进行模型渲染类设计创作工作时的GPU功耗表现。在测试中,可以看到RTX 4070 Ti的整体平均功耗约为175W,而RX 7900 XT约为273W,而RTX 3090 Ti则达到了307W。

Image

▲功耗测试结果汇总给

将RTX 4070 Ti及对比显卡在不同应用下的实际功耗与在该应用中的得分结合起来,做成表格的话,我们能发现一些很有意思的东西。

Image

从测试中我们可以得出几个结论:第一是RX 7900 XT在大部分测试中都表现出了相对于315W TGP设计高得多的能耗,而RTX 4070 Ti则在除了Furmark烤机之外的所有场合下都表现得更为“节能”——基本都远低于285W的TGP数值。

第二,从我们统计的功耗与应用测试得分情况来看,RTX 4070 Ti在每瓦游戏性能和每瓦设计创作性能都遥遥领先于RX 7900 XT,哪怕是在RX 7900 XT表现强势的3DMark TimeSpy Extreme的测试中也是如此。尤其是在设计设计创作性能相关的3D渲染测试中,RTX 4070 Ti表现出来的每瓦参考性能几乎达到了RX 7900 XT的4倍之多。

第三,相对于前一代的旗舰RTX 3090 Ti来说,在每瓦参考性能方面RTX 4070 Ti也是遥遥领先,基本都达到了50%甚至更高。更强的性能,几乎只有一半甚至更低的功耗,很明显,更先进的Ada Lovelace架构在其中居功至伟。

最后说说散热的情况。七彩虹战斧RTX 4070 Ti豪华版这张显卡的散热设计还是比较不错的,在待机状态下GPU核心温度为32℃,在满载情况下的温度也不过达到64℃,散热表现还是尚算合格。

综合性能比RX 7900 XT更出色,1440p光追游戏好选择

在文章的最后,让我们先来对今天的测试结果做一个小结:

1.性能方面,RTX 4070 Ti在光栅游戏性能上基本与RTX 3090 Ti持平,差距极其微小。与竞争对手RX 7900 XT相比,光栅游戏性能方面有一定劣势,落后程度在5%(1440p)到10%(4K)之间。

2.在光追游戏方面,RTX 4070 Ti逆袭RX 7900 XT,整体光追游戏性能领先RX 7900 XT约15%~25%。即使相对于前一代的旗舰产品RTX 3090 Ti而言,在光追游戏性能上RTX 4070 Ti也领先大约10%。

3.DLSS 3黑科技的加持让RTX 4070 Ti面对RTX 3090 Ti和RX 7900 XT占据了更高的竞争位置,在DLSS 3的辅助下,RTX 4070 Ti的在DLSS支持的游戏中性能再度提升了50%甚至更高,与RTX 3090 Ti和RX 7900 XT拉开了更大的距离。

4.Ada Lovelace架构在设计创作方面的效率更高,在实际测试中RTX 4070 Ti设计创作性能相比RTX 3090 Ti领先约10%。相对于RX 7900 XT来说,RTX 4070 Ti在3D渲染输出部分的性能领先100%或更高,在视频转码方面的性能基本持平。

5.Ada Lovelace架构带来的优秀的能耗比是RTX 4070 Ti另外一个巨大的加分项目,在几乎所有的高负荷应用中,RTX 4070 Ti都能在获取优秀执行效率和强悍性能表现的同时,保持远低于285W TGP的功耗数值,而RX 7900 XT在绝大多数高负荷应用下的功耗都达到了330W以上,已经远超出了AMD标称的315W功耗。就能耗比而言,RTX 4070 Ti可以说是远胜RX 7900 XT。

所以,从整体综合性能来看,毫无疑问GeForce RTX 4070 Ti已经具备了比前一代旗舰RTX 3090 Ti更强的综合性能表现。得益于NVIDIA Ada Lovelace架构创新和NVIDIA DLSS 3,全新GeForce RTX 4070 Ti GPU性能最高可达GeForce RTX 3090 Ti的3倍,而功耗几乎只有其一半。而相对于竞争对手RX 7900 XT来说,尽管光栅游戏上略有劣势,但光追性能的强势表现已足以弥补这一缺憾,再结合DLSS 3的黑科技加持与非常优秀的能耗比,整体评价上我们认为RTX 4070 Ti是比RX 7900 XT更好一点的选择。尤其是在针对1440p的游戏市场方面,RTX 4070 Ti在DLSS的支持下,已经能够在最高光追效果下以120fps+的帧率完美运行绝大部分光追游戏,如果算上DLSS 3的额外加成,150fps+的1440p光追游戏也能轻松达成。另外需要特别强调的是,这一次的RTX 40790 Ti首发上市价格为6499元而不是一直传闻的7499元,这个价格相比目前大多在7500元以上的RX 7900 XT来说,综合性价比无疑更好一些。而且据小道消息称,NVIDIA已经对AIC厂商和各渠道做了一些限制,因此虽然大多数非公版产品肯定会比6499元的首发指导价高一些,但最终的市场价格应该不会溢价太高,而且大概率每家AIC厂商都有6499元首发价格的产品上市。追逐高帧率1440p光追游戏的玩家,可以下手了!在这个价位段上的高端显卡,RTX 4070 Ti就是目前最好的选择,没有之一。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多