分享

Anthem DLSS帧率评测:有了人工智能,RTX2060可以4K战GTX1080Ti了

 科技行者 2020-10-12

科技行者

《圣歌(Anthem)》是由BioWare制作,EA发行的一款融合RPG叙事风格+大型多人在线的网络游戏。在游戏中,玩家可穿着机甲上天下海,在海陆空自由的冒险探索。玩家执行关卡任务,之后与其他玩家在巨大的的开放世界中打怪。游戏中有一个单人区域的主城,在这里,玩家领取并完成主线任务,并且可以在主城的熔炉处定制自己的酷炫机甲。

3月26日,圣歌1.4更新了对NVIDIA DLSS技术的支持,官网建议系统配置如下

我用手头的 RTX 2080Ti、 RTX 2060、 GTX 1080Ti 和 GTX 1080 四块公版显卡测试了圣歌1.4在不同软硬件配置下帧率性能。实测结果显示,4K分辨率极高画质下,只有RTX 2080Ti在DLSS技术加速下才能达到60帧以上的流畅运行水平。10系显卡的两款旗舰型号1080和1080Ti的游戏分别达到30帧和40帧。而RTX 2060的4K游戏性能表现出色,常规渲染配置下帧率接近30,而开启DLSS后帧率骤升到接近40,从1080提升到了1080Ti的流畅度。且开启DLSS后,普通人眼很难辨识出画面缺陷。

根据英伟达官方网站公布的测试数据,在默频i9-9900K的测试平台上,开启DLSS后,RTX2080Ti和RTX2060的帧率分别提升了34.9%和39.4%。经过近期的驱动和软件版本优化升级,测试中的帧率数值在这个基础上已经又有提升。

>>>DLSS技术介绍

DLSS是什么

深度学习超级采样Deep Learning Super Sampling(DLSS)是一种NVIDIA RTX技术,它利用人工智能的强大功能,在图形密集型负载(比如开启光线追踪)的游戏中提高帧率。使用DLSS,玩家可以使用更高的分辨率和设置,同时仍然保持稳定的帧率。

在没有DLSS支持的情况下,显卡需要用数学家发明的公式进行大量计算才能得到让人满意的反锯齿结果,等算完这些结果游戏可能已经卡成U·ェ·*U了。DLSS技术就是让显卡,拿着不完美的图像输入,输入到DLSS处理单元,根据显卡驱动中提供的神经网络参数进行少量的简单运算,就可以高速“脑补”出完美的图像并输出到显示器,让用户享受到如丝般顺滑的高画质高分辨率游戏体验。

所以DLSS加速技术工作得好不好,就要取决于显卡上DLSS单元的处理能力和显卡驱动里神经网络参数的脑补能力。其中,关于DLSS硬件单元的处理能力,在本文的测试中会看到它带来的限制;关于DLSS神经网络参数的脑补能力,也有细节对比。

神奇的神经网络参数是怎么得到的

DLSS神经网络参数通过训练得到,训练过程分为两部分:反锯齿和插值修正。

第一步,NVIDIA的DLSS团队首先从目标游戏或者目标游戏类型中提取许多锯齿走样帧(aliased frame),然后对每个走样帧使用超级采样(super-sampling)或累积渲染(accumulation rendering)生成对应的“完美帧”,之后把这些完美帧输入到NVIDIA的超级计算机用于训练。超级计算机训练DLSS模型识别这些锯齿走样的输入帧,并尽可能生成和“完美帧”接近的的高质量反锯齿图像。到这里,神经网络参数就已经掌握AA级别的反锯齿能力了。

第二步,继续重复训练DLSS模型,使模型生成额外的像素,用于提高输入图像的分辨率。这两步技术的结合使GPU能够以更高的帧速率显示画面。到这里,训练出的神经网络参数就可以放在NVIDIA驱动里发布给玩家用来畅玩圣歌了。

NVIDIA在超级计算机上,给神经网络模型看大量通过反锯齿技术渲染到完美的图片,让它有快速生成完美反锯齿图片的能力。但是完美的反锯齿结果可能并不能让人满意,可能看着就不像正常图片。因为AA这技术本身就会导致高动态重影和闪烁这类问题。于是NVIDIA再给神经网络模型看大量高分辨率的图片,让它学会快速生成正常高分辨率图片的能力。

DLSS总能提高帧率么,为什么游戏里1080p分辨率下不能开DLSS

DLSS的设计是为了在高GPU工作负载(也就是帧率很低,GPU累冒烟了也还是有点卡的时候)下提高帧率。。如果游戏已经运行在高帧率,那GPU的帧渲染时间可能比DLSS执行时间还短。在这种情况下,NVIDIA就不建议用DLSS了,因为这时候开DLSS也提高不了帧率,反而还降。通常来说,帧率小于60的时候,DLSS带来的性能提升最明显。

当前能DLSS的游戏,用低端RTX运行在1080p分辨率下都已经很流畅了,开了DLSS以后又降帧率又降画质,所以软硬件厂商禁止开启。

>>>测试平台介绍

>>>3D Mark基准测试

DirectX测试

3DMark基准测试是一个验明正身的环节,同时也可以了解一下NVIDIA的软件优化方向。

从显卡测试分数结果看,RTX 2080Ti > GTX 1080Ti > GTX 1080 ≈ RTX 2060,在各个子项目中也体现了相同的趋势。

在测试DirectX 11性能的FireStrike中,1080凭借更高的硬件规格,在高分辨率测试中分数超出RTX 2060 10%以上;在测试DirectX 12性能的TimeSpy中,经过软件优化,RTX2060可以打平GTX1080甚至小胜。

光追和DLSS测试

在不开启DLSS的光追测试项目2K分辨率PortRoyal中,清晰呈现RTX 2080Ti >> GTX 1080Ti > GTX 1080 > RTX 2060的趋势。GTX旗舰1080Ti也只能达到10帧。1080Ti、1080和2060的Shader数比率为3584 : 2560 : 1920,这一比率也基本对应地体现在了RayTrace的计算性能上。PortRoyal测试中比较奇怪的现象是,在2K测试中,RTX 2060的30个光线追踪RT core好像并没有发挥作用,导致帧率只有4帧多一点。

在开启DLSS的对比测试中,两块RTX显卡在开启DLSS后都有35%以上的提升。尤其是对于2K分辨率下的RTX 2060,DLSS直接化腐朽为神奇,把PPT效果的PortRoyal提升到了26.06这种“不卡”的及格帧率。

>>>圣歌游戏帧率测试

测试介绍

本次测试采用了两个测试场景:

第一幕 狂怒之心,从主角出场开始,到跑到广场进入下一关。期间经历岩浆河,爆炸场景,开枪射击,野怪攻击,Boss特效攻击等场景,测试时长两分半左右。

第二幕 激活继电器,从主角在基地飞行出发开始,接连激活四个继电器,之后下水飞进山洞结束。期间经历多个场景加载和快速转换,山谷飞行,野怪攻击,开枪射击,水下飞行等场景,测试时长四分半左右。

另外还测试了一次4K分辨率下RTX 2080Ti运行第三幕情节,时长20分钟,主要为了验证长时间玩耍的帧率是否和第一幕第二幕的短时测试一致。结果证明上述两个测试场景可以代表长时间运行游戏时的帧率性能。

两个测试场景下各分辨率平均帧率(DLSS OFF)

在不开启DLSS的情况下RTX 2080Ti > GTX 1080Ti > GTX 1080 > RTX 2060。

对于1080P分辨率,每秒105帧左右的帧率是当前版本游戏的上限,也就是满分。GTX 1080Ti和RTX 2080Ti都能达到这一帧率。从各分辨率帧率增长的相对比率来看,1080Ti达到105帧已经比较尽力了,2080Ti达到105帧是因为满分就是105帧。

两个测试场景虽然色调和情节不同,但是各分辨率下,这两个场景的帧率基本相同。

对于1080P这种笔记本平台的分辨率,显卡性能达到GTX 1080性能,可以90帧流畅运行圣歌1.4,而这一帧率已经比较接近满分105帧每秒了。

DLSS助力RTX提升圣歌帧率

2K分辨率性能测试

如前面的分析,在2K分辨率下,RTX 2080Ti游戏运行过于流畅,以至于开启DLSS反倒性能下降,不建议开启DLSS。

对于RTX 2060,开启DLSS提升不多,开不开都可以。注意这里因为2K分辨率计算量相对较小,RTX 2060帧率从57帧只能提升到65帧。

2K分辨率下,被测的几块公版显卡都可以流畅运行。

4K分辨率性能测试


在4K分辨率下,两块RTX显卡开启DLSS后都能得到30%-35%左右的性能提升。且经过一个月的优化,游戏帧率相比3月26日刚发布DLSS时候都已经有不小的提升。

在不开启DLSS的时候,RTX 2060的圣歌游戏性能和GTX1080比差距已经很小了。

开启DLSS后,RTX 2060已经可以和GTX 1080Ti相比,估计再等两版驱动以后就可以赶上或者超过GTX 1080Ti了。

在4K这种负载较重的高分辨率下,在已经达到每秒57帧帧率的基础上,开启DLSS仍然可以大幅提升RTX 2080Ti的帧率。对于4K分辨率,建议开启RTX显卡的DLSS。

1% low framerate对比

1% low framerate这个代表了游戏过程中可能出现的卡顿情况,它的值越接近平均帧率越好。简单理解这个指标的含义就是:“玩游戏的过程中1%的可能会卡那么一下,当卡顿发生的时候就卡到这个U·ェ·*U帧率以下”。

把开启DLSS的RTX 2060单独列成一组结果和GTX进行对比,可以看到DLSS技术在提升平均帧率的同时,对应地也提升了1% low framerate。整体地提升了游戏流畅度。

>>>DLSS画质对比

▲六倍放大下的人物模型,上图DLSS on

在一些反光面的处理上,DLSS on后少了一些细节。

▲七倍放大下的水壶,左图DLSS on

除了反光面的差别外,继续放大观察主角背的水壶,注意右侧的那个壶,看上去蹭到哪里给碰脏了。在右图中,它脏得比较有细节;在左图中,开了DLSS之后,这个水壶看上去像是拿抹布沾点水擦了擦之后的感觉。

▲五倍放大下的山崖石雕,左侧DLSS on

右侧图中还是细节更多一些,在石雕下巴颏这里的阴影处,还能看到要表达的纹理,山崖上的树也更清晰;左侧图中,开了DLSS后,下巴颏和胳臂上的细节都给平滑掉了,山崖上的树也快看不到了。

▲狂怒之心 测试截图,上图DLSS on

在整个场景中,上面对比的三个细节完全不影响游戏的感受。图中山上的下巴颏纹理和小树杈,对情节发展和游戏体验都没什么影响。

▲六倍放大下的叶子,上图DLSS on

在六倍放大下,下面的叶子更水灵,如果这是蔬菜的话,这样的叶梗看着感觉更新鲜。上面的叶子在开了DLSS之后细节没了,看叶梗感觉菜已经有点蔫了,而且看反光好像还变油腻了。是不是有些塑料感?

▲六倍放大下的枯叶,上图DLSS on

下面的叶子能看到枯黄的纹理,更像真叶子,上面的DLSS后把纹理平滑掉了。

▲十倍放大下的叶子

从这个十倍对比图中,可以看到DLSS神经网络的“脑补反锯齿”能力很强。在下图的普通AA反锯齿中,即使是极高画质也能看到锯齿走样;而上图中开了DLSS之后,Tensor Core脑补出了照片级别的叶子边缘。然而注意左数第三片叶子,DLSS在反边缘锯齿的时候,把叶子中间的脉络也给模糊掉了。

▲六倍放大下的叶子

同样,下面的叶子看上去像素更高,塑料感更少。

▲激活继电器 测试截图

不看截图中的帧率的话,在4K显示器上都很难辨认出来这两幅图中哪一个开了DLSS。如果没有八倍镜的帮助,哥表示根本哔哔不出前面提到的四处细节差别。

>>>结论

通过测试可以看到:

在4K分辨率下,RTX 2060的基础渲染性能可以摸到GTX 1080的屁股;经DLSS加持,帧率已经逐渐接近GTX 1080Ti,经未来驱动优化极有可能赶上1080Ti;

在2K分辨率下,被测的各卡都可以达到55帧以上的流畅帧率。在这种流畅度下,DLSS提升很少。

在最新425.31版本驱动中,DLSS对4K圣歌画面的优化已经八分优秀,对于类似叶片边缘这种反锯齿的细节处理,已经接近理想水平。还差两分的原因是对边缘的识别还不太好,经常把画面里的细节当成边缘锯齿给平滑掉了。

在十倍放大的局部画面中,DLSS对细节的损伤也不是很明显,所以如果玩家没有开十倍镜逛地图的习惯的话,对于普通眼睛,DLSS相当于几乎无损地提升了帧率。至于对吃鸡类射击游戏玩家在十倍镜中水平的发挥,厂家应该会专门做出对应的DLSS优化。根据之前测试战地V中八倍镜98K的经验,感觉打偏的情况多数是因为我手残,和DLSS关系不大。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章