分享

赶在GeForce RTX 4090发布之前,聊聊评测新思路

 爱极物 2022-09-14 发布于上海

随着NVIDIA GeForce Beyond特别活动预告发布,让男孩子哭泣的GeForce RTX系列很快就会迎来全新RTX 4000系列,而GeForce RTX 4090或RTX 4080旗舰款显卡将会成为首发产品。

按照惯例,爱极物也会成为首测新显卡测试会在正式发布后一个月展开,围绕架构分析、性能测试和游戏实际体验与对比进行。特别是随着Reflex、DLSS等诸多新技术的引入,单一的帧率对比可能已经无法展现显卡性能的全貌。因此许多评测媒体会选择视频帧率对比的形式,让观众通过帧率的动态变化来体验两张显卡之间不同的差别。

这样的做法虽然展现形式更为直观,但实际上需要花费更多的阅读时间去直观感受显卡之间的性能差别。那么有没有一种一图流,能够直观的体现游戏性能变化趋势呢?这一次不妨让我们讨论一个新的可行性。

1% Low FPS

我们现在判断游戏体验的时候,往往会在围绕游戏帧率的基础上,还会展开对游戏帧率连贯性、操控响应延迟的探讨。其中游戏帧率最为直观,与动画原理类似,在一秒内GPU能够完成的游戏画面越多,游戏表现越流畅,这也是当下衡量游戏流畅性最主要的标准。

当进行多个GPU对比的时候,每一个GPU的帧率表现会取一个平均值,进行类似这样的图表对比。

表面上看GPU A由于GPU B,但实际上不能反馈GPU整个过程表现的细节,比如前一秒帧率高达129FPS,后一秒帧率为1FPS,那么平均帧率也有65FPS,从参数对比上看优于GPU A,但实际体验未必,这也是许多玩家笑称一些游戏帧率评测图表一分钟可以做一百张,无说服力。

因此,为了展现出GPU性能更多细节,就会选择绘制一段游戏演示过程的曲线,比如说下图。通过曲线可以辨别出GPU在实际运行过程中帧率的波动情况。

这样的对比很难看出孰优孰劣

通过冗长的曲线展现游戏帧率需要大家花费大量的时间研究帧率曲线的波动情况,这与清晰明了展示性能的初衷背道而驰。这时候我们就可以引入1% Low FPS的概念。

1% Low FPS是指在一整断测试中,那1%的最低帧率,用来体现游戏帧率的最低门槛。举个例子,在一整段游戏测试中,游戏平均帧率为65FPS,一共测试了100秒,1% Low FPS为50FPS,即是指这段测试中最低的那1秒的帧率为50FPS。如果测试了200秒,那么1% Low FPS代表有其中2秒的最低值的平均帧率为50FPS。

1% Low FPS能够以更客观的角度展现GPU在游戏中体验的顺滑程度,1% Low FPS距离平均值越近,也意味着游戏体验过程越顺滑,现在不用去看复杂的帧率曲线了。

1% Low FPS的概念其实有点类似Fraps或者MSI Afterburner上99% FPS的概念。这种探究芯片性能稳定的方式在行业基准测试中其实更为常见。比如为了探究产品的稳定性,SSD会引入QoS(Quality of Service)服务质量作为参考值,即指在规定的时间内,以稳定一致的性能完成所有请求的能力。并引入99%和99.999%的最大响应时间。可以看到行业产品对稳定性的诉求会被严苛要求到0.001%的最低偏差容忍程度,消费级产品与企业、工业级产品的差别就在于此。

但游戏GPU一般而言更注重性价比,因此1% Low FPS所展现出的稳定性其实已经足够。如果还不满足,玩家则可能需要考虑更高端的显卡。比如《英雄联盟》职业联赛普遍会使用GeForce RTX 3080以上搭配Core i9的配置,不是因为低端配置带不动,而是尽可能提高电竞主机的性能下限,确保不影响选手的稳定发挥。

多考虑系统延迟

加入1% Low FPS的参考其实还不够,有条件的话应该考虑引入系统延迟。

原因是当你按下鼠标或者键盘,再到显示器上做出反应,是一个十分复杂的过程。鼠标输入的指令会先到达CPU,然后进入渲染队列,再由GPU处理最终在显示器执行显示,每一个步骤都存在延迟。

玩家们最为熟悉的游戏帧数FPS与较低的系统延迟有关,但是这种关系并非永远对等。事实上在无法有效简单表达游戏响应的前提下,通过FPS每秒帧数来表达游戏画面的吞吐率,也较为方便更多人理解。而真正能表现出游戏响应速度,正式前面提到的系统延迟。

举个栗子。如果我们拥有一台可以每秒渲染1000FPS的PC,但是接入了一个长长长长长的流程,要1秒钟才能到达显示器,这个时候我们有效击中对手的概率将会十分低下。

例如游戏引擎与渲染器上的最终GPU工作之间,实际上有数个待处理的帧正在排队,从而造成了延迟,这时候可能是GPU处理帧的速度赶不上CPU提交渲染请求的速度,这样就造成了CPU的反压。因此适当的丢掉一些无效的渲染请求就可以优化延迟。

同样,在受CPU限制下,GPU也必须等待CPU的指令,造成GPU的资源浪费。此时GPU通常会降频以节省电力。而在CPU负载得到缓解的情况下,GPU再提频,此时也会造成少许的延迟。Reflex可以强制GPU一直运行在高频率下,以确保延迟的最低化。

降低系统响应时间的方式有很多,比如早年的Ultra Low Latency Mode极限低延迟模式,再到现今主打的Reflex技术。通过一系列对CPU与GPU之间的平衡,有效的降低输入延迟和采样,最终实现系统延迟降低。

更低的延迟无疑是提高反应速度和流畅体验的关键,如果在图表中加入对延迟的描述,无疑可以让游戏性能展现会更为直接。

特别是引入不同GPU在相同的图像质量下进行对比,效果更为高下立判。

新软件与新技术

应对新一轮游戏技术升级,NVIDIA其实也同步推出了一波测试软硬件,其中就包括FrameView 1.3版本和LDAT V2测试硬件,还有ICAT影像抓取分析工具,并且Reflex技术也升级到了1.6版本。

FrameView得益于能够准确的读取GPU中的数据,并且更节省性能,已经成为NVIDIA甚至AMD GPU实际游戏测试中常用的检测工具。1.3版本的FrameView有几个特性:


简单易用的延迟基准测试

       无需鼠标点击

       无需特别硬件

无需指定鼠标或者显示器

与FPS同步测试

支持所有GPU生厂商,包括竞争对手

按帧测试

需要PC延迟数据的标识

        支持Reflex 1.6 SDK开发的游戏

PC延迟可以直接在GeForce Experience体现

简单的说FrameView 1.3已经可以通过软件替代早期的LDAT硬件检测方式,并且也植入到了最新版本的GeForce Experience中,即使不去专门下载FrameView 1.3,也能在GeForce Experience的性能监测中查看当前的系统延迟状况。

换而言之,FrameView现在已经可以做到一套高效的数据统计收集,实时功耗与性能报告,并且可自定义叠加显示层,配合后期的Excel分析模板和日志文件,能够更快的获得所需的数据。

当然如果搭配测试硬件检测仍然是最理想的。NVIDIA将LDAT升级到了V2版本,特性包括:

新的LDAT硬件

    更高精度的传感器

    LDAT自带LCD显示屏

支持鼠标点击延迟单独测试

支持显示延迟测试

GtG响应时间测试

更轻松的固件升级

NVIDIA LDAT V2硬件检测器主要还是提供给硬件检测人员和一部分专业媒体,如果未来有机会,我们也会奉上基于LDAT V2的游戏响应测试。

在游戏端,降低游戏系统响应的Reflex 1.6也已经开始实装。这项技术需要游戏创作团队通过Reflex SDK植入到游戏中,搭配NVIDIA GPU获得更快的系统响应。目前为止TOP 10竞技射击类游戏已经对Reflex 1.6提供了支持。同时部分国产游戏也率先响应了Reflex 1.6新技术升级。

最后用于影像抓取分析的ICAT也再度升级。由于DLSS、XeSS、FSR等超采样技术运用到更多游戏中,如何分辨出不同超采样技术之间的优劣,无疑放在一起对比是最理想的。ICAT的特点是兼容所有GPU录制的画面,它的工作是将分别录制的的画面同屏显示,支持横向对比和实时放大缩小,并且追加了视频动态演示,是画质数毛党的最爱。

为了获得更好的展示效果,ICAT现在也提供了单独的网页输出功能。如果视频和截图都不能说服你,那么完全可以使用ICAT将录制的素材打包成一个独立的网页,供大家在线浏览或者下载,更直观的感受不同超采样技术之间的优化差距。

挖掘基准的更多可能性

随着GeForce RTX 40系列发布时间越来越近,我们将花费更多的时间和精力关注新GPU与新技术对游戏实际体验带来的提升,利用更简单直观的展现形式表达出GPU实际表现,无疑给后续的购买决策增添不少信心。

无论硬件爱好者还是游戏玩家,也很快从基准测试方式中受益,通过一张对比图表,一个ICAT对比视频,就能直观感受到性能和技术带来的优势,显然也花费了工程师们不少心血。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章