分享

AMDRDNA3架构被曝缺陷!白白浪费16%性能

 金刚光 2023-02-05 发布于辽宁
原创 硬件世界2022-12-13 23:52 

AMD、NVIDIA新一代显卡的大战正式开始了,首发评测大家也看了不少了,如果懒得看详细对比,CapFrameX软件的开发者整理了一份简单易懂的性能总结。

他选择了三家外网的评测结果,主要来自igorlab、PCGH及computerbase,对比了AMD及NVIDIA显卡的光栅游戏性能及光追游戏性能,以RTX 4090为100%基准。

在传统的光栅游戏性能中,RX 7900 XTX的性能大约是RTX 4090的75-81%,平均下来大约是78%的性能,RX 7900 XT则是66%的RTX 4090性能。

光追游戏中差别较大,RX 7900 XTX大约是RTX 4090的61%性能,RX 7900 XT是54%的平均性能。

如果只看性能的话,7999起步的RX 7900 XTX相对12999元的RTX 4090显卡,之前大家一直批老黄涨价没良心,现在来看RTX 4090性价比更高了。

当然,以上还只是性能上的对比,实际还有功耗、发热、DLSS/FSR等方面的指标要考虑,这么算下来的话,早先入手RTX 4090显卡的玩家并不亏。

另外,AMD终于放出了RX 7900系列显卡,但是根据我们快科技的实际测试,RX 7900 XTX虽然如愿战胜RTX 4080,但综合性能只是勉强领先,平均幅度不到5%,而且功耗高出不少,以至于测试中我们一度疑数据有误。

唯一的好消息就是,价格确实相对不高,RX 7900 XT、RX 7900 XTX分别做到了7399元、7999元原价起步。

其实,无论是从架构设计、规格参数还是官方宣传看,RX 7900 XTX的表现都不应该如此平平,那么问题出现在了哪里?是BIOS和驱动优化不到位吗?

资深硬件玩家0x22h提出了一个观点,认为RDNA3架构设计存在重大缺陷,那就是增加了SIMD32单元之后,却没有相应地提升寄存器规格,导致Wave32单元内的VOPD格式下的两个FMA指令只能同时使用一个源操作数寄存器(operand register)、一个共享的立即数(immediate value),Wave64下的情况也是类似。

这就导致RDNA3 GPU的内部计算资源紧张,实际发挥出来的峰值性能,只有理论值的5/6,换言之就是浪费了超过16%的理论性能。

另外,RDNA3架构引入了双发射概念,流处理器等效数量翻番,但看样子并没有发挥出应有的实力。

当然,以上观点都是猜测,尚无法得到AMD方面的证实。

其实,无论是NVIDIA Ada还是AMD RDNA3,这一代显卡架构的频率都非常高,而且依然有非常大的超频空间。

RX 7900系列刚刚发布,硬件玩家0x22h就尝试了对RX 7900 XT超频,使用液氮取得了不俗的成绩。

经过一番折腾,RX 7900 XT的着色器频率、前端频率分别超到了3.5GHz、3.7GHz,比默频高出足足1.2GHz。

整卡最大功耗来到400W,只比默认增加了45W,不算很多,而核心温度控制在62℃。

FP32双精度浮点性能高达75TFlops,比默频下提升了足足44%。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多