AMD首个40nm GPU诞生,主流显卡你选谁?

40nm先拔头筹,AMD RV740诞生:
不可否认,55nm制造工艺为AMD和NVIDIA两个显示核心巨头的产品,带来了明显的进步,功耗的降低、频率的提升都让其显卡产品充分的得到了优化。业内第一款采用55nm制造工艺的RV670来自AMD,2007年11月,首款采用55nm制造工艺的Radeon HD3800显卡就与大家见面了,而NVIDIA采用相同工艺的产品却在7个月以后才悄然问世。
在第一代DirectX 10 GPU R600问世后,低下的架构执行效率成为了困扰AMD的巨大阻碍,R600的失败,让AMD不得不面临着重新规划GPU产品的策略,于是从RV670开始,AMD在R600的基础上进行了充分的优化,让仅拥有256bit显存控制器的Radeon HD3800系列与Radeon HD2900的性能站在了相同的高度,并且利用“双芯合璧”的方式在顶级显卡市场与NVIDIA进行着对抗,而RV770则是更加肯定了AMD的新策略,Radeon HD4800系列夺回了不少市场,而这些成功的前提,与采用新显卡制造工艺是密不可分的,既然架构效率不及NVIDIA,那么只有领先的制造工艺才能用更低的成本去迎战强大的竞争对手,何况RV770的性能让NVIDIA也着实吓了一跳!

不断扩充的庞大显示核心架构对制造工艺的要求在不断提升,只有采用新的制造工艺,才能够在有限的面积内融入更多晶体管,从而使性能得到提升,并且将功耗控制在人们能够接受的范围里。在第一款55nm制造工艺GPU诞生一年半以后的今天,AMD携手全新的40nm GPU来了……
与55nm GPU一样,首款采用40nm制造工艺的显示核心仍然属于AMD,这些都源自于AMD务实的市场策略。

599-799元再添新军,新老显卡你会选谁?
RV740显卡未到来之前,AMD Radeon HD4830以及NVIDIA GeForce 9800GT一直在599-799元左右的市场争夺份额,在这个价格范围中,你会选择哪款产品呢?
40nm打造RV740,核心架构全面解析
比RV770核心面积减少13%
虽然RV740采用了先进的制造工艺,但核心架构方面,RV740仍然沿用了RV770的架构体系,RV740的晶体管数量比RV770下降了13%,核心面积的减少取决于三个方面:
1、核心制造工艺由55nm提升至40nm
2、流处理器数量的减少,800SP减至640SP
3、内存控制器的精简,256bit降至128bit
Radeon HD4770的规格与Radeon HD4830非常接近,不同的是Radeon HD4830所采用的RV770LE 640个SP是由800个SP的RV770PRO屏蔽而来,在晶体管数量上并没有降低,而RV740是原生640SP设计,140平方毫米的核心面积比260平方毫米的RV770降低了46%!

128bit显存位宽,GDDR5弥补位宽不足:
也许大家会对Radeon HD4770 128bit的显存位宽感到不解,其实这根本不需要担心,Radeon HD4770显卡采用了GDDR5显存,频率上比Radeon HD4830 的GDDR3显存大幅提升,使两者显存带宽相差无几,Radeon HD4770显存带宽为128bit×3200MHz/8=51.2GB/s,Radeon HD4830的显存带宽为256bit×1800MHz/8=57.6GB/s(与9800GT相同),而显存带宽对性能的影响远远小于核心频率的影响,Radeon HD4770 750MHz的核心频率比Radeon HD4830的575MHz高出了30%!

从规格上来看,Radeon HD4770所具备的性能介于Radeon HD4850和Radeon HD4830之间。
AMD Stream和DirectX 10.1
OpenCL统一GPGPU运算——AMD Stream
AMD的GPGPU技术,更加倾向于开放式通用计算语言,及OpenCL。由于OpenCL是一种开放性强的API,所以AMD并不会独享,定期放出的SDK可以让更多的人利用Radeon HD显卡,在多种平台上进行GPGPU应用和移植,另外在Windows 7中,Direct Compute也是AMD面向GPGPU应用的一种重要开发语言。

AMD在并行计算方面的理解与NVIDIA也有着非常大的差别,AMD同时拥有GPU和CPU,因此在针对并行运算的应用方面,更加注重CPU、GPU两者之间的平衡,虽然我们现在还没有看到过

Cyberlink 公司推出的视频转码工具对AMD CPU、GPU提供了非常良好的支持
提升的不仅仅是画质,DirectX 10.1游戏
与DirectX 10相比,DirectX 10.1在画面特效上增加了一些特性,如:全局光照明;阴影滤波、HDR、渲染精度的提升,为游戏的画面带来了更加出色的表现,但是更重要的是在执行效率方面,DirectX 10.1也在DirectX 10的基础上有了明显提升。

S.T.A.L.K.E.R Clear SKY DX10.1、DX10性能、画质对比

Stormrise DX10.1、DX10性能、画质对比

H.A.W.X DX10.1、DX10性能对比

UNIGEINE DX10.1、DX10画质对比
GPU和CPU的平衡物理加速——Havok
著名的物理技术公司Havok虽然于2007年9月被Intel收购,但AMD仍然与其进行了深度合作,与NVIDIA不同的是,AMD所采用的Havok物理加速引擎,不但可以利用GPU进行运算,也可以利用CPU进行运算,其实以往的Havok的物理游戏已经有很多很多,一直都是依靠CPU来实现物理特效的运算,而此次AMD GPU的加入,是Havok的工作模式更加广泛,这样就能够根据CPU、GPU的不同物理运算能力,在两者之间达到平衡,更加合理的利用PC资源。


AMD GPU实现的Havok物理加速DEMO
使用Havok物理特效的游戏非常非常多,在几百款游戏和非常多的动画电影中,我们都能够找到Havok的身影,虽然CPU能够在已有的游戏中进行高效Havok物理加速,但是我们仍然期待支持GPU加速的Havok游戏能够早日到来,而不是几个演示用的DEMO。
性能、功耗硬件测试环境介绍
虽然对于Radeon HD显卡来说,AMD平台能够更好的对其提供支持,但是为了测试的公平性,我们还是选择了强大的Core i7平台。
|
|
|
45nmQuad-Core 2.66GHz L3=8MB |
|
|
625/2000MHz 512MB/256bit |
|
575/1800MHz 512MB/256bit |
|
850/3200MHz 512MB/128bit |
|
600/1500/1800MHz 512MB/256bit |
|
MSI微星X58PRO |
Intel X58+ICH10R |
内存 |
Kingston金士顿 HyperX 1GB DDR3 ×2 |
|
|
|
|
|
|
|
|
Samsung三星 SyncMaster 2433BW |
|
参测显卡我们加入了RV770pro核心的Radeon HD4850和Radeon HD4830,以及与Radeon HD4830同定位的9800GT三款显卡,与Radeon HD4770的表现进行对比。

GPU-z能够完整识别出Radeon HD4770的规格

驱动程序信息
理论性能测试:3DMark Vantage


DirectX 9游戏测试:Left 4 Dead



在第一项游戏测试中,Radeon HD4770的性能没有与Radeon HD4830拉开明显的差距,与Radeon HD4850的差距也比较明显,而面对9800GT,能够非常轻松的取胜。
DirectX 9游戏测试:F.E.A.R 2



测试中,Radeon HD4770在1600×1200分辨率设置下的性能在Radeon HD4850、HD4830之间,大幅领先9800GT,在1920×1200分辨率中,三款Radeon HD4800显卡虽然都下降了20多fps,但仍然能够与9800GT拉开差距。
DirectX 10游戏测试:Farcry 2



Farcry 2游戏测试中,Radeon HD4770与Radeon HD4850保持在相同水平上,而Radeon HD4830虽然与前两款显卡有明显的差距,但与9800GT相比也有明显的优势。
DirectX 10游戏测试:Crysis Warhead



Crysis Warhead是一款“The Way It's Meant to be Played”游戏,但是9800GT的表现依然不能超越任何一款参测的Radeon HD4000显卡,Radeon HD4770的表现在Radeon HD4850与Radeon HD4830之间。
DirectX 10.1游戏测试:H.A.W.X



DirectX 10.1仅被Radeon HD显卡支持,我们前面提到DirectX 10.1在执行效率上的提升是非常明显的,因此在两种分辨率设置下,三款Radeon HD显卡都大幅超越了9800GT,Radeon HD4770的表现基本与Radeon HD4850保持一致。
核心930MHz!Radeon HD4770超频测试
虽然Radeon HD4770的默认750MHz核心频率已经达到了较高的水平,但40nm制造工艺使其仍然还有很大的超频空间,另外3200MHz的默认显存频率对于GDDR5来说,也非常保守,因此大幅提升Radeon HD4770的频率并非难事。

用OverDirve超频至830/3400MHz
在驱动程序的OverDirve超频功能中,频率上限有些保守,因此我们仅能够将频率调整至830/3400MHz的最大值,但这并不是Radeon HD4770的真正实力。

超频至830/3400MHz的3DMark Vantage成绩(点击查看大图)

修改Rivatuner配置文件超频Radeon HD4770(点击查看大图)
在Rivertuner.cfg文件中加入Radeon HD4770的设备ID,可以继续提升Radeon HD4770的频率,我们将核心/显存频率分别超至了930MHz和4200MHz!相信采用更加出色的散热方式,核心频率突破1GHz,一定非常容易。
Radeon HD4770功耗测试


待机功耗方面,Radeon HD4770与GeForce 9800GT保持在相同水平,1w左右的差距并不明显。

GPU高负载时,Radeon HD4770的优势得到了充分的体现,整机功耗比GeForce 9800GT低了14w。

HD4770 PK HD4850:
Radeon HD4770与其他三款显卡的较量,结果非常清晰,与Radeon HD4850相比,Radeon HD4770在多数游戏中略低于Radeon HD4850,并且早个别游戏的表现上能够与HD4850保持在同一水平线上,相信超频后的Radeon HD4770超越标准频率的Radeon HD4850并非难事。
HD4770 PK HD4830:
凭借核心频率的优势,Radeon HD4770在各项性能测试中,都完全超越了Radeon HD4830,一旦799元售价的4770上市,Radeon HD4830必定被用户和市场遗弃。
HD4770 PK 9800GT:
毋庸置疑,以往9800GT与Radeon HD4830的对决,9800GT也仅能在小部分PhysX游戏和“The Way”游戏中取得不怎么光彩的胜利,而面对性能更强的Radeon HD4770就更显得力不从心了。
最强799元显卡,Radeon HD4830的绝佳接班人:
Radeon HD4770的性能在799元以下的显卡市场中绝对最具杀伤力,AMD首款桌面平台40nm显卡在目前的产品格局中非常成功,无论是性能、功耗、还是成本上,Radeon HD4770都比目前的799元显卡具备更强的竞争力。当Radeon HD4830退市以后,Radeon HD4770可以完美成为Radeon HD4830的接班人。虽然Radeon HD4770已经解禁,但是我们在市场上见到这款产品大量上架的时间,还要再等1个月左右,虽然有些遗憾,但仍然值得期待。