分享

激情与梦想!2009显卡界终极碰撞回顾—小熊在线—显卡频道

 梦中家园 2010-05-21

前言


 

    时光荏苒,距离2009年结束还有最后的二十四小时。这一年中,显卡行业给我们留下了太多的激情和回忆。两大显卡巨头NVIDIA与AMD首度将40nm工艺制程试水,后者还带来了DirectX 11,随之多个领域开始陆续有相关新品渗入显卡领域的又一轮更新换代序幕开启

猜猜它是谁?

    始于去年的金融危机给全球经济带来重创,2009年对于显卡厂商来说绝非平凡的一年。两雄之间的角逐却始终都在激烈地进行着,仅十二个月,已经有十余款新品相继发布,他们中涵盖了低、中、高三个档次的产品,包括NVIDIA GT210/220/240、GTX275价格由几百元到几千元不等,可以说照顾到了所有群体的使用需求。

    除了产品的发布频率迅猛之外,本年度,两大巨头旗下产品规格、性能的提升也是显而易见,游戏和超频发烧友都是欢欣鼓舞。同时在高清方面的巩固也卓有成效,此前落后AMD一筹的NVIDIA也凭借硬解码上的进一步完善以及HD Audio CODEC的集成弥补了自己的劣势。此外,AMD和NVIDIA还都颇有针对性地研发了新颖的功能,例如在GPU通用计算上,NVIDIA的CUDA架构并行异构计算系统和AMD的Stream技术,又如NVIDIA的PhysX物理引擎和AMD与Intel合作的Havok的物理引擎计算单元,再如NVIDIA的PureVideo HD和AMD的Avivo HD等等。这些都为用户的使用增加了全新的体验

    正所谓“年年岁岁花相似,岁岁年年人不同”,显卡市场中惨烈的竞争和快速的变迁每年都在上演,即将过去的2009年也不例外。这一年中,显卡市场到底发生了什么,哪些产品值得我们回味,哪些技术值得我们考量,又有哪些特色功能值得我们关注呐?!下文会给您答案。


2009技术回顾-1-

 

    从产品线间的明刀明枪搏杀,到领域内技术与附加值的冷战暗斗,NVIDIA和AMD之间从来就没有停下过竞争的脚步。

    Stream是AMD-ATI针对旗下图形处理器(GPU)而推出的流处理技术,利用这种技术可以充分发挥AMD GPU的并行运算能力,用于对软件进行加速、进行大型的科学运算。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA 架构编写程序,C语言是应用最广泛的一种高级编程语言,所编写出的程序可以在支持CUDA的图形处理器上以超高性能运行。

    进入DX10以来,微软DX10 API引入了流处理器的概念,GPU不再像以前一样区分像素、顶点着色,使其更像内部的一个多核的通用处理器。于是GPU也开始参与更多的通用计算,逐渐呈现出威胁到CPU在计算机中的地位。NVIDIA早在去年就正式发布了CUDA这项技术,而后图形核心拥有基于统一并行计算架构设计的AMD也很快跟进,推出了Stream技术。两者在功能和应用上基本一致,都是利用图形核心的高效并行计算能力完成复杂的计算。

    CUDA是一个更适合于并行计算的架构,它可以将GPU视为一个并行数据计算的设备,对所进行的计算进行分配和管理。在CUDA的架构中,这些计算不再像过去所谓的GPGPU架构那样必须将计算映射到图形API(OpenGL和Direct 3D)中,因此对于开发者来说,CUDA的开发门槛大大降低了。CUDA的GPU编程语言基于标准的C语言,因此任何有C语言基础的用户都很容易地开发CUDA的应用程序。

    由于GPU的特点是处理密集型数据和并行数据计算,因此CUDA非常适合需要大规模并行计算的领域。目前CUDA除了可以用C语言开发,也已经提供FORTRAN的应用接口未来CUDA会支持C++、Java、Python等各类语言。可广泛的应用在图形动画、科学计算、地质、生物、物理模拟等领域。

    针对NVIDIA的CUDA,AMD-ATI也有自己的Stream流处理架构,凭借RV770和RV790超过1TeraFlops的强大浮点运算能力,在通用计算领域更具优势。

    ATI Stream SDK是AMD提供的一套完整开发平台,可以使用ATI Stream技术轻松创建应用程序,现在还引入了通用计算高级语言OpenCL,都支持CPU处理器、GPU显卡的加速,而AMD因为拥有一体化3A平台,是惟一一家做到了在CPU、GPU上都实现OpenCL支持的厂商。OpenCL是第一个针对通用目的计算和异构系统、完全开放和免费的编程标准,在多核心处理器和最新显卡上都能轻松编译和加速。

    当然,AMD也并非仅仅支持OpenCL一种API接口,同时AMD自有的Brook+、更多的高级编程语言编程工具、高级编程语言编译器、特定应用程序库以及业界的OpenGL、DirectX等技术均能够得到支持。更多的开发方式的支持,得到的结果只有一个,那就是让编程人员有更多的选择,从而可以从自己熟悉的方式来对显卡的更多潜能进行开发。

    在软件应用中,目前支持Stream的程序仍旧屈指可数,甚至还包括那个集成在驱动中NVIDIA显卡也能使用的AVC转码器,而CUDA程序则要丰富的多,已经遍布各个应用领域,除了最初的Badaboom外,现在已有MediaCoder、MotionDSP、Loilo、PowerDirector 7、TMPGEnc 4、TotalMedia Theatre、vReveal、暴风转码等多款软件!


2009技术回顾-2-

 

    物理引擎这个词汇对我们来说并不陌生,目前在游戏里被大量应用的物理引擎有两种,分别是AGEIA开发的PhysX以及Havok的Havok系列引擎,目前使用这些引擎的游戏加起来总共超过四百款。

    作为NVIDIA独有的四大内功中最重要的组成部分,PhysX是原AGEIA公司开发的一套物理运算引擎,可运用在Xbox360,Playstation3,PC,Mac等多种平台之上。PhysX的另外一个优势是可以运用独立的浮点处理器(包括独立的物理加速卡和GPU)进行更为复杂的运算效果,同时减轻CPU的计算负担。PhysX将会使设计师在开发游戏的过程中,使用复杂的物理效果,而不需要像以往那样耗费漫长的时间开发一套新的物理引擎。AGEIA宣称PhysX执行物理运算的效率比当前的CPU与物理处理软件的组合高出100倍。

    不过,好景不长,拥有雄厚财力、人力、物力的NVIDIA公司收购AGEIA,迅速将AGEIA的PhysX物理引擎技术通过CUDA架构特点融入到了GPU中,这样一来,采用统一架构设计的GPU,同时还是一颗PPU。实现原理上是,NVIDIA将用GPU模拟原有PPU的功能架构,即通过NVIDIA的CUDA架构,让图形核心中的Thread Scheduler(线程管理器)模拟成CE(控制引擎Control Engine),Streaming Processors来模拟VPE(矢量处理引擎Vector Processing Engine),这样一个完整PPU架构就实现了,最后通过DME(数据移动引擎Data Movement Engine)将计算型号输出。

应用了PhysX物理加速的《far cry 2》游戏

    目前主流的NVIDIA显卡的GPU都整合了PhysX物理加速技术,有了它,用户等于零开支即享受到了几乎等同于物理加速卡功能的效果。同时,使用GPU物理加速之后,用户也不需要购买非常高档的CPU来进行物理加速的“软”计算,用户只需要购买一颗低端的CPU即可,节省了平台的预算。

    Havok原是一家业界领先的软件服务提供商,其物理引擎被超过200款游戏使用,许多电影也应用了这家公司的软件技术。去年9月,Intel毫无征兆地宣布收购Havok。作为PhysX的主要竞争对手,Havok被全球最雄厚的Intel收购后羽翼更加丰满,规模和实力大大增强,应用的游戏数量远远超过PhysX,而且仅应用CPU就能带来良好的物理效果。

    Havok已经作为英特尔的全资子公司运作了10个月。Havok以独立发展的形式从事Havok FX物理处理应用编程接口(API)的研发,这可以让运算法则更好地在GPU上运用。如今,AMD最终选择了英特尔旗下的Havok来与NVIDIA的PhysX相抗衡。AMD方面称,Havok的技术非常先进,执行效率较高,关键是非常便宜,AMD已经计划在处理器上针对Havok技术进行全面优化。同时,AMD也希望让Radeon核心来负责相应的物理运算,而即将发布的RV770中的物理加速运算能力就来自Havok。


2009产品回顾-1-

 

第一季度概括:

  一季度发布产品 当季热门产品
NVIDIA产品 GTX285/295/260+/GTS250 GTX260+
AMD产品 HD4830 HD4870

曾经不可一视的HD4870 X2

GTX295

    09年第一季度堪称NVIDIA独美,在年初发布了GeForce GTX 285/295两款单芯与双芯旗舰以后,NVIDIA的高端统治策略得以完善,性能王者的宝座也被牢牢把控,对手Radeon HD 4870 X2被生生的坑杀。

GTX260+核心

    与此同时,NVIDIA的中端布局也在有条不紊地进行,GeForce 9800 GTX+大张旗鼓地更名为GeForce GTS 250,盘踞了千元市场。而在GTX260的基础上升级了规格的GTX260+,则凭借先进的55nm制造工艺、216个流处理器和448Bit的位宽,在性能和价格上拥有了更高的竞争力,终于扭转了此前GTX260被HD4870打压的劣势,成为2000元级别市场中的风云产品。

GTX260+实物

日后宏图大展的HD4830

    此外,第二季度最热门的中端之作HD4830也在月正式登场,这款源于HD4850而又有区别的产品,其采用RV770LE核心,相比RV770缩减了一组SP管线和纹理单元,流处理器由800个降为640个,纹理单元保留了32个。8组32bit显存接口对应16组光栅单元,没有缩减。核心默认频率从HD 4850的625MHz降为575MHz,搭配512MB GDDR3显存,官方推荐显存频率为1800MHz。值得一提的是,HD4830保留了完整的256bit显存位宽接口和16个ROPs单元,在游戏中开启AA性能不会损失太大。而且HD4830同样支持PowerPlay2.0动态节能技术,UVD2.0规格还进行了升级,支持蓝光高清双流解码,显卡的音频输出支持由上代的5.1声道升级到7.1声道
 

第一季度热点:

蓝宝石人气极盛的毒药版HD4870

    春节后,一向擅打价格战的AMD率先将HD4870的价格大幅调整,与竞争对手GTX260+保持了数百元的价格区位,随后受到发烧友的强烈反响,销量迅速攀升。然而,好景不长,隐忍了一月有余的NVIDIA在毫无征兆的情况下,于三月中旬将GTX260+系列拉低到1500元之下,部分二线产品更是爆出1299元的超低价,此举颠覆了当时的中高端市场格局。要知道当时的主流产品还是GTS250和HD4850,两款超强系列的降价一时间拉近了与普通消费者的距离,同时也为自己在09年中成为最热门产品记下了浓重的一笔。


2009产品回顾-2-

 

第二季度概括:

  二季度发布产品 当季热门产品
NVIDIA产品 GTX275 GF9800GT
AMD产品 HD4890 HD4830

    09年第二季度,由GTX260+和HD4870互搏所引发的争端尚未平息,眼见自己在中高端稍逊一阵的AMD宣布推出基于RV790核心的HD4890,其意图很明显就是要独占刚刚因GTX260+/HD4870降价空出的1500至2500元间的市场。岂料,自己的美梦还没有作长,NVIDIA就跟进发布了基于G200-105-B3芯片的GTX275,该系列配备完整240个Streaming Processor统一处理单元,拥有896MB/448bit的显存和高频规格,重收失地。

    GTX275采用G200-105-B3核心,基于先进的台积电55nm工艺制造。GTX275核心内建完整240个流处理器,比GTX260+多16个,达到高端GTX285的核心规格,另外核心工作频率633MHz,Shader频率则高达1404MHz,远高于GTX260+,GTX275性能自然更加强。G200核心完全按照DirectX 10以及OPenGL 2.1的规范设计,同时支持DirectX 10、Shader Model 4.0、PhysX、CUDA、PureVideo HD、OpenGL 2.1、3-WAY SLI、PCI-E 2.0等众多先进技术。

HD4890

    HD4890内部采用RV790核心,基于先进的55nm制程,拥有800个流处理器,256bit显存位宽。支持Direct X10.1及Shader Model4.1规范,并且支持多卡交火和PCI-E 2.0,还提供了第二代UVD高清硬件解码能力,支持MPEG-2 、VC-1、和H.264等高清视频格式的硬件解码,支持运动补偿IDCT,DCT色彩空间转换的功能。POWERPLAY 技术能使显卡在待机状态更为省电。该系列搭配GDDR5显存,显存是由8颗GDDR5组成1GB/256bit、850/3900MHz的规格。

第二季度热点:

9800GT与HD4830的一直缠斗到年底,还无分晓

    作为当时购买力最旺盛的千元内市场中极受欢迎的产品,9800GT与HD4830可以说是“各领风骚数百年”。这对欢喜冤家在五一黄金周以及后来的暑期市场都积攒了极高的人气,市场销量节节攀升。虽然在设计上两款显卡各有特色,但从市场定位、标称性能以及玩家口碑上看,它们所获得的评价基本上难分优劣。此外,非官方证实的800流处理器HD4830的涌现也掀起了一场风波,这些经历都为HD4830缔造了传奇色彩。


2009产品回顾-3-

 

第三季度概括:

  三季度发布产品 当季热门产品
NVIDIA产品 --- GTS250/GTX260+
AMD产品 HD4860/4750/5000系列 HD4850/4860/4890

    如果说第一季度是NVIDIA独美,那么今年第三季度则是不折不扣的AMD显卡季。八月,虽然风传许久的RV740核心HD4770最终胎死腹中,但AMD并没有令国内用户失望,就像HD3690一样,专供国内玩家的HD4860携GDDR5高规格显存驾临中端,协助HD4850前后夹击GTS250。

性能高出HD4850 15%--20%的HD4860

    作为主流价位上首款搭载GDDR5显存的产品,HD4860采用了全新的RV790GT芯片。尽管从型号上来看,HD4860更像是HD4850的延续版本,但前者的核心却源于旗舰HD4890。它拥有640个流处理器单元,并搭载高速256bit GDDR5 显存,因此受到业界与广大玩家的关注。虽然Radeon HD4860在流处理器数量上不及Radeon HD 4850(800个流处理器单元),但由于Radeon HD4860搭载了GDDR5 显存颗粒,同时核心得益于RV790的强劲超频能力,其整体频率将大幅高于Radeon HD4850,从而保证整体很高的性能。

    Radeon HD4860与Radeon HD4850都具有自己所特有的产品特性,Radeon HD4850推出时间更久,一直都是AMD与GeForce GTS250正面交锋的主力,性能与GeForce GTS250在伯仲之间,但是相对来说价格更低,是显卡中端市场的性价比之王。而Radeon HD4860以相对较新的核心技术运行在更高的频率上,同时配备最先进的GDDR5显存,性能上将超越GeForce GTS250,但是价格却相当,性价比不言而喻。

    继承了HD4770衣钵的HD4750是世界上首款采用40nm工艺制造的显卡产品,在设计构架上几乎沿袭了前者的众多优秀之处。基于RV740显示核心,拥有完整的640个流处理器单元,16个渲染器后端、32个纹理单元,128-bit位宽,最大带宽3.2GB/s。同时支持DirectX 10.1,SM4.1、Havok物理加速技术及Stream通用计算技术。接口上显卡提供了HDMI+DVI+S-Video设计,高清电视及30寸大分辨率电视都可以完美支持。得益于40nm出色工艺,该系列在功耗和散热控制上相当到位,对于平台的整体节能效果显著。

迪兰恒进HD4750

    凭借巧妙的市场定位、出色的工艺设计和GDDR5显存的大力推动,HD4750将在未来低端市场拥有强大号召力

第三季度热点:

    此季度的关键词汇就是GDDR5显存颗粒和40nm制程工艺。其中,AMD是最早将GDDR5显存规格引入到显卡上的GPU厂商。而今年第三季度,AMD将原本只属于高端的GDDR5显存加入到主流价位的显卡之上,给市场带来强烈震撼。

GDDR5显存颗粒

    GDDR5显存的好处就在于成倍提升了显存频率,可有效提高显存带宽,对于性能的攀升有着重要的作用。值得一提的是,目前采用GDDR5显存颗粒的产品多数都基于40nm工艺制程,新工艺带来的能耗也下降不少,对于产品的热能发散、稳定表现也有着不错的保证

40nm晶圆

    40nm制程工艺改进对显卡的影响相当可观,最明显的变化就是芯片尺寸的缩小,和55nm制程相比,40nm工艺理论上可以减少40%以上的硅片面积,如果一片晶圆在55nm制程下可以切割出100个芯片的话,那么在40nm制程下有可能切割出166个或更多,因此单体制造成本会下降很多。

    在晶体管数不变的情况下,更小的核心面积就意味着单个晶体管的体积更加小巧,晶体管体积越小驱动电压就越低,GPU在相同频率下较55nm的整体功耗就越低,因此40nm的GPU发热量也就越小,借此核心的频率也会达到更高的幅度,且稳定性更佳。


2009产品回顾-4-

 

第四季度概括:

  四季度发布产品 当季热门产品
NVIDIA产品 GT210/220/240 GTS250/GTX260+
AMD产品 HD5970/5870/5850/5770/5750 HD4870/4890

HD5000军团

    每年的11月都有很多游戏大作扎堆儿上市,这也带动了显卡市场推陈出新的步伐。第四季度,AMD率先发布了首款DirectX 11产品--ATI Radeon HD 5870显卡,正式揭开DirectX 11时代的序章!而后,HD5000大军的铁蹄迅速碾过中高端市场。继HD5870之后,HD5850、HD5770、HD5750纷纷登场,直到推翻GTX295的HD5970驾临,短短两月,五款HD5000系列集体涌现。

    目前NVIDIA产品线中与Radeon HD5870/5850/5770(DX11)对位的GeForce GTX295/285/260+(DX10)在性能方面处于不同程度的劣势。价格方面,Radeon HD5870/5850的价格相比GeForce GTX295/285要显得更具优势。在价位相差不多的情况下,自然是喜新厌旧。DX11是大势所趋,游戏开发者对于DX11的热情远超以往任何一个版本,原因就是DX11能够大幅提升游戏运行效率

驭威GT240

    回过头来看NVIDIA,这已经是其近几年中第二次在规格上和技术上落后于AMD。由于短期内无法拿出DX11产品,其只能在AMD一系列40nm与DX11系列产品全面部署后,仅仅“寒酸”地丰富了一下自家的低端市场。能够支持DX10.1和40nm工艺的GT200兄弟--GeForce GT210和220以及240(搭载GDDR5显存颗粒)对位替换了9500GT、9600GSO和9600GT

第四季度热点:

WIN7与DirectX 11:

    10月23日,微软高调发布了最新一代操作系统--Windows7,这款操作系统相对于之前的Vista系统有相当大的进步,特别是在内存占用率以及运行速度方面得到显著改善,并且加入了DirectX 11等新技术。推出DirectX 11的目的很明确,就是能够充分利用显卡资源,从而在游戏以及通用计算方面达到更高的执行效率。而AMD也不失时机地抢发新作,即支持DirectX 11的HD5000显卡。

    相对于DirectX 10,全新的DirectX 11增加了诸多特性,例如:Direct3D 11渲染管线、Tessellation镶嵌技术、多线程的支持、计算着色器Compute Shader、Shader Model 5.0、改进的纹理压缩等等。其提升了GPU的渲染效率,所带来的性能提升非常明显,在游戏速度上提升尤其可观。而且开启众多特效后,DirectX 11游戏效果相比DirectX 10来说更具吸引力,随着软硬件不断的深入与优化,这个优势还将继续放大。不得不提到的是,DirectX 11可以让平行编程变得更加容易,高级渲染语言也已经完全成熟,这势必会让DirectX 11在游戏开发者群体中变得更加具有吸引力,其独有的特性也会促进开发者们大胆的迅速采纳这种API。所以,现在选择DirectX 11产品是非常明智的选择。总体来讲,DirectX 11拥有更好的执行效率和画质,随着微软Windows7操作系统的普及,其必定成为未来游戏的标准。

Eyefinity(宽域)技术:

Eyefinity(宽域)技术

    除了可以完整支持DirectX 11外,Radeon HD 5000系列产品还添加了一个重要特色就是Eyefinity(宽域)技术。革命性的ATI Eyefinity技术,以多屏显示打破了以往陈旧的单屏游戏模式,为消费者带来前所未有的视觉冲击,采用该技术的显卡将支持最少三屏显示器输出,让消费者领略到更加浩瀚、真实、华丽的游戏画面。目前主流的22、24英寸LCD显示器的价格已经非常便宜,个人消费者组建屏PC平台并不算是很奢望的事情。在游戏方面,三屏显示将给游戏玩家带来更多游戏场景和视角。而在股票和设计等应用中,用户能看到更多的信息窗口和设计草图。当然,这一功能在医疗方面也都会被使用到。未来是个视觉的时代,人类能够很快的吸收视觉带来的资讯,这个应用会越来越广。


总结与展望

 

    NVIDIA原定今年11月发布的40nm DX11图形核心Fermi一再跳票,这给了竞争对手AMD推广新品HD5000系列以大把时间。回想前三季度,NVIDIA依靠GTX260+/275/280/285等产品在中高端掀起的波澜,仅仅一个季度,就让隐忍多时的AMD大翻身,足以见得在如此激烈的市场中稍稍的喘息便给了对手以可乘之机。不过,一旦传闻中的主角Fermi驾临,那么胜利的天平倾向于谁还真的不好说。正因为此,NVIDIA也无需焦虑,其现在遭遇到的情况正是AMD前阵子经历的,卧薪尝胆再图奋起才是王道。

    除了对Fermi的期待,Intel的Larrabee独立显示芯片也是2010年我们不容错过的。这个本在Intel计划中的项目,其工程样品在2008年底就绪,本打算2009年年底或2010发布,只是由于硬件及软件进度研发都无法到达预期,导致性能并不理想,Intel无法不顾后果的仓促推出它,因此再多给它一些时间。相信以Intel的雄厚实力,三强鼎立的日子不会久远,我们要做的只是拭目以待

    当然,还有40nm工艺和DirectX 11显卡的普及也将是明年两大巨头的重中之重,届时无论谁胜谁负,最终的受益者还是我们消费者,让我们共同期待明年的到来。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多