图形与计算的融合，AMD GCN架构解析

蓝睿003 2022-10-14 发布于广东

展开全文

早期的渲染过程很简单，主要是几何变换以及光照渲染，当时评价显卡性能的指标主要就是T&L（Transform & Lighting）单元的多少，这个时期大约是十年前的事了。再往后显卡的结构也越来越复杂，开始大规模应用三角形生成模型，建模需要vertex顶点坐标和pixel像素填充，VS顶点渲染器和PS像素渲染器就成了显卡的主要运算单元了，运算流程就大概如上图所示，一直到5年前的DX9时代都是如此。

　　之后的事就更热闹了，微软的DX10规范取消了VS和PS渲染单元，变为“统一处理器”，也叫做流处理器（Stream Processor），现在我们看到显卡的基础构成都是基于流处理器的，只是AMD和NVIDIA两家的设计方式不同，叫法也不一样。

　　NVIDIA从G80开始走的是MIMD（多指令多数据）的1D标量体系，架构变化很大，而AMD从第一款DX10显卡HD 2900系列开始一直都是改良型4D+1D架构，也就是俗称的VLIW 5体系，好处是电路设计没那么复杂，SP数量容易扩展，这个体系一直用到HD 6800系列显卡上。

　　HD 6900显卡发布时，AMD将VLIW 5架构做了一些改进，变为VLIW 4架构，减少了那个4D+1D中的1D超标量单元，同时增强了剩下的4D矢量单元的性能，因此HD 6900系列在SP总数减少的同时性能其实是提升的，有关VLIW 4架构的详细内容可以参考超能的HD 6970 显卡评测。

　　VLIW架构对图形计算来说是好的，但是随着流处理器数量的不断增多，其效率低下的问题也日益严重，长指令拼接很依赖调度管理，而实际运算不一定就是最优组合。再者说，如今DX游戏的画质很难再有质的突破（除非光线追踪技术成熟），显卡的单纯3D渲染提升乏力，反倒是GPU通用计算增长迅猛，AMD的VLIW架构的理论运算性能要强于对手产品，但是实际表现以及推广应用上都是要远远落后于对手的。

　　在这样的背景下，AMD于今年中公布了下一代HD 7000显卡的架构，代号为“Graphic Core Next”（简称GCN），GCN架构将不再沿用SIMD的VLIW体系，而是全新的革命性架构，除了传统的3D运算之外，它还在GPU通用计算上洗心革面，是AMD首次针对3D