分享

图形与计算的融合,AMD GCN架构解析

 蓝睿003 2022-10-14 发布于广东

早期的渲染过程很简单,主要是几何变换以及光照渲染,当时评价显卡性能的指标主要就是T&L(Transform & Lighting)单元的多少,这个时期大约是十年前的事了。再往后显卡的结构也越来越复杂,开始大规模应用三角形生成模型,建模需要vertex顶点坐标和pixel像素填充,VS顶点渲染器和PS像素渲染器就成了显卡的主要运算单元了,运算流程就大概如上图所示,一直到5年前的DX9时代都是如此。

  之后的事就更热闹了,微软的DX10规范取消了VS和PS渲染单元,变为“统一处理器”,也叫做流处理器(Stream Processor),现在我们看到显卡的基础构成都是基于流处理器的,只是AMD和NVIDIA两家的设计方式不同,叫法也不一样。

  NVIDIA从G80开始走的是MIMD(多指令多数据)的1D标量体系,架构变化很大,而AMD从第一款DX10显卡HD 2900系列开始一直都是改良型4D+1D架构,也就是俗称的VLIW 5体系,好处是电路设计没那么复杂,SP数量容易扩展,这个体系一直用到HD 6800系列显卡上。

  HD 6900显卡发布时,AMD将VLIW 5架构做了一些改进,变为VLIW 4架构,减少了那个4D+1D中的1D超标量单元,同时增强了剩下的4D矢量单元的性能,因此HD 6900系列在SP总数减少的同时性能其实是提升的,有关VLIW 4架构的详细内容可以参考超能的HD 6970显卡评测

  VLIW架构对图形计算来说是好的,但是随着流处理器数量的不断增多,其效率低下的问题也日益严重,长指令拼接很依赖调度管理,而实际运算不一定就是最优组合。再者说,如今DX游戏的画质很难再有质的突破(除非光线追踪技术成熟),显卡的单纯3D渲染提升乏力,反倒是GPU通用计算增长迅猛,AMD的VLIW架构的理论运算性能要强于对手产品,但是实际表现以及推广应用上都是要远远落后于对手的。

  在这样的背景下,AMD于今年中公布了下一代HD 7000显卡的架构,代号为“Graphic Core Next”(简称GCN),GCN架构将不再沿用SIMD的VLIW体系,而是全新的革命性架构,除了传统的3D运算之外,它还在GPU通用计算上洗心革面,是AMD首次针对3D

 使用GCN架构的HD 7970显卡将成为一个分水冷

  经过半年多的准备,本文发布的时候实际HD 7970已经正式发布了,它的性能、功耗以及技术介绍已经不是秘密了。由于坑爹的发布策略,国内媒体是没得测,没得发,甚至没有卡,本文只能介绍一下GCN的架构设计特点,看看AMD引以为傲的GCN架构到底有什么过人之处。

渲染/GPU计算双重使命而设计的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章