传统PC的高级框图。北桥包含高带宽接口,连接CPU,内存和PCI总线。 南桥包含传统接口和设备:ISA总线(音频,LAN),中断控制器; DMA控制器;定时/计数器。 在该系统中,显示器由称为VGA(视频图形阵列)的简单帧缓冲子系统驱动,该子系统连接到PCI总线。 1990年的PC环境中不存在具有内置处理元件(GPU)的图形子系统。 在Pascal中,一个SM(流式多处理器)由128个CUDA内核组成。GP100 SM分为两个处理模块,每个模块具有32位单精度CUDA内核,一个指令缓冲区,一个warp调度程序,2个纹理映射单元和2个调度单元。使用统一内存体系结构,借助称为“页面迁移引擎”的技术,CPU和GPU可以同时访问主系统内存和图形卡上的内存。 渲染输出单元(ROP)是现代图形处理器(GPU)最后硬件组件,和在渲染过程的最后步骤之一。绘图管线取像素(每个像素是一个无量纲点),和纹理像素信息,并处理它,经由特定的矩阵和向量运算,变成最终像素或深度值。此过程称为栅格化。当多个样本合并为一个像素时,渲染输出单元控制抗锯齿。 渲染输出单元执行本地存储器中相关缓冲区之间的事务 - 这包括写入或读取值,以及将它们混合在一起。 用于执行基于硬件的抗锯齿方法(如多重采样抗锯齿(MSAA))的专用抗锯齿硬件包含在渲染输出单元中。渲染的所有数据都必须通过渲染输出单元才能写入帧缓冲器,帧缓冲器再传输到VGA 、 DVI 、 HDMI 、 Displayport 、 Mini Displayport线到显示器。历史上,渲染输出单元,纹理映射单元和着色器处理单元/ 流处理器的数量是相等的。然而,从2004年开始,几个GPU已经将这些区域分离,以便为应用程序工作负载和可用内存性能提供最佳的晶体管分配。随着趋势的继续,预计图形处理器将继续解耦其架构的各个部分,以增强其对未来图形应用程序的适应性。这种设计还允许芯片制造商构建模块化阵容,其中顶级GPU基本上使用与低端产品相同的逻辑。 来源:https://www./content-4-514051.html |
|