搞懂GPU为什么比CPU“快”

goandlove 2019-08-19

展开全文

作者：毛大闲

来源：面包板社区

https://www./blog/3887969-407803.html

近几年深度学习在各领域大显神威，而”GPU加速'也得到了越来越多的篇幅，似乎任何程序只要放到GPU上运行那速度就是杠杠的。GPU代替CPU计算已成了大势所趋？我先告诉你结论”那是不可能滴“，然后咱们再来说说”GPU为什么比CPU快“。

一、图形处理，GPU的源起

GPU是显卡的计算单元，就好比CPU是电脑的计算核心，有时我们直接就把GPU称为显卡。显而易见，GPU从诞生之初就是用来处理图像的。下面我们讲一个简单的例子来说明下为什么图像处理需要用到GPU，而CPU的缺点是什么。

我们讲一个画面”立体“，其实讲的是画面中对于光影的运用，下图就是一个简单的”圆“。

当我们给这个圆加上”光影“之后，它就变成了一个球。我们说球要比圆立体的多，这就是光影的作用。

光影的原理很简单，你需要想象一个远处的”光“，然后在画面上模拟出光照在物体上的明暗变化，计算机中这些明暗变化都是通过”计算“得到的。编程人员只需要输入光源的距离、亮度、被照体的位置，然后通过逐步计算、光影叠加就能得到图像中每一个像素应该显示什么颜色、什么亮度，一个立体画面也就跃然纸上了。

那么现在问题来了，假设屏幕分辨率为1920*1080，即2073600(207.36万)个像素，游戏中每个像素都需要根据光影参数来计算显示的颜色和明暗。假设一个常见的Intel I5 CPU主频为3.2GHz，即最多每秒可做32亿次运算。但这里的一次运算只是做了一次简单的二进制加减法或数据读取，一个像素的光影计算我们可以假设需要100次运算

关于CPU的运算原理可以看这篇文章：

https://www./blog/3887969-407226.html

即CPU一秒约处理3200万次像素运算，大概15张图片，用专业点的说法，这个游戏流畅度大概是每秒15帧的样子。

可见使用CPU全力进行图形运算是有点吃力的，更何况CPU还要处理很多键盘指令、游戏后台计算等等。是CPU还不够快吗?假设现在速度翻倍，即每秒64亿次运算似乎也是不够的。其实CPU面临的主要问题是，虽然每一次光影计算都非常简单，但经不住像素太多啦，还都得排队一个一个做。然后工程师们想到“其实任何一个像素的计算与其他像素的计算结果关系不大”，那为啥不多整几个计算核心“并行”计算呢，于是GPU就出现了。

一个典型的显卡GTX1060，主频是1.5GHz大概是Intel I5一半左右，但是它具备1280个计算核心。每个计算核心每秒可做15亿次运算，1280个核心每秒就是19200亿次运算，那一秒可以处理192亿次像素计算，大概925张图片，是CPU计算能力的61倍!但GPU的特性只能应用于图形计算这种可以并行的任务，若是做普通的串行任务其速度远远不如CPU。

二、核心越多越好?

通过前面的叙述我们都知道了GPU速度“快于”CPU的奥秘在于它有很多的“核”，那能不能这样，我们给CPU也装上1000多个核，那速度岂不是快到飞起?答案是“不得行”。由于制造工艺的原因，CPU内核越多其频率也就越低。其实很容易想到，同步10个人的动作和同步1000个人的动作其难度肯定是不一样的。其次，电脑中大部分的运算都是串行的，即下一个运算要等到上一个运算完毕才能继续，这时候单次运算的速度才是最重要的。

所以相当长时间以内，CPU+GPU的搭配才是最佳方案。