智能手机、无人机的进化，大型人工智能塞进移动系统

LZS2851 2016-04-03

展开全文

工程师正在努力将大型人工智能塞进移动系统中。

智能手机、无人机的进化，大型人工智能塞进移动系统

你到底要往哪边走？工程师展示了一种可用在汽车中预测撞到行人风险的神经网络芯片。

基于神经网络的人工智能系统最近取得了一连串了不起的成功：一个在围棋比赛中击败了人类大师，另一个能撰写啤酒评测，还有一个能打造迷幻艺术。但要将这些超级复杂和非常耗电的系统引入真实世界并将它们安装到便携式设备上却并非易事。

但二月份时，在旧金山举办的 IEEE 国际固态电路会议上，来自麻省理工学院、NVIDIA 和韩国科学技术院（KAIST）的团队让这一目标离我们更近了一步。他们展示了专为运行人工神经网络而设计的低功耗芯片原型，该芯片能够帮助智能手机理解其所看到的内容，还能让自动驾驶汽车预测行人的移动。

到现在为止，神经网络——以类似大脑细胞的网络连接方式工作的学习系统——都还需要消耗的大量的能源，故而不能在移动设备（如智能手机、小型机器人和无人机）上运行，而移动设备又是最能得益于人工智能技术的领域。这种移动人工智能芯片可以在不榨干它们的电池或影响它们的燃料经济性的前提下提高自动驾驶汽车的智能。

智能手机处理器目前处在运行强大神经网络软件的临界点。高通公司正在将其下一代骁龙智能手机处理器和一个软件开发工具包发送给手机制造商，以让他们能使用神经网络实现自动图像标注功能。这种以软件为中心的方法是一个里程碑，但也有它的局限性。一方面，手机的应用程序不能依靠自己学习任何新事物——它只能通过更强大的计算机进行训练。而神经网络专家认为如果能将对神经网络友好的功能集成到电路本身，那么实现更复杂的功能是可能的。

其它运行图像识别神经网络 AlexNet 的功耗为 5 到 10 W，而 Eyeriss 只需0.3 W。

更大型的神经网络拥有更多计算层，运行时所消耗的能量也就更多，麻省理工学院电气工程教授 Vivienne Sze 说。不管是什么应用程序，能量都主要被消耗在了处理器和内存之间的数据传输中。对被用于图像分析的卷积神经网络来说，这是一个尤其突出的问题。（其中的「卷积」表示计算过程涉及很多步骤。）

对于人脑而言，使用记忆做出联想是很自然的。一个三岁孩童就能轻松告诉你一张照片上有一只猫躺在床上。卷积神经网络也能标记一张图像中的所有对象。首先，一个类似图像识别AlexNet 的系统可能能够找到照片中对象的边缘，然后一个接一个识别这些对象——猫、床、毯子——最后推断出这是一室内场景。然而，即使这样一简单的标记任务耗能仍然很高。

神经网络，尤其是应用于图像分析的神经网络，通常都运行在图形处理器（GPU）上，这也是骁龙将会在其场景探测（Scene Detect）功能中所使用的。Sze 说，GPU 已经是专门用来做图像处理的了，但在打造高效运行神经网络的电路上还有多得多的事情要做。

Sze 与另一位麻省理工学院计算机科学教授兼 NVIDIA 资深杰出研究科学家 Joel Emer 合作开发了 Eyeriss ——第一款专为运行最先进的卷积神经网络设计的定制芯片。他们展示的这些芯片可以运行要求非常严格的算法 AlexNet，使用的能耗不到典型移动 GPU 的十分之一：不再需要消耗 5 到 10 W 的功率，Eyeriss 只需要 0.3 W。

Sze 和 Emer 的芯片通过在其 168 个处理引擎旁边安装专用内存条来节省能源。该芯片尽可能少地从更大的主内存条中获取数据。Eyeriss 也压缩它所发送的数据，并使用统计技巧跳过某些 GPU 通常会执行的步骤。

真实的世界是多样化的，几乎不可能预测。——韩国科学技术院 Hoi-Jun Yoo

韩国科学技术院教授、多媒体 VLSI 实验室负责人 Lee-Sup Kim 说，这些为神经网络图像分析开发的电路也将在机场面部识别系统和机器人导航中大有用处。在这次会议上，Kim 的实验室展示了一种专为物联网的通用视觉处理器而设计的芯片。和 Eyeriss 一样，韩国科学技术院的这个设计通过将内存和处理器更紧密地结合到一起以最小化数据的移动。其功耗仅为 45 毫瓦，但公平而言，其所运行的网络并没有 Eyeriss 运行的网络那样复杂。它既通过限制数据移动也通过减轻计算负载来节约能源。Kim 的研究小组观察到关键计算使用的 99% 的数字只需要 8 个比特，所以他们可以限制用于此计算的资源。

NVIDIA 的Emer 说：「这是一个在通用性和效率之间做选择的难题。」Sze、Emer 和 Kim 正尝试开发用于图像分析的通用型神经网络芯片——一种 NNPU（general-purpose neural-network）。另一位韩国科学技术院教授、系统设计创新与应用研究中心负责人 Hoi-Jun Yoo 支持用一种更专用化、由应用驱动的方法开发神经网络硬件。

Yoo 介绍了一种专为自动驾驶汽车设计的系统。它是为识别视野中对象的卷积网络设计的，而且使用的是一种不同的算法——递归神经网络（recurrent neural network）。这里的「递归」是指系统的时间长短型记忆功能——它们擅长分析视频、语音和其它随时间变化的信息。Yoo 的研究小组希望开发一种能够运行递归神经网络的芯片，该网络可用于追踪运动目标并预测其动向，比如人行道上的行人将要进入车道了吗？这个功耗仅 330 mW 的系统可以同时预测 20 个目标的动向，而且几乎是实时的——延迟仅有 1.24 毫秒。

Yoo 的系统和麻省理工的芯片之间的另一个不同点是，被Yoo称为动向预测处理器（Intention Prediction Processor）的硬件能在实际应用时仍继续学习。Yoo 的设计整合了被他称为深度学习内核（deep-learning core）的电路，该设计是为被添加到神经网络的训练而设计的。对于卷积神经网络而言，这样的深度学习训练通常要在强大的计算机上完成。但 Yoo 说，使用的设备应该适应我们的生活，并且能在工作中学习。Yoo 说：「为所有事件进行预编程是不可能的。真实的世界是多样化的，很难预测。」

本文选自IEEE Spectrum，作者：Katherine Bourzac；机器之心编译，参与人员：吴攀、李亚洲