浪潮成立AI事业部，计算力对深度学习有多重要？

高处不胜寒676 2017-04-21

展开全文

浪潮成立AI事业部，计算力对深度学习有多重要？

本月初，浪潮在今年的财年大会上，正式对外公布成立人工智能部，持续推出面向AI应用的创新计算平台。

当然，浪潮广为人知的自然是在其深耕的服务器领域。根据赛迪顾问此前发布的数据，2016年度，浪潮服务器出货量份额稳居中国市场第一，达到20.4%，并保持高速增长。那么，此次发力人工智能，浪潮有何背书？

计算力可谓深度学习的“前提”

那么，传统计算力提供者转型做深度学习有什么优势呢？换句话讲，计算力和深度学习有什么关系？

浪潮成立AI事业部，计算力对深度学习有多重要？

Geoffrey Hinton

浪潮成立AI事业部，计算力对深度学习有多重要？

Yoshua Bengio

浪潮成立AI事业部，计算力对深度学习有多重要？

Yann LeCun

其实，深度学习可追溯到20世纪40年代，而经过数十年的发展，直到2006年左右，Hinton、Bengio、LeCun等大牛先后发布了多篇论文，才算正式掀起了深度学习的热潮，也拉开了AI第三次热潮的帷幕。

众所周知，深度学习技术的原理是采用高性能计算机建立模拟人脑进行分析学习的深度神经网络，让机器能够像人一样思考。为什么深度学习到第三次AI热潮的时间点才得以爆发呢？上世纪90年代，神经网络取得了重要进展，Hochreiter和Bengio采用LSTM（长短期记忆）来解决对长序列进行建模的难题。但是，很快这股热潮就退却了。其中，很大一部分原因就是因为那个时候，人们认为深度网络是难以训练的，其计算代价太高，而以当时可用的硬件难以进行足够的实验。

浪潮成立AI事业部，计算力对深度学习有多重要？

从更深层次说，人工神经网络在20世纪50年代就已经成功实验，为什么深度学习到现在才被认为是关键技术？答案是与日俱增的数据量。

由于人类的生产生活越来越多的依赖计算机，越来越多的数据就被记录在计算机上，而互联网将计算机与计算机由链接起来，“大数据”就产生了，而大数据才使得机器学习更加容易。

根据粗算，监督式的深度学习算法要想达到“可接受”的程度，每类给定的标注样本需要5000个，要想“超越”人类表现，所需的标注样本的数据集要超过1000万个。

总而言之，为了实现机器像人一样思考，需要进行海量数据的模型训练和提升应用扩展性，这对超算的计算效率要求十分巨大，数字说明一切。

浪潮成立AI事业部，计算力对深度学习有多重要？

图片来源：image-net.org

首先说说ImageNet，Geoffrey Hinton在2012年成功发表论文《ImageNet Classification with Deep Convolutional Neural Networks》，而此论文之所以得以发布正是基于Imagenet数据集，因此带来了计算机视觉领域的“革命”，极大推动了ImageNet对深度学习的贡献。而事实是，Imagenet数据集有1400多万幅图片，涵盖2万多个类别；其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。

浪潮成立AI事业部，计算力对深度学习有多重要？

图片来源：research.google.com/youtube8m/

比如谷歌发布的Youtube-8M，该数据集是开源的视频数据集，视频来自youtube，为了保证标签视频数据库的稳定性和质量，谷歌只采用浏览量超过1000的公共视频资源。据统计，Youtube-8M上共计有8百万个视频、总时长50万小时、4800类。

浪潮成立AI事业部，计算力对深度学习有多重要？

图片来源：lemurproject.org

再比如Clueweb09，它是用来支持信息检索和相关人类语言技术研究的资料库，包含了从2009年1月到2月间收集的大约10亿个网页、共10种语言。如果采用RNN算法模型训练Clueweb09英文数据集的话，需要涉及到200亿的参数变量，用现有的计算技术需要180年才能训练完所有数据。

也就是说，以现在超算的计算力，还无法完成“海量”的机器学习任务。

机器人圈在之前的文章（为何人工智能的发展离不开先进的计算平台？）曾经解释过，对于线下训练，GPU异构并行计算的技术架构比较适合模型的训练。而对于线上识别，FPGA的异构计算模式因低功耗、高性能、易编程等特点，就成为了深度学习的首选。

目前，浪潮已具备覆盖单机2、4、8卡在内的业界最全GPU服务器产品线，支持百度开发了专为训练优化的单机16卡扩展的PBOX-AI整机柜，并是唯一可提供深度学习FPGA加速卡的主流服务器厂商。

GPU方面，浪潮支持百度研发了面向更大规模数据集和深层神经网络的超级AI计算模块——PBOX-AI整柜机，这是行业首个单模块支持16GPU，并可堆叠扩展至64GPU的超高密度计算方案。而在FPGA方面，浪潮与英特尔合作研发的FPGA加速卡F10A，是目前业界支持OpenCL的最高密度最高性能的FPGA加速设备；同时，浪潮与Altera和科大讯飞，完成了基于OpenCL的FPGA线上深度学习语音识别加速方案。

超算大赛设“AI”赛题

浪潮成立AI事业部，计算力对深度学习有多重要？

ASC超算竞赛是浪潮联合亚洲超算协会共同发起的，至今已经举办了6年，其宗旨是推动青年人才培养的问题。今年比赛中的人工智能赛题来自百度深度学习研究院，让队员用提供的计算框架和真实的交通数据，自行开发脑模型训练数据，并快速、精准的预测出某个城市未来的交通情况。（详情请见：ASC17超算大赛总决赛来了！为何PaddlePaddle深度学习框架入赛题？）

其实，ASC超算竞赛中对人工智能的关注，不仅为学生搭建了深入了解、掌握最新人工智能算法等前沿科技的平台，还有助于锻炼学生动手解决问题的能力，帮助他们成为面向未来的复合型科技精英。这亦是希望通过比赛，能够激发更多年轻人对人工智能与超算的兴趣，解决目前中国AI人才准备不足的问题。

转型之年可期

接下来，浪潮在AI领域会有哪些动作呢？机器人圈了解到，近期浪潮将推出业界计算性能最强的深度学习超算服务器，持续开发优化开源并行深度学习框架，并为客户提供训练集群管理软件和性能优化工具，同时浪潮还将面向医疗、安防、金融等行业提供“端到端”人工智能解决方案，与合作伙伴一起构建完整的产业生态。

其实，一直在AI领域颇为低调的浪潮在该领域深入开拓。据统计，浪潮已占有中国AI计算服务器市场60%以上份额，与百度、阿里、腾讯、科大讯飞、奇虎360、搜狗、今日头条、Face++等人工智能领先公司保持在系统与应用方面的深入紧密合作，帮助客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。

浪潮人工智能与高性能产品部总经理刘军在财年大会上表示，浪潮希望为高速发展的人工智能应用需求不断创新设计&提供顶尖的AI计算产品方案。2017年浪潮将在人工智能计算的数据中心产品创新、深度学习算法框架优化、生态系统建设等方向全面发力。

2017将成为浪潮的战略转型关键之年，想必会动作频频，值得持续关注。