2018年02月18日 野草是小米的超级版主
一. 华为发布麒麟 970,人工智能行业热潮再起 1. 华为发布全球首款内置 NPU 人工智能处理器-麒麟 970 华为在 IFA2017 大会上公布的麒麟 970 处理器引起了业内关注,它的到来彻底打破了唯频率和核数崇拜的传统观念。 根据其公开的信息,麒麟 970 处理器采用了 10nm 工艺制程(与苹果即将发布用在 iPhone 8 上的 A11 处理器工艺相同),搭载了 Cortex-A73(CPU)、Mali-G72(GPU)和麒麟 NPU(神经网络处理单元)。 创新在于异构与端云结合。麒麟 970 采用异构架构完成人工智能处理,芯片括了 CPU(中央处理器)、GPU(图形处理器)、NPU(神经网络处理单元)、ISP(图像信号处理)、DSP(数字信号处理)。 NPU 在实现 AI 上承担主要工作,但 CPU、GPU 等也参与处理。未来以异构架构实现人工智能将成为主流,这个异构 SoC 将成为一个 AI 计算平台。 麒麟 970 的另一创新之处在于端云结合实现人工智能,云端智能的优势在于强大的运算能力,基于大数据给出大智慧,在策略性输出上有极大优势。而端侧在具备了强大的感知能力之后,手机就会成为帮助用户思考的分身和伙伴。两者达成平衡与协调,才是未来终端发展的出路。 华为麒麟 970 芯片的发布再次点燃了市场对人工智能领域的关注。 2. 人工智能热潮再起 1946 年,计算机诞生;1956 年人工智能(AI)诞生;1969 年互联网诞生......近期无论是华为的麒麟 970 芯片,还是 AlphaGo 与柯洁的人机大战,人工智能领域再度风起云涌。 人工智能正席卷安防、人脸识别、自动驾驶等多个领域。就当前的现状来看,大部分业内人士都认为最先被人工智能“革命”的行业非金融业莫属。 曾经,高盛在纽约总部的美国现金股票交易柜台的交易员曾一度高达 600 人,而现在偌大的交易大厅却只有两个人值守。 根据埃森哲今年发布的报告《人工智能:助力中国经济增长》预测,到 2035年人工智能有潜力拉动中国经济年增长率上升 1.6 个百分点。 人工智能将成为一种全新生产要素,与资本、劳动力拥有同等重要地位,将成为拉动中国经济增长的新动力。 而人工智能芯片作为人工智能的核心要素,已成为各国未来发展布局的战略性一环。 二. 人工智能芯片的崛起之路 1. 什么是人工智能芯片?为什么需要它? 人工智能的实现依赖三个要素:算法是核心,硬件和数据是基础,芯片就是硬件的最重要组成部分。它其实包括两个计算过程:1、训练(Train);2、应用(Inference)。 为什么需要人工智能芯片?深度学习作为机器学习的分支,是当前人工智能研究的主流方式。 简单说就是用数学方法模拟人脑神经网络,用大量数据训练机器来模拟人脑学习过程,其本质是把传统算法问题转化为数据和计算问题。 所以对底层基础芯片的要求也发生了根本性改变:人工智能芯片的设计目的不是为了执行指令,而是为了大量数据训练和应用的计算。 2.现在处于弱人工智能、感知智能的初步阶段 人工智能的阶段可分为弱人工智能、强人工智能、超人工智能;也可分为计算智能、感知智能、认知智能三个阶段。 计算智能是最初级的,主要是计算能力的进化,这有赖于算法的优化和硬件(CPU 芯片)的技术进步。感知智能有赖于数据获取技术,目前主要有语音识别和机器视觉两种技术。 认知智能是最高级的形态,也是未来需要突破的方向。目前阶段,人工智能处于弱人工智能,刚刚进入感知智能时代。 人工智能发展进程: 3.人工智能已成为各国战略布局的重要一环 根据腾讯研究院发布的《中美两国人工智能产业发展全面解读》,截止到2017 年 6 月,全球人工智能企业总数达到 2542 家,美国拥有 1078 家,占据 42%; 中国其次,拥有 592 家,占据 23%。其余 872 家企业分布在瑞典、新加坡、日本、英国、澳大利亚、以色列、印度等国家。 人工智能是当前人类所面对的最为重要的技术社会变革,是互联网诞生以来的第二次技术社会形态在全球的萌芽,因此也成为各国战略布局的重要一环。 2017 年 7 月,国务院印发《新一代人工智能发展规划》,明确了我国发展人工智能的战略目标:到 2030 年,人工智能核心产业规模超过 1 万亿元,带动相关产业规模超过 10 万亿元。其他各国也分别从国家层面对人工智能产业进行战略布局。 三、AI 芯片三种技术路线,ASIC 是终端应用的趋势 目前适合深度学习的人工智能芯片主要有 GPU、FPGA、ASIC 三种技术路线。 三类芯片代表分别有英伟达(NVIDIA)的 Tesla 系列 GPU、赛灵思(Xilinx)的 FPGA 和 Google 的 TPU。 1.GPU:最先被引入深度学习,技术成熟 图形处理器 GPU 最初是用在个人电脑、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,可以快速地处理图像上的每一个像素点。其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习。 GPU 不是完全代替 CPU,而是两者分工合作。在 GPU 计算中 CPU 和 GPU之间是相连的,而且是一个异构的计算环境。 这就意味着应用程序当中,顺序执行这一部分的代码是在 CPU 里面进行执行的,而并行的也就是计算密集这一部分是在 GPU 里面进行。 2.FPGA:具有硬件可编程特点,性能出众壁垒高 FPGA 即场效可编程逻辑闸阵列,一个出厂后的成品 FPGA 的逻辑块和连接可以按照设计者的需要而改变。 FPGA 是可编程的,而 GPU 由于架构固定,硬件原生支持的指令也就固定了。 其可编程性是关键,因为它让软件与终端应用公司能够提供与其竞争对手不同的解决方案,并且能够灵活地针对自己所用的算法修改电路。 FPGA 市场前景诱人,但是门槛之高在芯片行业里无出其右。 ibm、德州仪器、飞利浦、东芝、三星等 60 多家公司先后斥资数十亿美元投入这个行业,但是最终成功的只有位于美国硅谷的两家公司:Xilinx 与 Altera(被 Intel 收购)。 这两家公司共占有近 90%的市场份额,专利达到 6000 余项之多,如此之多的技术专利也构成了极高的技术壁垒。 赛灵思(Xilinx)表示,相较于仅使用 CPU 的服务器,使用百度 FPGA 云端服务器在赛灵思 FPGA 所驱动的服务器中,提供 10~80 倍的每瓦效能比。 目标市场方面,FPGA 成本太高,所以适合对价格不是很敏感的地方,比如企业应用,军事和工业电子等等。 3.ASIC:未来移动端人工智能硬件的方向 ASIC(Application Specific Integrated Circuit)是专用集成电路,是为专门目的而设计。 它是应特定用户要求和特定电子系统的需要而设计、制造的集成电路。ASIC 的特点是面向特定用户的需求,ASIC 在批量生产时与通用集成电路相比具有体积更小、功耗更低、可靠性提高、成本降低等优点。 FPGA 上市速度快,但性能较低。ASIC 上市速度慢,需要大量时间开发,而且一次性成本(光刻掩模制作成本)远高于 FPGA,但是性能远高于 FPGA且量产后平均成本远低于 FPGA。 FPGA 可以完全重配置,但是 ASIC 也有一定的可配置能力,只要在设计的时候就把电路做成某些参数可调的即可。 目标市场方面,ASIC 由于低成本适合消费电子类应用,是未来移动端人工智能硬件的发展方向。像大疆无人机的 Movidius Myriad 芯片、Tesla 汽车自动驾驶曾用的 Mobileye 芯片和 Google 的张量处理器 TPU 都是 ASIC 的代表。 四、科技巨头加紧布局 AI 芯片,寒武纪跻身国际前列 全球科技巨头都在加紧布局 AI 芯片,希望走在科技变革时代的前线。 NVIDIA 是 AI 芯片的市场领先者,占据了全球 GPU 70%的市场份额;Intel接连收购 Altera、Nervana、Movidius,全方位布局 AI 产品; Google 发布两代 TPU,从 ASIC 方向进军 AI 芯片市场;寒武纪科技是中科院计算所孵化的一家独角兽公司。2016 年推出了国际首个深度学习专用处理器芯片(NPU),技术全球领先。 1.NVIDIA:GPU 龙头,AI 芯片的市场领先者 目前全球 GPU 行业的市场份额有超过 70%被英伟达公司占据。而应用在人工智能领域的可进行通用计算的 GPU 市场则基本被英伟达公司垄断。 自 1999 年发布第一款 GPU 以来,GPU 就成为了英伟达最为核心的产品,占到了英伟达总营业收入的八成以上。英伟达的股价表现也是十分惊人,2016 年英伟达的股价上涨了 228%,过去的 5 年内累计上涨 500%。 2.Intel:全领域布局人工智能产品 2015 年,英特尔以 167 亿美元收购了 FPGA 制造商 Altera。英特尔斥巨资收购 Altera 不是来为 FPGA 技术发展做贡献的,而是要让 FPGA 技术为英特尔的发展做贡献。 表现在技术路线图上,就是从现在分立的 CPU 芯片+分立的 FPGA 加速芯片,过渡到同一封装内的 CPU 晶片+FPGA 晶片,到最终的集成 CPU+FPGA 芯片。 预计这几种产品形式将会长期共存,因为分立器件虽然性能稍差,但灵活性更高。 3.Google:发布两代 TPU,从 ASIC 方向进军 AI 芯片市场 第一代 TPU 展现出 ASIC 在神经网络推断方面的优秀性能。谷歌在 2016 年的 I/O 大会上推出了自己的 AI 芯片——张量处理器 TPU(第一代)。 第二代 TPU 兼具推理+训练。2017 年 5 月 I/O 大会上,谷歌发布了第二代TPU—Cloud TPU,峰值性能达到 180 TFLOPS/s。第一代 TPU 只加速推理,但第二代 TPU 新增了训练的功能。 不仅如此,谷歌的用户还能通过专门的网络,在云端利用 TPU 构建机器学习的超级计算机。 4.寒武纪:全球 AI 芯片领域第一个独角兽初创公司 寒武纪科技(Cambricon)是中科院计算所孵化的一家独角兽公司。 2016年推出的寒武纪 1A 处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,其搭载了国际首个深度学习专用处理器芯片(NPU)(属于 ASIC),面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,并于 2017 年 8 月获得了包括阿里在内的 1 亿美元 A 轮融资。 CPU、GPU 与 NPU 相比,会有百倍以上的性能或能耗比差距。 在若干代表性神经网络上的实验结果表明——寒武纪的 DianNao 处理器的平均性能超过主流 CPU 核的 100 倍,但是面积和功耗仅为 1/10,效能提升可达三个数量级;DianNao 的平均性能与主流 GPGPU 相当,但面积和功耗仅为主流GPGPU 百分之一量级。 5.其他 AI 芯片参与企业 其他国内外参与 AI 芯片产业的科技公司及初创企业如下表。获取本文完整报告请百度搜索“乐晴智库”。 AI 芯片是人工智能领域的上游,基于 AI 芯片的下游场景应用极为丰富,包括安防、消费电子、自动驾驶、可穿戴设备等。 |
|