2019年人工智能全景报告

mrjiangkai 2019-11-16

展开全文

2019 年6月，国际著名人工智能天使投资人 Ian Hogarth与 Nathan Benaich 合著发布《 2019年人工智能全景报告》。报告从研究、人才、行业、政治等方面，总结了过去一年人工智能相关研究和技术进步、人才发展趋势、产业格局变化和各国政策动向，并对未来一年进行了预测。同时，报告详细分析了中国人工智能技术在日常消费、农业、机器人和半导体等领域的进展。报告认为，人工智能将成为全球科技进步的加速器，为驾驭如此巨大的转型，必须全面深入地了解人工智能各方面。

一、研究与技术突破

（一）强化学习开辟新天地

1、强化学习在游戏领域表现卓越
DeepMind公司使用多智能体训练算法完成的 AlphaStar 系统可以综合各种最为有效的策略组合并创建一个相互竞争的智能体联盟，来共同探索巨大的策略空间。AlphaStar 在《星际争霸》等策略类游戏中表现突出。另外，人工智能模型 OpenAI Five的智能程度进一步得到提升，与2018年8月份版本的 OpenAI Five相比， 2019 年 4 月份版本的 OpenAI Five 的训练计算量增加了8倍，在《魔兽争霸 2》和《雷神之锤 III 竞技场夺旗》等游戏中纷纷战胜人类。

2、智能机器人训练过程更加注重与真实环境交互
强化学习模型的“ 驱动式学习”概念被提出，即通过“ 观摩游戏” 的策略训练一台机器人同时执行多项复杂任务，对于每项任务无需进行单独的针对性训练。在该策略中，训练人员可以远程操控智能机器人，使之用各种方式与外界环境进行交互，从多个维度对智能机器人在真实环境中进行训练，与针对单一任务训练相比训练效率和训练效果均得到提升。在基于驱动式的训练中，智能机器人不仅能学习尽可能多样化的技能，并使每项技能均对扰动具有鲁棒性。例如，加州大学伯克利分校的机器人学习实验对 BLUE 机械臂进行了实际环境中的训练，使其在手动灵活性方面取得了巨大进步。

3、强化学习训练趋向于线上规划学习动态模型
谷歌训练的强化学习网络 PlaNet可以从图像中学习环境动态信息，并通过准确预测数个时间段后的奖励进行线上规划，选择将要进行的动作。这种训练方式与最先进的 A3C 和 D4PG 算法相比，在训练时间大致相同的情况，使模拟环境交互作用减少了50倍（表 1）。经过 2000 张图像训练之后，PlaNet 的表现与受过10万张图像训练的 D4PG 算法基本相似。

表 1： PlaNet 模型与其他模型训练效果对比表

（二）机器学习在生命科学领域发现新应用
1、 AlphaFold模型预测蛋白质的 3D 结构
DeepMind 公司训练的 AlphaFold 能够使两个深度卷积神经网络协同工作，第一个神经网络预测氨基酸对之间的距离，第二个神经网络预测连接这些氨基酸的化学键之间的角度，并创建蛋白
质距离图来生成 3D 蛋白质结构。该方法在预测蛋白质 3D 结构上远远超过先前最先进水平，给未来机器学习在生物学方面的广泛应用指明了方向。

2、机器学习算法合成化学分子
上海大学马克·沃勒（Mark Waller）教授团队同时使用三种不同的神经网络并结合蒙特卡洛树搜索组成了 3N-MCTS 算法。3N-MCTS 算法通过提出有限数量的自动提取转换将搜索引向最
正确的方向，并预测拟议的反应是否真正可行。在化学分子合成方面， 3N-MCTS 算法可解算 80％以上的分子测试集，每个目标分子的时间限制为 5 秒，与现有先进的计算机辅助合成规划相比，
合成速度大大提升。

3、深度学习与医学融合加深
随着深度学习、计算机视觉等技术的发展，人工智能被越来越多的应用于眼部疾病、心脏疾病的诊断。基于 3D U-Net架构的神经网络可以进行数字光学计算机断层摄影扫描，并创建眼睛的“组织图”，并通过该组织图对患者病症进行种类和严重性的分级分类。另外，接受过 5.4 万名患者训练的端到端深度学习网络在心脏病诊断领域已经达到人类专家级水平，以门诊中的单导联心电图轨迹作为原始数据，深度学习网络已经可以成功分辨12种心律类别。

4、脑机接口成为发展热点
哥伦比亚大学的研究人员通过深度学习技术分析癫痫患者在连续收听语音时的脑经神信号，能够对病人想要表达内容进行语音合成，准确度达到 75%。另外，神经网络被证明可恢复残疾人士的肢体控制能力。研究人员根据从患者大脑记录的原始颅内电压信号对神经网络进行训练，神经网络可以判断手臂的预期活动，并使用电刺激和神经网络解码器永久恢复四肢瘫痪患者前臂的运动能力。相比于支持向量机（SVM）技术，神经网络方法对故障更具鲁棒性，并可以通过迁移学习技术使患者掌握新的动作。

（三）自然语言处理实现突破式发展

1、预训练语言模型
谷歌 BERT 模型、艾伦研究所 ELMo 模型、鲁德和霍华德ULMFiT 模型和微软 MT-DNN 模型纷纷证明预训练语言模型可大大提高各种自然语言处理任务的性能。通过使用网络上的未标记文本对神经网络进行训练，可以在自然语言处理任务中创造收益，并创建多种新的商业应用程序，就像 ImageNet 迁移学习驱动了计算机视觉的更多工业应用一样。

2、无双语语料情况下的机器翻译
脸书（Facebook）展示了如何充分利用单语数据，以扩大机器翻译的应用范围。该技术首先通过自动推断双语词典将模型初始化，并利用去噪自动编码器来充分利用较强的语言模型，其中，由编码器构建的表征只能在当前两种翻译语言之间共享。这项工作将若干原理应用于开发简单易懂的、基于短语的统计型机器翻译（PBSMT）系统和神经机器翻译（NMT）系统，神经机器翻译系统学习如何在无双语文本的情况下进行翻译。

3、通用语言理解评估基准
新性能基准，即通用语言理解评估（GLUE），可测试自然语言处理模型在各种语言理解任务上的表现。人类对语言的理解较为概括和灵活,通用语言理解评估基准测试为在跨逻辑、常识理解和词汇语义任务中评估自然语言处理系统提供了单一基准,基准测试旨在支持各系统共享各项任务的一般语言知识。

二、人才

（一）人工智能论文发表情况

1、谷歌在人工智能领域仍占据主导地位
在 2018 年神经信息处理系统大会上，谷歌依旧占据主导地位，在以第一作者发表论文数量的排名中，谷歌仍旧位列榜首（表2）。
表 2： 2017-2018 各大机构发表第一作者论文数量对比

2、欧洲发表论文数量最多，中国的平均引用率不断增长
美国和欧洲在人工智能科研领域仍然具有更高的影响力，来自美国的人工智能领域研究成果被引用率比全球平均水平高出83%，来自欧洲的人工智能论文总量占据世界第一，我国人工智能领域研究成果的影响因子虽然在过去一年呈现上升趋势，但总体被引用率仍低于世界平均水平（图 1）。

图 1：各地区人工智能作者的领域加权引用影响力（ 1998-2016 年）

（二）中美高校加大人工智能人才培养

中美各大高校纷纷加大对人工智能研究型人才培养的力度。2018-2019 年，全球人工智能领域 44%的博士毕业生来自美国，中国排名第二为 11%。中美各大高校纷纷加大对人工智能布局力度（图 2），麻省理工学院在计算与人工智能领域新增投资 10 亿美元，加速人工智能迈向新一代，与 2012 年相比，清华大学和斯坦福大学的人工智能课程注册人数分别增加了近 16 倍和 5 倍。

图 2：入门级人工智能课程注册人数增长率（ 2012-2017 年）

（三）人工智能人才薪资结构面临调整

高端人工智能人才薪资不断上升，大型科技企业内资深工程师的年薪接近 100 万美元。另一方面，每小时 1.47 美元的数据标签工作岗位却实现了巨大增长。如总部位于北京的马达智数公司（Mada Code）将微软和卡内基梅隆视为客户，并声称拥有一支由 2 万多名自由职业者组成的团队，为其标注数据。

（四）产业人才需求发生变化
从产业人才发展看，加拿大、英国和瑞士是人工智能产业人才的“平台型”国家，吸引外国人才和对外国输出本土人才的数量均较多。美国和中国是人工智能产业人才的“稳定型”国家，两国人工智能产业发展处于全球领先地位，生态系统内部更为成熟、稳定，两国人才流入和流出均趋于平缓。同时，中美两国的大型科技企业对人工智能专项人才的需求量自去年起有所下降，这说明人工智能产业发展已经从科学研究阶段向应用落地转化。

三、行业

（一）人工智能领域投资情况分析

图 3：全球人工智能领域投资情况图 4：全球各地区人工智能投资占比
（投入资本单位：百万美元）

人工智能领域风险投资金额逐年扩大， 2018 财年的资本投资比 2017 财年高出 80%左右（图 3），其中北美地区投资最多，占有 55%的市场份额（图 4）。另外，大型科技企业收购人工智能初创企业趋势愈演愈烈。自 2010 年以来， GAFAM5已累计收购60 家人工智能初创企业（图 5）。

图 5：各大科技巨头收购人工智能初创企业数量

（二）智能机器进入落地应用阶段

1、智能机器人进一步发展成熟
各大智能机器人制造企业纷纷采取行动。艾波比集团（ABB）投资 1.5 亿美元，用于在上海建设全球最先进、自动化程度最高、最灵活的机器人工厂。另外智能机器人全栈初创企业发展迅猛，人工智能初创企业 Bright Machines由欧特克和伟创力国际公司的元老领导，首轮融资筹集了 1.79 亿美元，雇员增长到 300 人，以催生由智能化软件定义机器自动制造产品的制造模式。

2、智能机器人与其他行业结合日益密切
美国工厂安装的机器人数量创历史新高。 2018 年，美国工厂新增了 35880 台机器人，比 2017 年增加了 7%。图 6 显示了2011-2018 年各个行业中机器人数量变化情况。

图 6： 2011 至 2018 年间各行业的机器人数量
（单位：台）

智能机器人推动了制造业的智能化发展。智能机器人制造公司伯克希尔格雷（BerkshireGrey）提供了自动拣选机器人、移动式地面机器人系统以及产品包装与分拣解决方案，以提高吞吐量，并简化电子商务运营的实际供应链。

（三）亚马逊扩大其运营基础设施并推出仓储机器人

2016 至 2019 年，亚马逊在美国总部的运营中心建筑面积增加了 45%，数量增加了两倍。同时，亚马逊推出了更多仓库机器人，用于运营和分拣，其仓库中有 20 万台机器人，数量高于本年初所宣布的 10 万台。亚马逊近期着力对其仓库进行诸多改进，例如，防止阳光照射天花板天窗以减少眩光、在地面上安装 QR码、重新定向空调等以免吹动周围的轻质物体等，方便机器人巡视。

（四）自动驾驶汽车现规模扩大市场前景广阔

一年来，自动驾驶汽车市场规模不断扩大并已达到数十亿美元。通用（General Electric）旗下自动驾驶汽车公司 Cruise 融资后估值达 190 亿美元， 2018 年 Cruise 预算达到 7.28 亿美元， 2019年预算将增至 10 亿美元。优步方面， 2016 至 2018 年，优步每年在自动驾驶上的研发支出分别为 2.3 亿美元、 3.84 亿美元、 4.57亿美元，员工人数超 1000 人，融资后估值达到 72.5 亿美元。谷歌旗下公司 Waymo 运营成本在 10 亿美元以上，目前正在寻找外部投资者。同为自动驾驶汽车公司的 Nuro 和 Aurora，前者在三年内完成了由软银远景基金主导的 B 轮融资，融资金额高达 9.4亿美元，后者从红杉资本、亚马逊和美国普信集团手中获得了 5.3亿美元的 B 轮融资，增强了其资产负债表的财务实力，所筹资金已增至 6 亿美元。福特则为研发自动驾驶拨款 40 亿美元。自动驾驶汽车测试里程和保有量增减不一。 2018 年 Waymo无人驾驶汽车行驶 100 多万英里，是第二名 Cruise 的 2.8 倍，是第三名苹果的 16 倍。 2018 年，在加利福尼亚汽车行驶里程为14435 英里，自动驾驶汽车行驶里程仅占人类的驾驶里程数的0.00066％，加利福尼亚和世界各地的自动驾驶车辆有所增加，但仍有多个国家有所减少。

图 7：全球机动车管理局批准总数图 8：各国具有自动驾驶汽车城市数量
（单位：辆）（单位：个）

（五）进行需求预测

机器学习将推动各行业预测性需求的发展。能源领域，Invenia 公司是这一领域的早期领导者，可利用天气信息、电网运行数据和电力输送方向来预测需求。防灾预测领域，一些企业使用机器学习自动校准对了解、预测和管理水资源至关重要的水文模型。出行领域，航班和酒店需求随季节、天气或大型外部事件而波动。可将机器学习加以扩展，帮助航空公司和酒店进行需求预测。机器学习系统可帮助预测酒店潜在预订、特定航线需求，或服务中断情况。物流领域，概率模型和多智能体系统可用于学
习如何最为合理地分配资源（如车队），以应对动态变化的需求，使资源利用率最大化。资源配置最优化问题一旦解决，具有广泛的应用前景。零售领域， BlueYonder 人工智能平台使莫里森（英
国的连锁超市）的 2000 万项补货决策中有 99％完全自动化，同时提高了盈利能力，并减少了浪费。

（六）改进机器的阅读能力

自然语言处理方面的突破已开始应用于需要处理大量文本或快速处理文本会带来大量经济回报的行业。机器学习非常适合于金融和情报领域，从大量在线数据中获取重要信号，机器可用分析文本的增长速度快于人工分析师，成为专业分析师的得力助手，使得机器学习广泛应用于企业领域。例如，自然语言处理公司Primer 使用自然语言处理与生成来自动执行查找、阅读、交叉引用和总结等通常由分析员承担的任务。

（七）医疗保健进展

2018-2019 年，美国食品药物管理局批准了三种基于人工智能的医疗器械。 2018 年 4 月批准 IDx 软件通过眼睛扫描检测糖尿病视网膜病变。 2018 年 5 月批准 Imagen 软件通过二维 X 光片检测成年患者的腕关节骨折，预期用途涵盖初级保健、急救医学、紧急护理和整形外科。 2018 年 11 月批准 MaxQ 软件通过对成人非造影头部计算机断层扫描（CT）病例的临床评估，优先对有颅内出血迹象的患者进行治疗。同时，制药企业与人工智能驱动的药物开发公司正在加强合作。

（八）人工智能专利进展

2012 至 2017 年，人工智能同族专利的增长率高于人工智能科学出版物（年度增长率分别为 28%和 6%，图 9）。随着机器学习的商业应用不断扩大，科学论文与专利数量的比值急剧下降。其中，计算机视觉是最为热门的专利领域（图 10），而在计算机视觉领域中，最为热门的是生物统计学（即与生物数据有关的应用）。

（九）人工智能硬件

一年来，移动芯片组的人工智能性能基准制定工作不断推进，市场竞争压力加剧。美国高通公司的骁龙（Snapdragon）处理器通过展示浮动和量化神经网络方面的强大性能和硬件加速而获胜。基准测试任务包括分类、人脸识别、去模糊、超分辨率、分割和增强；在对手机的人工智能任务性能进行基准测试方面，三星、华为和小米手机位居榜首，谷歌的 Pixel3 手机排名第 22 位。

谷歌、英伟达、亚马逊则将计算和竞争推向极致加入竞争，预计到 2025 年，为人工智能服务的应用可生成 40 万亿 GB 数据。

（十） 5G 将成为普遍存在人工智能计算的支柱

5G 可为人工智能计算提供更快、更稳定的信息传输。目前，中国的 5G 进展远远领先于美国。据估计，华为占据了全球 28％的电信市场，根据德国专利数据公司 IPlytics 的数据显示，华为拥有的 5G 标准专利最多（1529 项），其次是芬兰的诺基亚（1397项）。华为既拥有专利优势，也有最大的商业动力，有望成为构建网络供应商、设备制造商和应用开发商生态系统的关键参与者。

四、对未来一年人工智能发展的预测

预计从 2019 年 6 月起的未来 12 个月，将有一批新初创企业正在应用近期在自然语言处理领域实现的研究突破，上述企业将集体筹集 1 亿多美元。分领域看，自动驾驶技术仍主要处于研发阶段，未来 1 年所有自动驾驶汽车公司的行驶里程将均不超过1500 万英里。在隐私保护方面，财富 2000 强企业中将有一家除谷歌、苹果、 Facebook、亚马逊、微软之外的公司采用隐私保护机器学习技术，以增强其数据安全性和用户隐私政策。在高等教育方面，越来越多的机构将设立专门的人工智能本科学位，以填补人才空缺。在 AI 量子计算方面，谷歌在量子计算硬件方面取得了重大突破，将催生至少 5 家尝试进行量子机器学习的初创公司。此外，随着人工智能系统的日益强大，人工智能治理将成为一个更大的争议话题。至少将有一家大型人工智能企业对其治理模式做出了重大变革。