杨强：人工智能的下一个技术风口与商业风口

lisikun 2017-05-24

展开全文

来源：《中国计算机学会通讯》2017年第5期《专栏》

AlphaGo为我们带来了什么

2016年3月，AlphaGo横空出世对战围棋九段棋手李世石，这对人工智能的社会影响非常大。AlphaGo到底为我们带来了什么？

在AlphaGo的搜索中，谷歌DeepMind团队引入了一个新概念——用深度学习和强化学习的结合来做两种任务的判别，即来判别现在所在的棋盘是好是坏，同时来预测未来有利的走向。由此可以看出AlphaGo的算法和未来商业模式的关联，即通过对大数据的分析，让我们对“现在状态”有了一个清晰的理解。这个状态可以是棋盘，可以是足球运动中两队交锋的状态，也可以是当前营销的一个状态。围棋中的一步，可以理解成对未来走向的预判，在商业活动中，是营销活动中的下一步。商业行为中对现实的判断和对商业未来走向的预估这两个任务同样重要，都需要大数据的支持。围棋是一个封闭式的游戏，没有外界因素的干扰，为了得到更多的数据，AlphaGo引入了自我博弈。所谓自我博弈就是自己玩游戏，你会不断得到反馈，然后来更新策略。经过无数次这样的比赛，最后会得到一个好的策略，最终输出是一个行为的策略。所以AlphaGo 告诉我们，在一个封闭场景中，可以用自我博弈的模拟方法得到更多的数据。

从AlphaGo到人工智能的应用流程

如果沿着下围棋的步骤走，就会面临一些问题：人工智能算法的目标是什么？有没有数据？数据在哪里？问题的边界是否清晰？什么叫合理的走法？什么叫犯规的走法？特征在哪里？如何得到这些特征？是否可以得到一个持续的反馈？这样的流程是AlphaGo设计团队所走过的路。不妨把这些步骤记下来，变成一个工作流，看看其他领域是否可以重复AlphaGo的成功。比如，如果用AlphaGo治疗癌症，该如何治疗呢？一般方法是用放射线杀死癌细胞，而每一个癌症患者需要的剂量、角度、频次可能都不一样，如果把所有信息和经过一段时间的治疗结果都记录下来，就有了数据、特征和问题持续的反馈，并且有了非常清晰的目标，即在副作用最小的情况下杀死癌细胞。并且这个工作流是可以重复的。

人工智能前30年的历史积累也很有用

我们对人工智能的理解不应该片面地认为就是机器学习。人工智能前30年的发展历史是从20世纪50年代中期到80年代中期。这30年间，人工智能在干什么呢？在做人工输入的规则型的知识表达研究，以及基于这些规则的符号空间的推理和搜索。笔者认为，人工规则型的知识表达在人工智能的应用中是必不可少的，因为在众多领域中会碰到冷启动问题，以及如何规范一个领域的边界问题。逻辑推理、逻辑知识表达以及在符号空间搜索的人工智能分支，在今后几年会和统计学习相结合，并有较大发展。这种发展也会涉及技术和商业两个层面。

人工智能的技术风口在哪儿？

大家普遍关心的一个问题是，人工智能技术在哪些方向可能会有大的突破。

深度学习

深度学习会继续发展。这里的发展不仅包括层次的增加，还包括深度学习的可解释性以及对深度学习所获得的结论的自我因果表达。例如，如何把非结构化数据作为原始数据，训练出一个统计模型，再把这个模型变成某种知识的表达——这是一种表示学习。这种技术对于非结构化数据，尤其对于自然语言里面的知识学习，是很有帮助的。另外，深度学习模型的结构设计是深度学习的一个难点。这些结构都是需要由人来设计的。如何让逻辑推理和深度学习一起工作，来增加深度学习的可解释性也是需要研究的问题。比如，建立一个贝叶斯模型需要设计者具有丰富的经验，到现在为止，基本上都是由人来设计的。如果我们能从深度学习的学习过程中衍生出一个贝叶斯模型，那么，学习、解释和推理就可以统一起来了。

迁移学习

迁移学习是笔者和戴文渊一直在做的工作。给定一个深度学习网络，比如一个encoder网络和一个decoder网络，观察它学习和迁移的过程，作为新的数据来训练另外一个可解释的模型，也可以作为一个新的迁移学习算法的输出。这就好比一个学生A在观察另外一个学生B学习，A的目的是学习B的学习方法，B不断地学习新的领域，每换一个领域就为A提供一个新的数据样本，A利用这些新的样本就能学会在领域之间做迁移。这种过程叫做观察网络。有了这种一边学习、一边学习学习方法的算法，就可以在机器学习的过程中学会迁移的方法。

自然语言的表示学习与机器阅读

表示学习是当数据和任务没有直接相关时也可以学，一个重要的例子叫做自学习(self-taught learning)，即我们通过很多监督的数据和图像，可以学出一种最好的表达。用这个表达加上任务就可以很快地学会这种知识表示。这时非结构化数据就相当有用了。比如，给出一段话让机器去阅读，机器学习可以自动地发现一些值得关注的点。再比如，给定一个文章中的实体和一个未知变量的关系，用户可以问你这个未知变量是什么。能够达到这样的效果是因为深度模型已经具有了一种关注，这种关注可以通过观众的学习来表达。其结果就好像我们读了一本书，把关键词和它们的关系抓取出来。这实际上是利用类似人的一种直觉来进行学习。

人机对话系统

有一个领域已经发展到了临界点，就是人机对话系统领域。在这个领域，某些相对垂直的方面已经获得了足够多的数据，比如客服和汽车（车内的人车对话）方面；还有一种是特定场景的特定任务，比如Amazon Echo，你可以和它讲话，可以说“你给我放首歌吧”或者“你播放一下新闻”，Amazon Echo里面有多个麦克风形成的阵列，围成一圈，这个阵列可以探测到人是否在和它说话，比如我把脸转过去和别人说话的时候，它就不会有反应，并且大规模地降低噪音。利用了硬件的优势，在家庭这个场景中，这种“唤醒功能”是非常准确的。它的另外一个功能是当你的双手无法控制手机的时候，可以用语音来控制，案例场景是客厅和厨房，在美国Amazon Echo特别受家庭主妇的欢迎。虽然它现在只有一问一答的形式，但有了准确的唤醒功能以后，给人的印象就好像它可以进行多轮问答的复杂对话。所以，当有了人工智能应用的特定场景，如果收集了足够多足够好的数据，是可以训练出强大的对话系统来的。

深度、强化迁移学习

在未来，我们把深度学习、强化学习和迁移学习相结合，可以实现几个突破——反馈可以延迟，通用的模型可以个性化，可以解决冷启动的问题等。这样一个复合模型叫做深度、强化迁移学习模型。

人工智能的可靠性模型

人工智能系统的鲁棒性，或“AI as Reliable Services，”是AAAI前主席托马斯(Thomas Dietterich)在AAAI 2016上给出的一个主题。人工智能只能作为一些例证证明能够做哪些事情，比如下棋、无人驾驶，但很多时候它还是不可靠的。人工智能不像商用软件，能让人放心地使用，保证错误率不会高于很小的比例。相反，人工智能在犯错的时候可能会错得非常厉害，所以用平均值来代表一个准确率是不恰当的，应该更多地考虑它的置信区间。换言之，“小白”用户用一些人工智能模块搭建一个系统，这个系统就应该能被搭建出来，而且它的效果应该在一个固定的范围以内，所以人工智能应该像软件工程一样做出来。

第四范式公司的核心产品“先知平台”就一直朝着“可靠性”这个方向发展，把人工智能的模块工程化，并在一定程度上保证了可靠性，从而让普通用户来搭建自己的人工智能系统。

AI的商业风口在哪？

人工智能成功的五大必要条件是高质量的大数据、清晰的问题定义和领域边界、懂人工智能且擅长应用和算法的跨界人才、足够的计算资源、持续的外部反馈。满足这五个条件的领域才有可能在未来出现人工智能的爆发。下面，我们就看看有哪些可能爆发的商业场景。

智能客服

人机交互的智能客服会产生很多外界公开的数据以及内部的数据、知识库等。这些数据都可以用来制造机器人，尤其是可以用过去的数据来做训练。这个数据量在垂直领域逐渐增加。现在的对话系统也已逐渐成为深度学习和强化学习的焦点。在客服需求量大，而服务内容垂直的应用领域，对话系统会发挥巨大作用。

新闻领域

新闻领域也是人工智能的另一个商业风口。此领域有很多编辑、解说、自动校对、作家等，数据量足够大，而且外界反馈也越来越多。对于一篇文章，可以用机器学习来自动提取摘要。工作的外部反馈来自哪里呢？实际上我们写的那些论文就是一个外部反馈，因为每篇论文都有摘要。如果一篇论文被录用了，就说明这篇论文的摘要写得不错，所以外部反馈是可以实现的。

这里分享一个有趣的实验，是香港科技大学的学生做的“自动写小说”项目。主要有两个步骤，一步是让它读很多书，一步是训练出一个模型。这个模型再变成一个生成式的模型，就能用来写小说了。比如，我们提供《射雕英雄传》和《笑傲江湖》两部小说，把这两个结合起来，就可以写一部新的小说了。

特定任务的智能机器人

提起机器人的仓储应用，亚马逊(Amazon)为我们带了一个好头，它所有的仓储都是由机器人KIVA来完成的。即使用了机器人，亚马逊的仓储应用中也有人工的成分，即工人被雇用来做物件的抓取。这是因为，机器人的抓取在现阶段要做好还非常难。如果把人和机器的优点结合起来，就可以解决仓储和供应链中的一个大问题。此外，医疗机器人也是非常专业的一个领域，它可以给人开刀缝线，但它现在还不是自动的，而是通过远程控制的，控制的精密度非常高。如果医疗机器人能够收集到足量的数据，是可以达到自动的效果的，以后给病人开刀可能就由机器人来代劳了。

在医护领域，无障碍辅助的应用领域痛点特别强烈，现在的数据量还不是特别多，因为这一领域面向的群体毕竟是少数人，未来也许会有数据。

人工智能+有机食品

笔者在香港曾访问过一个有机食品工厂。工厂实验室里的每一棵菜周边的所有环境全都被记录下来，比如湿度、温度、光照，然后收集这样的数据训练一个机器学习模型，最后用这个模型来种植蔬菜。这样可以控制蔬菜的口感和口味，脆的还是甜的，都可以通过模型学习出来。

Fintech智能投顾

金融是一个非常好的领域，第四范式在金融领域也积累了很多成功案例。金融领域里的任务都是非常清楚的，而且每个任务的数据都有足迹，数据的维度是多维的，有外界的，也有内部的，非结构数据也比较多，例如文本和报告。数据形成了孤岛，链条非常长，并且链条里面都有衔接。

在金融领域，美国有一个比较时髦的概念叫“投研、投顾和投资”。投研是研究整个市场的基本面，就好像做舆情分析一样，但舆情只是其中的一部分；投顾是在银行给客户做理财分析，做理财的配置，这些工作可以由机器人完成；投资是机器人本身作为一个客户，可以去投资。

多年后的人工智能社会

笔者认为，未来应该是几个人运作一个公司，每个人都能率领成千上万个机器人，这些机器人做不同的且擅长的事情。现在在一个传统行业里，往往是20%的人在做80%的工作，那么这20%的人就是未来运营公司的人，剩下的80%的人所做的工作将交由机器来完成。一个公司的自动化、智能化程度，代表了这个公司在商业上的反应速度和竞争力。

人工智能给人类带来的变革是非常深远的。人工智能不仅仅是一场比赛、一个应用，而是使整个社会在真正地、彻底地改变。机器和人将成为一个共同的“军队”，不断地攻克堡垒，推动人类向更好的方向发展。

作者：