【原】够了！训练AI不能再靠暴力填鸭

造就Talk 2020-07-21

展开全文

近两年来，一种名叫“神经网络”的技术席卷了整个硅谷，许许多多的互联网服务都被注入了基于它开发的各种人工智能。

不过，人工智能的研究人员也清楚地知道，神经网络仍然存在很多缺陷，以至于一些人产生了疑问：这类模式识别系统是不是一条正确的路径，能否带领我们我们走向更先进、更可靠的人工智能？

从Facebook的人脸识别功能到微软（Microsoft）的翻译服务，再到谷歌（Google）的互联网搜索，它们背后都有神经网络的助力。因为神经网络能够通过分析海量数据来学习处理工作任务。

除此之外，神经网络正开始帮助聊天机器人学习会话的艺术，它也是自动驾驶汽车和其他自动化机器发展潮流的基石。

但是，如果没有大量结构化数据作为“粮食”，神经网络就无法理解这个世界，正因为如此，它们并不适合于处理一切工作任务。

此外，对于神经网络基于何种逻辑做出特定决策，人工智能研究人员能够掌握的洞见也是有限的。

在很多方面，神经网络就像是个不透明的黑箱，这可能会带来严重的问题：如果一辆自动驾驶汽车撞倒了一个人，如果我们并不能清楚知道其智能系统的决策逻辑，那如何才能了解事故原委？

“深度学习确实受到很多关注，而且它也当之无愧。但深度学习提供不了任何保证。”卡内基梅隆大学的计算机科学教授图奥马斯·桑德霍尔姆（Tuomas Sandholm）说道。他帮助开发了最近在德州扑克比赛中击败人类顶级选手的人工智能系统Libratus（该系统并未用到神经网络）。

新趋势

由于神经网络存在这些显而易见的弱点，世界上一些规模最大的科技公司现在正拓宽他们思考人工智能的方式。从这些公司最近招聘的员工、收购的公司、开展的研究以及众多初创公司纷纷跟进这些事情中，就可以看出一些线索来。

我们可以把这股潮流视为贝叶斯学派（一种探讨不确定性的学派）的崛起。该学派研究人员所用的方法，是从一个假说起步，然后基于数据来不断更新这一假说，而不是像神经网络那样仅仅依靠数据去推导结论。

把贝叶斯学派思想运用于人工智能，其目的是为了找出处理不确定性的方法，找出为现有模型馈入新证据的方法，以及找出能够解决神经网络所不擅长的问题的方法。

跟神经网络一样，贝叶斯方法（Bayesian methods）也可以从数据中学习，但这种类型的机器学习是以一种不同的方式进行的。

“我们感兴趣的是让这种科学方法实现自动化。”人工智能初创公司Gamalon的创始人本·维格达（Ben Vigoda）说道，该公司正在通过一种名为概率编程（probabilistic programming）的技术朝这个方向推进。

神秘技术

去年12月，当加里·马库斯（Gary Marcus）将自己的初创公司卖给Uber时，他也带来了一种新型人工智能。或者，他自己是这样说的。

马库斯的公司名为Geometric Intelligence，原来只有15人。规模虽小，但它做出的承诺却很大。马库斯是纽约大学的心理学教授，他说自己跟同事正在开发能够通过小样本数据展开学习的系统，就像人类所做的那样——这样的系统可能拥有超越深度神经网络的力量。

马库斯认为，对于打造能够与人会话的智能机器或是可以自主行驶在公路上的汽车，小样本数据系统至关重要。“语言领域和自动驾驶汽车领域面临着一些问题，我们永远无法拥有足够多的数据来供人工智能进行暴力填鸭式的学习。”马库斯说道。

说到底，我们不能在繁忙的道路上人为制造车祸来收集关于如何避免发生事故的数据。“现实情况是，要么是你买不到那些数据，要么就是数据不存在。”

马库斯和他的合伙人——剑桥大学的信息工程学教授佐宾·葛拉曼尼（Zoubin Ghahramani）——仍然不愿意谈论他们这种技术的细节。这在技术领域很常见，人工智能尤甚。

不过，葛拉曼尼也是贝叶斯学派的一员。他擅长一种特定类型的统计模型，名为高斯过程（Gaussian Process）。我们猜测，在他跟马库斯开发的技术中，高斯过程可能扮演着某种角色。

高斯过程

在某个层面上，高斯过程就是一种找到特定问题最佳解决方案的方法。它为另一种数学方法贝叶斯优化（Bayesian optimization）提供了支撑——贝叶斯！高斯！他们都是数学家！而且，现在已经有网站在利用高斯过程来确定应该展示什么广告以及主页应该采用何种设计。

Uber一直在招聘专门研究高斯过程的学者，来帮助提升自己的打车服务。在谷歌，该公司正借助高斯过程来控制其为普及互联网连接而放飞的高空气球。

从根本上讲，高斯过程是一种识别不确定性的好方法。“知道自己的无知是一件好事。”爱丁堡大学的人工智能研究人员克里斯·威廉姆斯（Chris Williams）说道，“犯下自信过错是你能做出的最糟糕事情。”

2015年，Twitter收购了一家名为Whetlab的初创公司，该公司利用高斯过程找到了一种设计神经网络的更好方法。设计神经网络是一项需要反复试验的任务，与其说你是在编写一款软件，倒不如说是试图从数据海洋中求得一个结果。这项任务困难重重且非常耗时，而高斯过程和贝叶斯优化可以帮助让该任务实现自动化。

正如WhetLab创始人、哈佛大学计算机科学家莱恩·亚当斯（Ryan Adams）所言，这家初创公司是使用“机器学习来提升机器学习”。神经网络可能受到“自信错误”的困扰，并难于识别不确定性，这种类型的优化正好可以帮助解决该问题。后来，亚当斯离开Twitter加盟了Google Brian，这是谷歌研究人工智能的核心团队。

此外，一些研究人员还认为，高斯过程利用小样本数据的能力将在推进人工智能的过程中发挥至关重要的作用。

“要创建一个真正自主的智能代理，它必须能够迅速适应自己所处的环境。”人工智能初创公司Prowler首席执行官维沙尔·查特拉斯（Vishal Chatrath）如是说，他曾与葛拉曼尼共事，“那意味着要能以最少的数据完成最高效的学习。”查特拉斯说，更重要的是，高斯过程易于理解。

跟神经网络不同，高斯过程不存在黑箱问题。如果发生了意外，我们可以追溯到原因。

“不要恐慌”

在Prowler，查特拉斯聘请了三位专门从事高斯过程研究的学者。该公司的总部设在英国剑桥，葛拉曼尼以及高斯过程和相关技术领域的很多其他专家也居住在那里。

目前，Prowler正在开发能够学习应对大型网络游戏和其他数字世界的人工智能系统。这是一项复杂的工作，但Prowler希望这是我们向那种能够学习应对现实世界的系统迈出的一步。

与此同时，亚马逊（Amazon）最近招募了贝叶斯方法研究领域的另一位重量级学者，他就是来自英国谢菲尔德大学的计算机科学家尼尔·劳伦斯（Neil Lawrence）。“不要恐慌。”劳伦斯最近在一篇博客文章中写道，“通过使用我们的数学工具来应对深度学习方法的新浪潮，我们可以确保它们在很大程度上仍然是无害的。”

翻译：何无鱼

来源：WIRED