来源:dupress.com,新智元 译者:胡祥杰 张冬君 闻菲
物联网传感器源源不断产生的数据、云计算以及机器学习的发展,引起了人工智能的复兴。而人工智能将有可能重塑人与计算机的关系。有句话说得好——数据是新的石油。计算机科学家Jon Kleinberg对此评论说,“这个词本身是含糊的,但是它指代的事情是真的……大数据指的是将会改变一切事物的过程。”
一个基于大数据和机器学习的典型AI应用就是谷歌翻译。谷歌翻译工具的开发,不是将语言的基本规则编码为计算机算法,而是从无数先前翻译的文档中提取词语的关联。随着训练该算法的文本语料库的增长,该算法也得到不断的改进。在他们的影响力的文章“数据的有效性不合理,”谷歌的研究员Alon Halevy、Peter Norvig和Fernando Pereira在他们颇具影响力的论文“The unreasonable effectiveness of data”中评论道:
简单的模型和大量的数据总是胜过基于较少数据的复杂的模型……目前,统计翻译模型主要包括大量的记忆短语表,这些短语表给出具体的源语言和目标语言短语之间的可能映射。
他们的评论也与近年来公布的在AI取得的突破相关。计算机科学家 Kris Hammond说:“AI的核心技术并没有发生重大改变,现在的核心技术几乎与多年前的一样。昔日的技术达不到要求,不是因为设计不足,而是因为尚未具备所需的基础和环境。”总之,AI过去与现在的最大区别是,必须的计算能力、原始数据和处理速度现在都有了,因此AI技术现在能大放异彩。
过去与现在共同的一个主题是,将模式识别技术应用于用户生成内容的海量数据库。拼写检查工具是在用户自我更正的海量数据库中训练的;能识别照片中人脸的深度学习算法是在数以百万计的数字化存储照片中训练的;击败了《危险边缘》游戏节目的冠军Ken Jennings和 Brad Rutter的计算机系统整合了大量适用于数字存储文本的信息检索算法。认知科学家Gary Marcus指出,最后一个应用之所以是可行的,那是因为回答《危险边缘》出的题目的大多数知识都被电子存储于其中。维基百科上说:“这主要是在数据检索上的运用,而大数据非常适合这一用途。”
这些发展数量之多、速度之快已经引起一些人的推测——我们即将进入一个新时代,那时机器的智能将超过人类的智能。虽然这个话题很大,但是我们需要弄清楚“智能”的本质。如今的大数据和机器学习使得“智能”成为可能。AI的标准定义是“能够完成通常由人类完成的任务的机器”。注意,这个定义适用于较为熟悉的数据科学应用(比如,能够自动承保贷款或签立简单的保险合同的评分模型)、能够进行语音翻译和标记照片的算法,以及自动驾驶汽车。
还有一件事也很突出:所有已经发明的AI技术,以及预计在未来有可能出现的,都是狭义的AI。例如,旨在翻译文件的算法将无法标记照片,反之亦然。而二者都不能用于驾驶汽车。这与Marvin Minsky、HerbertSimon等AI界先驱的最初目标不同。他们想要制造通用AI:能像人类一样理解的计算机系统。令人印象深刻的是,如今的AI技术在概念上更接近于信用评分算法,而非《2001太空漫游》中的超级电脑HAL9000或是由《机械姬》里有自我意识的机器人Ava。我们现在见到的都是狭隘AI。
回到本文的问题:预测一下,大数据和AI会从根本上改变规则还是会使人类的判断过时?预测非常重要,它曾在2014年促使人们重新评估大数据的价值。一些分析家将谷歌流感趋势(GFT)作为大数据取代传统科学方法和数据分析的一个绝佳例子。当时的想法是,谷歌可以利用人们与流感有关的搜索,实时追踪流感爆发。这似乎能支持Chris Anderson,、Kenneth Cukier、 Viktor Mayer-Sch?nberger等专家的观点。他们声称,当获得的数据足够多时,“相关性就足够了”,从而传统的分析形式可以被寻找相关性的计算机算法取代。然而,在2013年流感季节时,GFT的预言被证明极其不准确,大约有140%的误差。分析家们开始质疑他们的模型。计算社会科学家David Lazer及其联合作者发表了一篇被广泛引用的分析文章,从两方面分析该算法最终失败的原因。 算法动力学 谷歌一直在调整搜索引擎以提高搜索结果和用户体验。然而,GFT假设,搜索词条与外部事件之间的关系是静态的。在Rob Hyndman的话来说,这违反了“未来很大程度上重复过去这一假设”。
大数据的傲慢 通过在疾病控制和预防中心(CDC)的数据与数百万计的搜索词条之间建立相关性,GFT违反了Hyndman的四个可预测性关键因素中的第一个也是最重要的一个因素:了解数据关系背后的偶然因素。由于存在随机可能性,结果出现过多的虚假相关性。虽然这是在数据科学所有分支中的一个关注焦点,这一事件说明隐性假设的本质是不可靠的,它使大数据忽视了传统数据分析的形式的必要。
Lazer团队从此次失败中得到的教训不是说社交媒体的数据对于预测疾病爆发是无用的。教训是,大数据和机器学习算法应该被视为对人类判断和传统分析形式的补充,而非替代。 Philip Tetlock与Dan Gardner共同撰写了In Superforecasting: The Art and Science of Prediction,讨论以大数据为基础的AI技术无法取代人的判断。Tetlock报告了他与David Ferrucci的谈话,Ferrucci领导工程团队开发了在《危险边缘》游戏中获胜的Watson系统。Tetlock提出了2个问题: 1. 哪两位俄罗斯领导人在过去十年交换了工作? 2. 两位俄罗斯最高领导人会在10年后交换工作吗?
Tetlock指出,第一个问题考的是历史事实,许多在线文档都有电子记,计算机算法可以使用模式识别技术找出答案。第二个问题需要猜测普京的意图和俄罗斯政治的动态。Ferrucci对于计算机算法能在不确定的条件自动化这种判断形式表示怀疑。随着数据量的增加和机器学习方法的不断改进,模式识别应用将更好地模仿人类的推理过程,但Ferrucci说,模仿和表达意义、产生意义是不同的。Tetlock说,二者之间的差距有待人类判断来补充。
数据越来越多,统计方法也在进化,但是最终的结果也不会让Paul Meehl感到惊讶。的确,计算机可以自动化某些传统上只能由人类完成的任务。比如,信用评分在很大程度上替代了银行信贷员的角色。但更普遍的是,计算机只能协助而不是取代人类在不确定的条件下做出 这就是说,人类与计算机合作的性质很有可能发生变化。Tetlock引用“自由国际象棋”作为人机合作的典型例子,我们在未来可能会看到更多这样的例子。Garry Kasparov(被IBM深蓝计算机在在1996年击败)对2005年的自由国际象棋的讨论就很好地说明了这种合作的可能性。Kasparov说:
比赛结束时出现了惊喜。获胜者不是使用一台最先进计算机的大师,而是同时使用三台计算机的一对美国业余棋手。他们操纵和“训练”计算机的技能能够抗衡大师级别的对手具备的高超棋艺,以及其他参赛者更加强大的计算能力。能力弱的人+机器+较好的过程要胜过一台强大的计算机,而且,更胜过能力强的人+机器+较差的过程。 由RAND公司在冷战期间发展的Delphi方法,被用于预测军事场景。Delphi是一个反复的思考过程,促使群体成员达成一个单一的预测。第一轮由各组员匿名提交自己个人的预测。第二轮,在第一轮预测的两个四分点内的结果中,由各组员再次选择并作修正,这个过程一直进行,直到得出一个统一的预测。现在,产业、政治和医疗领域都已经证明了这种预测方法的价值。 总之,利用高度组织化的智慧,能带来判断和预测力的提升。2011年,著名管理学家Philip Tetlock与人共同发起了Good Judgement Project(GJP),该项目受 Intelligence Advanced Research Projects Activity(IARPA)资助,IARPA 专门投资高回报、高风险的研究项目。GJP专门预测中级紧急的事件,比如,希腊会退出欧元区吗? Tetlock和他的团队发现:a) 一些人在预测水平上一直都好于平均水平;b)这些人都有突出的心理特征;c)教育和实践能提高人们的预测能力。Tetlock称,仅通过GJP的小册子的训练,就能将个人的预测能力提升10%左右。 GJP每年都会选出前2%的超级预测者,这些人有一些共同的特点,就是从“外部视角”而非“内部视角作预测”。除了建立在坚实的数据基础上这一特质外,Tetlock还总结了超级预测家的一些共性:
群体的预测水平可以在人事、并购、战略评估、风险管理、保险等方面等得到应用。而提高群体预测能力,带来的好处也是显而易见的。 虽然预测模型和其他AI应用能使一些任务变得自动化,但人类判断全部交由算法负责这种情况几乎不可能发生。更现实的方法是,使用数据科学和心理学不断完善并提升人类的判断质量。当数据十分充足,而世界的有关方面变化也相对较慢时,依靠统计学的方法进行决策是恰当且合理的。当没有数据或拥有的数据十分有限时,采用群体智慧和其他心理学方法能够更好地进行决策。
举例来说,谷歌——一家建立在大数据和AI之上的公司——使用“群体智慧”和其他统计方法提升招聘员工的决策,其蕴含的道理也是“辅助人类决策者,而非取代他们”。
在愈发涉及海量数据的情况下,“智能”AI应用将把日程工作自动化,从而空出更多时间让人类专家专注于需要他们专业判断的工作,以及从事社会认知(social perception)和共情等非认识能力的行动。深度学习模型有可能让医疗成像的某些过程自动化,这将使医护人员有更多时间集中精力完成抽象的医疗问题,围绕诊疗方案进行策略规划,以及提供共情服务。类似的,保险公司也可以使用深度学习系统将估算受损汽车的成本修理费用变得自动化,让人类保险雇员有更多时间完成更加复杂和需要更多经验的客服。
未来我们还将借助心理学方法,以及数据科学、人工智能产品,继续使用、依靠并且发扬人类决策系统。但在可以预见的未来,人类仍将是“决策过程中的一部分”。至少我们是这样预测的。 |
|