分享

凛冬将至:人工智能的繁荣与寒冬

 liuaqbb 2019-02-11


本文作者:

周志明

矩阵数字经济智库专家

资深Java技术专家

周志明,矩阵数字经济智库专家,资深Java技术、机器学习和企业级开发技术专家,现任远光软件研究院院长,人工智能博士在读,著有知名畅销书《深入理解Java虚拟机:JVM高级特性与最佳实践》。著作颇丰,著有《深入理解Java虚拟机》《深入理解OSGi》,翻译了《Java虚拟机规范》等著作。其中《深入理解Java虚拟机》第1版出版于2011年,已经出至第2版,不仅销量好,而且口碑更好,累计印刷超过30次,仍长销不衰,是中文计算机图书领域公认的、难得一见的佳作。


目录:

一、感知机

二、凛冬将至

三、人工智能的繁荣与寒冬

四、彩蛋:资深人工智能专家周志明知识课程上线小鹅通!


感知机


与符号主义学派在推理期、学习期有不同的学者去关注不同的问题的情形相似,当美国北部麦卡洛克和皮茨着力于解决“大脑是如何处理信息”这个问题的同时,在美国东南部佛罗里达的耶基斯国家灵长类研究中心有另外一群科学家在致力研究“大脑是如何学习到知识”的。麦卡洛克他们在摆弄青蛙,而另一位神经心理学家唐纳德·赫布(Donald Hebb,1904-1985)则从黑猩猩身上研究情感和学习能力,虽然赫布并没有成功把黑猩猩“教导成材”获得个学位什么的,但自己却从中领悟出了一套生物学习的规则。

1949年,赫布出版了《行为组织学》(“Organization of Behavior”)一书。在该书中,赫布总结提出了被后人称为“赫布法则”(“Hebb ' s Law”)的学习机制。他认为如果两个神经元细胞总是同时被激活的话,它们之间就会出现有某种关联,同时激活的概率越高,这种关联程度也会越高。如果我们基于前文的M-P神经元模型来理解这句话的话,可以理解为如果两个神经元同时激发,则它们之间的连接权重就会增加;如果只有某个神经元单独激发,则它们之间的连接权重就应减少。赫布学习规则是最古老的也是最简单的神经网络学习规则。如果仅局限于神经网络方法范围内而言,机器学习的本质就是调节神经元之间的连接权重,也即是赫布法则中的神经元关联程度。

2000年的诺贝尔医学奖得主埃里克·坎德尔(Eric Kandel,1929-)的动物实验也证实了赫布的理论。赫布的发现论文探讨的内容是纯粹基于神经科学和生物学的,但是在人工智能,尤其是在机器学习领域中,各种学习算法或多或少借鉴了赫布的学习理论。

最先把赫布的理论应用于人工智能领域的,是两位年纪相近、且都来自于同一所高中的校友,该高中名为布朗克斯科学高中,是一所出过八个诺贝尔奖、六个普利策奖、一个图灵奖的传奇学校,其中一位是大家已经很熟悉的人工智能奠基人明斯基,另外一位叫做弗兰克·罗森布拉特(Frank Rosenblatt,1928-1971)。

虽然达特茅斯会议中连接主义相关的内容并不是主要议题,连接主义相关内容的风头完全被来自于符号主义学派的“逻辑理论家”盖过。后来,“叛逃出”连接主义学派之后,明斯基自己也在尽力淡化他与连接主义间千丝万缕的关系,但不可否认,那时的明斯基当时连接主义和神经网络的支持者。他1954年在普林斯顿的博士论文题目是《神经-模拟强化系统的理论及其在大脑模型问题上的应用》(“Theory of Neural-Analog Reinforcement Systems and its Application to the Brain-Model Problem”),这实际就是一篇关于神经网络的论文。明斯基用真空管搭建那个名叫“SNARC”(Stochastic Neural Analog Reinforcement Calculator,随机神经模拟强化计算器)的学习机器,可以在一个奖励系统的帮助下完成穿越迷宫的游戏。如果不考虑实用性的话,这可算是世界上第一批基于神经网络的自学习机器的工程实践成果。

明斯基的SNARC

而神经网络在工程应用上真正有实用意义的重大突破发生于1957年。康奈尔大学的实验心理学家罗森布拉特在一台IBM 704计算机上模拟实现了一种他发明的叫做“感知机”(Perceptron)的神经网络模型,这个模型看似只是简单地把一组M-P神经元平铺排列在一起,但是它再配合上赫布法则,就可以做到不依靠人工编程,仅靠机器学习来完成一部分的机器视觉和模式识别方面的任务,这就展现了一条独立于图灵机之外的,全新的实现机器模拟智能的道路。一个可能是“图灵机”级别的新成果,这光想想都令人激动,一下子引起科学界的关注,并且得到了以美国海军为首的多个组织的资助。

单纯的感知机在今天几乎没有任何实际用途,但却并不罕见,它几乎被所有的神经网络书籍当作为入门知识来使用,为了给本书第三部分关于机器学习的内容打个良好的基础,笔者就用一个具体例子来详细解释一下感知机的工作原理:我们目标是希望令机器拥有自动做识别阿拉伯数字的能力,假设待识别的数字通过光学扫描后存储于14×14像素大小的图片文件中,其中可能包含各种形式的数字,可能是不同印刷体或者是手写体的,然后,我们准备了类似下图所示训练数据集供机器进行学习之用:

数字识别的训练集

“训练集”是机器学习理论中的常见词汇,现在我们先将它的意思通俗理解为机器不仅仅会得到一组内容是数字的图片,我们事先还会给机器明确标注出了组图片的每一张实际所代表的数字是什么,这么一组图片用来给计算机学习使用,就称为是训练集。

首先,我们要设计一套适当的数据结构,以便机器可以存储和处理这些数字图片,以一张14×14的灰度数字图片为例,假如我们把黑色的像素用1表示,白色的像素用0表示,中间过渡的像素根据灰度强度大小用0-1之间的浮点值来表示,如下图所示的一个14×14的二维数组便可以存储训练集中的数字图片,我们把这个数组作为输入计算机的信息来源。

字符的数组表示

为了让计算机能“看明白”图片中的数字是什么,必须让机器先从训练集的多张图片中学习,学习的目标是要找出训练集中每一张图片是表示某个数字的特征,这些特征往往是模糊的,难以用语言精确表达,虽然人很难描述出来,但人类大脑却能毫不费力地认出图片是属于某个数字的证据,这说明人类大脑其实是知道这些特征的。

按照神经网络一贯解决问题的思路,提取特征的办法是选择对图片各个像素值进行加权求和,根据训练集中的样本和标注数字的对应结果,如果某一个像素具有很负面的证据说明这张图片不属于某个数字的话,就把这个像素在该数字下相应的权值设置为负数,相反如果这个像素拥有有力的证据支持这张图片属于某个数字,那么该像素的权值是正数。这不难理解,不管手写的还是印刷的,每个数字都有一些用于区分它们的特征,譬如数字“0”对应的图片,在图片中心的位置肯定不应该出现有黑色(浮点值为1)像素,如果出现了这就是负面证据,将降低这个图片是数字“0”的概率。使用红色代表负数权值,蓝色代表正数权值的话,经过训练集中多张数字图片的校准之后,“0”至“9”各个数字对应的像素权限分布情况大致将如下图所示。

数字0至9的权重分布

接下来,我们把图片到“0”至“9”十个数字的分类过程,转化为十个M-P神经元的工作过程。每个M-P神经元有196个(14×14)像素值的输入项,经过训练之后得到的各个像素值在该数字下的权重数据就作为该神经元的196个输入项的加权值,由此构成了一个由10个神经元、共计1960个带权重的连接线组成的神经网络。

因为我们模型中的权重值是根据训练集中大量样本学习得出的,所以在理想情况下,其他不在训练样本集合中的图片,只要它依然是人类可辨认的阿拉伯数字图片的话,就应当同样适合这个模型,加权求和再经过阈值比较之后,网络中应该激活一个且只激活一个其数字对应的M-P神经元,这个神经元代表的数字就是图片识别的结果。

从这个例子里可以在提炼出一个更为普适的神经网络机器学习解释,神经网络学习方法的基本原理就是从训练集中提取出分类特征,这些特征应能同样适应独立同分布的其他未知数据,所以经已知数据学习训练后的神经网络可以对同类的未知数据有效。再回到我们这个数字识别的例子中,整个神经元网络如下图所示的结构。

识别数字的神经网络模型

不过,以上的网络结构仅是能处理“理想情况”的模型,在实际使用过程中,往往会发现网络中出现不止一个M-P神经元被激活的情况,其原因也是不难理解的,毕竟许多手写体的数字会存在“模凌两可”的特征,有些模糊到甚至人类都可能识别错误。譬如下面这些图片,就来源于测试集中导致了模型出现了两个(或以上)神经元同时激活的数据,这类模糊的数据便会使得识别出现歧义而导致识别失败。

可能同时激活多个神经元的手写数字

为了应对多于一个神经元被激活的实际情况,神经元输出就不适合再简单的以“是否激活”的离散形式来判断,这里需要将M-P神经元的阈值比较这部分改进一下,修改为输出一个代表神经元“被激活的强度”的连续值,然后把各个神经元的激活强度值都放入网络后方的Softmax归一化函数(此处仅是以Softmax函数为例,还可以选择其他函数)中进行处理,以便抑制概率小的、增强概率大的数字分类。因此,真正可用于实际数字识别场景的神经网络将如下图所示。

识别数字的神经网络模型,改进版

以上便是感知机和神经网络是如何应用于机器视觉识别的工作原理,简单介绍了感知机的原理之后,我们再回到罗森布拉特和感知机的故事中。

在IBM 704主机中软件模拟成功两年以后,罗森布拉特成功制造出了世界上第一台硬件感知机“Mark-1”,就是本书第一章中展示过的,得到美国海军高度评价的那台机器。Mark-1的输入端是一个20×20的感光单元矩阵,以此将英文字符的光学信号转化为电信号,再通过物理线缆连接的方式将其与和后面字母分类的神经元层相连。Mark-1的训练方法是使用电动马达来调整连接线的电压计,以电压值来表示连接的权重。如果读者看懂了前面关于感知机工作原理介绍的话,那以今天神经网络有了长足发展后的眼光看来,这台感知机的原理并没有任何复杂之处,但是以当时的电气水平来说,真的把这样一台机器制造出来,场面还是颇为“壮观”的,读者可以通过下面这张实物图片来感受一下直接用物理连接来实现神经网络的Mark-1感知机的“复杂”程度。

罗森布拉特和他的感知机Mark-1

这台Mark-1感知机在经过学习训练后,确实能够符合预期地工作,成功地识别出多个英文字母。在当时,有人能够教会一台机器“认字”,这件事情毫不意外地产生了极为吸引眼球的舆论效果,为人工智能的迅速升温提供了强大推动力。罗森布拉特不仅做出了第一台有工程样品价值的感知机,他还在理论上证明了单层神经网络在处理线性可分的模式识别问题时是可以收敛的,并以此为基础,做了多个关于感知机学习能力的实验。

1962年,罗森布拉特还出了一本书,名字叫《神经动力学原理:感知机和大脑机制的理论》(“Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms”),此书总结了他对感知机和神经网络的主要研究成果,一时被连接主义学派奉为“圣经”。


凛冬将至


伴随着感知机影响的快速发酵,罗森布拉特的名气也越来越大,媒体对他的工作甚至是他本人都表现出了极高的关注度。这点不难想象,能够构建一台“有可能”能够模拟人类大脑工作原理的机器,即使放到今天也可以轻而易举地弄出个头版头条的大新闻。更加关键的是,罗森布拉特得到的研究经费也随着感知机名声的高涨而也越来越多,美国国防部和美国海军都资助了他的研究工作,这件事在学术圈内就不仅仅是获取一点身外虚名的小事情而已了,其中还涉及到微妙的金钱和利益的分配,毕竟政府每年的资助的额度是有预算限制的,给罗森布拉特的预算多了,给其他人的自然会少。偏偏罗森布拉特这时不知收敛,没有明哲保身闷声发财,反而还一改往日作为一个学者的害羞和矜持,经常在媒体出镜,开跑车、弹钢琴、到处显摆,致使不少人工智能领域的学者都对他极为不忿。其中有人只是心里反感,有的人是批评声讨,还有的人直接“明剑执刀”地对他进行学术攻击,而真正致命的打击,来自于他的高中校友,当时同样是连接主义学派的巨头明斯基之手。

明斯基是达特茅斯会议的组织者,是人工智能的几位奠基人之一。1959年,明斯基加入麻省理工学院,创立了麻省理工的计算机系以后,其主要工作之一就是与政府机构对接,负责申请研究经费方面的事务,他与罗森布拉特的结怨,最初也是源于这些与学术无关的行政工作之中。

在一次两人都有参与的工作会议上,明斯基在和罗森布拉特大肆争吵,彻底将他们之前已有的矛盾公开化。两位人工智能学术巨头的斗争,不可能只停留在嘴皮子撒泼吵架定胜负,最终是要在学术的上见分晓。明斯基直接对罗森布拉特研究感知机存在的价值和前途发起了进攻,指出罗森布拉特的感知机和神经网络的实际价值非常有限,绝不可能作为解决人工智能的问题的主要研究方法。随后,为了证明自己的观点,证明感知机和神经网络具有天生缺陷,明斯基和麻省理工学院的另一位教授西摩尔·派普特(Seymour Papert,1928-2016)合作,着手从数学和逻辑上去证明罗森布拉特的理论和感知机具有重大的局限性,没有什么发展前途。他们合作的成果就是那本在人工智能历史上影响巨大的、“是也非也”的传奇书籍:《感知机:计算几何学导论》(“Perceptrons: An Introduction to Computational Geometry”)。

马文·明斯基(左)与西摩尔·派普特(右)

那感知机确实是如明斯基所说那样,存在先天缺陷吗?如果仅限于罗森布拉特所提出的单层感知机而言,确是如此。前文提到过,皮茨和麦卡洛克曾向人们展示了M-P神经元可以通过不同的连接方式和权重来实现逻辑与、或、非运算,罗森布拉特的感知机基本原理,就是利用了神经元可以进行逻辑运算特点,通过赫布学习规则,调整连接线上的权重和神经元上的阈值。罗森布拉特把一组神经元平铺排列起来,组合成为一个单层的神经元网络,经过学习阶段的权值调整,便可实现根据特定特征对输入数据进行分类。不过这种分类只能做到线性分割——即感知机可以应用的前提条件,必须是输入的数据集在特定特征下是线性可分的。

“分类”是今天机器学习中最常见应用之一,下一章我们会详细探讨这部分的问题。这里不放先简化,按照最简单的0-1分类来理解,分类指经过神经网络处理后,将符合特定特征的输入数据的输出为1,不符合的输出为0。

逻辑与、或、非操作本身也可以视为一种最基本的分类操作,因此,即使对于仅有单个M-P神经元构成的感知机而言,也具备分类能力,如以下面的M-P神经元为例子,通过调节连接线权重,切换成不同的逻辑运算便可以对输入数据进行0-1分类:

M-P神经元

  • 令w1=w2=1,阈值=2,则y=f(1×x1+1×x2-2),仅在x1= x2时,才有y=1,否则y=0,即“逻辑与”的效果。

  • 令w1=w2=1,阈值=0.5,则y=f(1×x1+1×x2-0.5),仅在x1=1或者x2=1时,才有y=1,否则y=0,即“逻辑或”的效果。

  • 令w1=-0.6,w2=0,阈值=-0.5,则y=f(-0.6×x1+0×x2+0.5),那x1=1时,有y=0,那x1=0时,有y=1,即“逻辑非”的效果。

而对于更一般的情形,由多个M-P神经元组成的单层感知机,可以将输入数据集中两类线性可分的数据,以一个超平面将其划分开来。上面单个M-P神经元分割数据的例子,只是其中最简单的一个特例情况,相当于在二维平面上的数据,被一条直线分割成两个区域。

之前提到了“线性可分”这个词,我们不必纠结它的数学定义,就从字面意思去理解就可以了:如果把逻辑与、或、非运算输入数据,按照0、1值构成二维的坐标平面,并把逻辑运算结果为1的用红色方块表示,结果为0的用蓝色圆圈表示,就形成了图4-17中所示的内容。由图可见,三种逻辑运算,都能够很直观地通过一条直线将这个二维坐标平面中数据划分开来。

感知机线性分割二维平面

在《感知机:计算几何学导论》一书里,明斯基和派普特使用数学方法,证明了感知机在处理线性可分的数据时,其学习过程可以使得权重收敛到一个稳定值,换句话说就是感知机处理线性可分问题是可行的。但是他们同时也指出了感知机的致命弱点:“感知机能解决线性可分的问题,但是它也仅仅能解决线性可分的问题”。两位教授同样用数学方法,证明了感知机,更准确地说是单层的感知机并不能处理非线性数据的分类问题,其中最典型的就是“异或问题”。异或运算(XOR,是一种逻辑析取操作,当两个运算元的值不同时结果为真)也是一个很基本逻辑运算操作,如果连这样的问题都解决不了,那感知机的处理能力确实是有极大局限的。可以直观地从图4-18中看到,对于代表异或的图形,确实没有办法通过一条直线就把红色方块和蓝色圆点划分开。

感知机线性分割二维平面

在证明单层感知机能力不足的同时,明斯基在书中还试图将当时还只存在于少数人大脑构想中的多层感知机(Multilayer Perceptrons,MLP)的出路也一并堵死。虽然明斯基并没有进行严格的证明,但是他的灵敏的数学直觉告诉他多层感知机应该是能够处理非线性的分类问题的,因为这点在简单的低维度的样例中很容易体现出来。如果延续我们之前的例子,只需要在网络中增加一个“隐层”(Hidden Layer,这是神经网络的概念,神经网络中除去输入层、输出层外的中间层次被统称为隐层),按照下图中标注的数值来设置连接线的权重和神经元的阈值,就可以轻而易举地实现出逻辑异或运算。

其实,早在明斯基的《感知机:计算几何学导论》出版之前四年(即1965年),乌克兰数学家伊瓦赫年科(Alexey Grigorevich Ivakhnenko,1913-2007)就提出了和多层人工神经网络的很接近的模型,其中就有解决异或问题的介绍,当时并没有引起多大关注,但后来神经网络的火爆程度大家都清楚。

多层感知机处理异或问题

明斯基在书中说到:多层感知机虽然理论上有可能可以解决非线性可分的问题,但是实际上却是完全不具备可行性的——无论是软件模拟还是实际建造都几乎是不可能的,因为每增加多一个隐层,新引入的连接数量都会急剧膨胀。即使只考虑网络中只有前向连接(即网络是一个有向无环图,每一层的神经元都只与下一层产生连接关系,这种最简化的神经网络在今天被称为“前馈神经网络”)的简化情况,其产生的连接数量随着层数增加,也会迅速发展成天文数字。

这种情景读者可以自己想象,本章所提及的几个神经网络的例子中,最简单的单层网络也有14×14个输入神经元、10个输出神经元,这样的神经网络就包含有1960(196×10)个神经元连接,如果中间再加入一层与输入项数量相同的隐层,整个网络所需要训练的权重将会激增至是40376(196×196+196×10)个。更让人头痛的是,加入隐层之后,罗森布拉特的“Back Propagation”(请注意,此算法与今天深度学习的误差反向传播算法名字相似但内容并不一样)训练方法就不再有效了,原因是不同层次之间的权重调节并非独立的,它们的取值会互相影响,不能再面向单个权重来调节,可是要一体化地训练如此庞大的连接权重,在当时即没有合适的硬件能处理这种规模的数据,也没有可行的训练算法来实现。

明斯基在书中最后给出了他对多层感知机的评价和结论:“研究更两层乃至更多层的感知机是没有价值的”,多层感知机在没来及被大家深入探究之前,就被明斯基直接判处了死刑。

《感知机:计算几何学导论》,业内普遍认为此书阻碍了神经网络的发展

其实罗森布拉特自己也早已预感到感知机的能力可能存在限制的,但这种缺陷被明斯基以一种极具有敌意的方式呈现给公众,对他来说是不可接受的。在《感知机:计算几何学导论》的前言部分,明斯基甚至使用上了完全不顾及同行颜面的话语:“这里(指罗森布拉特的理论)的大部分内容都没有多少科学价值”(“Most of this writing is without scientific value”)。

由于明斯基在人工智能领域中的特殊地位,再加上他不久前(1969年,此书出版的同一年)刚获得第四届图灵奖所带来的耀眼光环,这部书籍不仅对罗森布拉特本人,还对连接主义和神经网络的研究热情,甚至是对整个人工智能学科都造成了非常沉重的打击。

1971年7月11日,《感知机:计算几何学导论》公开出版刚满一年,罗森布拉特的四十三岁生日当天,他在美国切萨皮克湾的一艘游船上“意外”落水,不幸身亡。笔者将意外二字加上引号,是因为今天很多人都选择相信此事并非巧合,而是罗森布拉特的骄傲驱使他在与明斯基的学术斗争落败后选择了自杀。罗森布拉特是感知机的发明人,曾经是感知机、神经网络甚至整个连接主义的捍卫者,由于经费分配和高调的个人作风等原因,在开拓神经网络机的器学习方法的道路上,他是一个很孤独的斗士。他与明斯基的斗争中无人对其声援,还经常备受其他学者责难。不知在生命的最后一刻,他是否也对神经网络和感知机的前途失去了信心。也许他还相信感知机会有突破困境破茧成蝶的一天,也有可能他自己也已经心灰意冷。大概当时是真的没有任何人能够预见到,神经网络和连接主义在二十多年后会还有机会逆袭,并终会成为人工智能研究的最主流最热门的技术。

罗森布拉特死后,明斯基在《感知机:计算几何学导论》一书的第二版发行时,删除了原版里面全部对罗森布拉特的个人攻击的句子,并在扉页手写了“纪念弗兰克·罗森布拉特”(“In memory of Frank Rosenblatt”)的话语。但这毕竟是为时已晚,如同之前罗森布拉特被整个人工智能学术界声讨那样,现在又有许多人工智能的研究者反过来认定明斯基对罗森布拉特的死亡有间接的责任,认为他是不可原谅的。尤其是在连接主义学派重新兴起之后,许多人纷纷跳出来对明斯基口诛笔伐,谴责明斯基差点扼杀了他亲手创立的人工智能这门学科,认为明斯基应该对罗森布拉特的死亡、对连接主义失落的十多年时间、还要对后来的人工智能的寒冬负责。马哈雷特·博登(Margaret Boden,1936-)在她的作品《心如机器:认知科学的历史》(“Mind as Machine: A History of Cognitive Science”)对明斯基和他的书评价到:“毫无疑问,整本书从开头到结束,全部都是对罗森布拉特的工作以及神经网络的研究的诅咒!”(“It`s pretty clear that the whole thing was intended,from the outset,as a book-length damnation of Rosenblatt`s work and neural network research in general”)。

后来的这些评价大多带有一些个人的情绪,仿佛这些人是一早就知道感知机和神经网络是具有研究价值的,还预见到了它们将在人工智能中的重要作用,只是慑服于明斯基的威望才不敢吭声,暗地里就一直就与罗森布拉特在并肩作战一般。笔者看来,无论是罗森布拉特还是明斯基的观点,既然学术研究,肯定就有说错话、走错方向的可能,我们不仅要看到那些有效的正确的成果,也应该记录那些走过的弯路,明斯基与罗森布拉特竞争的悲剧结果,只是学术圈现实阴暗面的一次爆发。美国电气电子工程师协会(Institute of Electrical and Electronics Engineers ,IEEE)于2004年设立了罗森布拉特奖,以奖励在神经网络领域的杰出研究人员。

尽管明斯基当时对神经网络的观点并不是正确的,他与罗森布拉特的斗争确实很可能有学术之外的原因在里面,但明斯基本人绝对是无愧为一名有自己明确学术观点和哲学思想的人工智能大师的。在2007年,“深度学习”的概念已被提出,多层网络的训练方法也已完善起来,深度神经网络逐步取得了令世人诧异的成就,神经网络在人工智能领域渐成燎原之势的时候,他仍然坚持着神经网络具有很大局限性的看法。明斯基在他的新作《情感机器》一书出版后,接受媒体采访时曾经说道:

“人工智能领域的每个人都在追求某种逻辑推理系统、遗传计算系统、统计推理系统或神经网络系统,但无人取得重大突破,原因是它们过于简单。这些新理论充其量只能解决部分问题,而对其他问题无能为力。我们不得不承认,神经网络不能做逻辑推理。例如,在计算概率时,它无法理解数字的真正意义是什么”。

在明斯基看来,人工智能应当类似于人脑,由有着不同的功能和结构的区域去应对视觉、情感、思维、记忆、运动等不同类型的任务。他希望能实现《情感机器》一书中描述的思维体系结构,使人工智能在各种思维方式间切换。


人工智能的繁荣与寒冬


从1956年诞生起至70年代初这段时间,人工智能这门新兴学科一直与政府、学术界、工业界还有风投资本家都处于蜜月期之中。这20年里面,人工智能确实取得了一些成果和发展,不过迫于政府、媒体、科学界等各方的推波助澜,人工智能也过早地向社会,尤其是这个学科的资助者们许下了太过浮夸的诺言,哪怕是学科里那些真正了解人工智能,真正潜心从事学术研究的学者,也过于乐观的估计了这门科学的发展进程,典型的诺言如早在1957年,司马贺曾这样公开宣告到:

“我的目标不是使你们惊讶或者震惊——我能概括的最简单的表述方式就是现在世界上就已有机器能够思考、学习和创造。而且它们做这些事情的能力还将快速增长,直到可预见的未来,它们能够处理的问题范围将会扩展至人类思想所能企及全部范围”。

在这种充斥着激进、盲目和乐观思潮的气氛下,类似的预言和承诺是数不胜数,历史上有名的、出自这个领域几位大师之口的还有以下这样预言:

  • 1958年,纽厄尔和司马贺:“十年之内,数字计算机将成为国际象棋世界冠军。” 、“十年之内,数字计算机将发现并证明一个重要的数学定理。”

  • 1965年,司马贺:“二十年内,机器将能完成人能做到的一切工作。”

  • 1967年,明斯基:“一代之内……创造‘人工智能’的问题将获得实质上的解决。”

  • 1970年,明斯基:“在三到八年的时间里我们将得到一台具有人类平均智能的机器,这样的机器能够读懂莎士比亚的著作,会给汽车上润滑油,会玩弄政治权术,能讲笑话,会争吵,总之,它的智力将会无与伦比。”

这些预言在今天看来非常可笑,大师们“立下的Flag”全被现实啪啪打脸收场。可是立下这些预言的那个时间段里,这些预言和承诺确实促使许多社会资源集中到了人工智能研究之上来。

1963年6月,麻省理工学院从美国刚刚建立的高等研究计划局(ARPA,即后来的DARPA,国防高等研究计划局)获得了二百二十万美元的研究经费,用于资助开展历史上有名的“MAC工程”(Project on Mathematics And Computation)。这个工程的的主要研究方向之一便是人工智能,具体工作由明斯基和麦卡锡五年前建立的人工智能研究小组所承担。从此以后,ARPA每年都为麻省理工提供三百万美元针对人工智能的几乎无条件无约束的专项经费,既不定具体方向,也不求具体产出,用时任ARPA主任的罗宾特·利克里德(Robnett Licklider,1915-1990)自己的话来说就是:“应该资助人,而不是具体的项目”。所以这些经费才能“佛系”如此程度,允许研究者去做任何感兴趣的方向上的研究,这样的资助形式在政府对学术界的各种资助中是极不常见的。ARPA的无条件资助一直持续至七十年代才终止,这些经费促使麻省理工形成了无拘无束的研究氛围及其特有的“Hacker文化”。除了麻省理工学院以外,ARPA还对纽厄尔和司马贺在卡内基梅隆大学的人工智能工作小组以及斯坦福大学人工智能项目(由麦卡锡于1963年从麻省理工跳槽到斯坦福大学后创建)提供了类似的资助,当时世界上还有最后一个重要的研究机构是由唐纳德·米契(Donald Michie,1923-2007)于1965年在英国爱丁堡大学建立的人工智能实验室。在接下来的许多年,乃至今日,上述四所研究机构一直是全球人工智能领域领先的研究中心,也是经费汇集的中心。

不过好景不长,可能只是因为人工智能研究者们对其课题难度没有能够做出正确的判断,也有可能是上帝为了让历史再一次证明盛极而衰是自然届的铁律。总之,过于乐观的估计,即令全社会的资源蜂拥而至,也使得人们期望变得过高。时光荏苒,当大家发现人工智能承诺无法兑现时,虚幻的泡沫便注定要破灭。研究经费的走向是其最直接的体现,对人工智能提供资助的各种机构,如英国、美国政府,国防高等研究计划署和美国国家科学委员会等等,都不约而同地对没有明确方向和实用价值的人工智能研究终止了资助。随后,类似“人工智能即使不是骗局也是庸人自扰的想法”的情绪和言论迅速从政府、研究机构蔓延到全社会,整个社会公众对人工智能的前景从盲目乐观又转变为一种极度悲观和过分不信任的态度,这个阶段,人工智能历史上被称为第一次“人工智能的寒冬(AI Winter)”

在寒冬之前,其实就已经出现过一些线索,预示了这一局面即将降临。最早在1966年,自动语言处理顾问委员会(Automatic Language Processing Advisory Committee,ALPAC)提交给美国政府的一份报告中,对机器翻译的进展开始提出了有充满批评和警告意味的评价。这个其实真怪不得别人批评,当时人工智能的自然语言处理能力确实是难登大雅之堂。罗斯·奎利恩(Ross Quillian)在给汇报的听众演示他在自然语言方面的研究成果时,只能采用一个仅含二十个单词的词汇表进行演示,因为当时的计算机内存就只能容纳这么点词汇!还有不少关于人工智能的历史材料上还记录有这样一项当时机器翻译的测试场景,翻译过程中,机器把“心有余而力不足”(“The spirit is willing but the flesh is weak”)的英文句子译成俄语再译回来之后竟然变成了“酒是好的,肉变质了”。美国自动语言处理顾问委员会的这份报告,后来导致美国国家科学委员会(National Research Council,NRC)在为机器自然语言处理方面研究累计拨款二千万美元后,最终不得不在没有获得任何有价值的成果情况下停止了资助。

在大西洋的彼岸,1973年英国数学家詹姆士·莱特希尔(James Lighthill,1924-1998)针对英国人工智能研究状况,发表了赫赫有名的《莱特希尔报告》,这篇公开的报告是一份具有广泛影响力的、直接刺破人工智能乐观思潮泡沫的调查文件,被视作人工智能寒冬的开启。它严厉地批判了人工智能领域里的许多基础性研究,尤其是机器人和自然语言处理等几个最热门子领域,并给出了明确的结论:“人工智能领域的任何一部分都没有能产出符合当初向人们承诺的、具有主要影响力的成果”。此外,报告特别指出人工智能的研究者并没有能够解决如何将人工智能应用于真实世界里必然会遇到的“组合爆炸”问题。整份报告的基调充满了对人工智能研究在早期兴奋期过后的全面悲观。《莱特希尔报告》不仅导致了英国人工智能研究的全面低潮,并且其影响很快扩散到了美国及其他人工智能的研究之中,到了1974年,各国政府的资助预算清单上都已经很难再找到对人工智能项目的资助了。接下来长达十年的时间里,人工智能经历了它历史上的第一次寒冬,一些几年前还在愈演愈烈的自吹自擂的狂欢中作茧自缚的人工智能从业者们,许多都不得不纷纷锯短他们的鼻子,转向其他领域去谋生。

站在今天回望历史,人工智能的低潮发生过不止一次,而在进入寒冬之前几年,都有一些相似的征兆,譬如学术界奋力地发表论文,学术明星获得万众追捧;所有擦边专业的学生纷纷转行搞起人工智能,市场还给这类“人才”开出令人咋舌的高薪;企业、研究机构和学者们做出一个又一个预测和承诺,媒体连篇累牍报道人工智能的进展。而大众则睁着一双双无辜的大眼睛,好奇而惊恐地注视着他们不理解又不敢不关注的一切。已经过去的寒冬,让今天处于温暖如春环境之中,阅读此书的你我,都不得不去思考,这一次人工智能热潮,是真的引爆了奇点,抑或只是历史的另一个轮回?

其实,即使这次的人工智能热潮,仍然是一个历史轮回也不见得是一件多么可怕的事,每一个时代的技术浪潮,都有这个时代的条件,有这个时代的使命。50至70年代经历的第一次人工智能的热潮里,不仅有浮夸,也隐藏着不少真正的技术进步。例如卡耐基梅隆大学的“语音理解研究(Speech Understanding Research)”计划,当时甚至被 DARPA 评价为是“一场骗局”,但是这个研究所开发出来的“隐马尔科夫模型”这样的“黑科技”,在数十年后成为了计算机语音识别技术领域的重要一块基石,参与其中的研究者大多都成为这个领域的一代宗师。寒冬过去之后,这些成果终会发出闪亮的光芒。


彩蛋:资深人工智能专家周志明知识课程上线小鹅通!

机器学习即 ML,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

机器学习作为人工智能研究较为年轻的分支,机器学习也分监督学习和非监督学习,同时随着人工智能越来越被人们重视和越热。

我们邀请超级畅销书《深入理解Java虚拟机》作者周志明开设《外行也能懂的机器学习》课程,用深入浅出的语言讲解机器学习的内容。

课程福利:

  • 30位课程购买者,我们将提供全额返利。只要学完本套课程的用户,我们将全额返还购买费用!

  • 连续打卡15天的用户,我们将提供课程优惠券,凭此优惠券可购买矩阵数字经济智库的任何一门课程。

课程报名方式:

  • 关注“矩阵数字经济智库”,即可在子菜单学院中找到“精品付费”课程,进入主页面即可找到课程《外行也能懂的机器学习》。

  • 通过扫码直接进入《外行也能懂的机器学习》:

《外行也能懂的机器学习》

有趣的灵魂在等你

长按扫码即可观看课程


《智慧的疆界:从图灵机到人工智能》

1943年,世界上出现了第一次“电子诈骗”,英国数学(家艾伦·图灵)和神经学家(格雷·沃尔特)制造了人类史上第一个机器人,并成功和人类沟通。

1956年,计算机科学家(约翰·麦卡锡)第一次提出“人工智能”一词,在学者(马文·明斯基)的“忽悠下”从美国政府那里获得了大量金钱。

1968年,世界上最早的幻想电影《2001:太空漫游》出世,附有人类真实情感的电脑“哈尔”开始让当时的世界民众既恐慌又兴奋。


从图灵到人工智能的这70年,你想知道的,这本书里都有。


END

人工智能系列文章历史回顾





矩阵数字经济智库

由矩阵财经依托“MATRIX贝叶斯研究基金”(MATRIX与清华大学教育基金会联合成立)和MATRIX与“一带一路研究中心”的战略合作协议发起。智库将联合区块链、人工智能、金融、数字资产管理与投资领域的专家,聚焦传统产业转型和技术/商业创新,以新技术赋能实体经济,推动技术进步,引领数字经济的变革。

点一下好看  2019年科技更好看

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多