收藏【长图文】AI简史：一文读懂人工智能的前世今生

netouch 2024-01-31 发布于北京

展开全文

人工智能（Artificial Intelligence, 简称AI）的历史源远流长。在古代的神话传说中，技艺高超的工匠可以制作人造人，并赋予其智能或意识。现代意义上的AI始于古典哲学家用机械符号处理的观点解释人类思考过程的尝试。20世纪40年代计算机的发明使一批科学家开始严肃地探讨构造一个电子大脑的可能性。

1956年，在达特茅斯学院举行的一次会议上正式确立了人工智能的研究领域。会议的参加者在接下来的数十年间都是AI研究的领军人物。同时，上千万美元被投入到AI研究中，以期实现会议所指定的目标，但最终没能实现，人工智能也进入了第一次低潮。

人工智能史上共出现过好几次低潮，尽管经历了大起大落，AI领域仍在取得进展。某些在20世纪70年代被认为不可能解决的问题今天已经圆满解决并成功应用。但与第一代AI研究人员的乐观估计不同，具有与人类同等智能水平的机器至今仍未出现。

1. 理论源起

古希腊神话

展开剩余94%

古希腊神话中就出现了有智慧的机械的形象：“工匠之神赫菲斯托斯曾制作了一组金制的女机器人，能开口说话，并接手他的高难度工作；他还有一套三脚桌，围在铁匠铺外面，能自行跑去供诸神聚会，之后再自己跑回来。”

形式推理

公元前4世纪，古希腊的亚里士多德开创三段论，被视为人工智能编程逻辑的起源。人工智能的基本假设是人类的思考过程可以机械化和程序化。

哲学家拉蒙·柳利（1232-1315）开发了“逻辑机”，试图通过逻辑方法获取知识。他的理论影响了后来的莱布尼茨。

17世纪，莱布尼茨，托马斯·霍布斯和笛卡儿尝试将理性的思考系统转化为代数学或几何学体系。莱布尼茨认为“人类的思想可以简化成某种运算”。霍布斯在《利维坦》中有一句名言：“推理就是计算。” 这些哲学家已经开始明确提出形式符号系统的假设，而这一假设将成为AI研究的指导思想。

20世纪初，大卫·希尔伯特向当时的数学家提出了一个基础性的难题：“能否将所有的数学推理形式化?”这个问题的最终回答由哥德尔不完备定理，图灵机和λ演算给出。它们隐含地证明了任何形式的数学推理都能在一定的限制之下被机械化的可能性。邱奇-图灵论题指出，一台仅能处理0和1这样简单二元符号的机械设备能够模拟任意数学推理过程。

计算机科学

19世纪初，查尔斯·巴贝奇设计了一台可编程计算机（“分析机”）。历史上第一位程序员爱达·勒芙蕾丝预言，这台机器“将创作出无限复杂，无限宽广的精妙的科学乐章”。

二战期间，第一批现代计算机诞生。为制造“思维机器”提供了硬件基础。

1968年，小说《2001太空漫游》预言了很多未来的技术，包括地球卫星、互联网等。其中的哈尔9000型电脑，则是对于人工智能早期设想的集中体现。

2.AI诞生

在20世纪40年代和50年代，来自不同领域（数学，心理学，工程学，经济学和政治学）的一批科学家开始探讨制造人工大脑的可能性。1956年，人工智能被确立为一门学科。

早期理论与实践

最初的人工智能研究是30年代末到50年代初的一系列科学进展交汇的产物。神经学研究发现大脑是由神经元组成的电子网络，其激励电平只存在“有”和“无”两种状态，不存在中间状态；诺伯特·维纳的控制论描述了电子网络的控制和稳定性。克劳德·香农提出的信息论则描述了数字信号（即高低电平代表的二进制信号）。图灵的计算理论证明数字信号足以描述任何形式的计算。这些密切相关的想法暗示了构建电子大脑的可能性。

沃伦·麦卡洛克和沃尔特·皮茨分析了理想化的人工神经元网络，并且指出了基本的运行机制。他们的学生马文·明斯基（在接下来的五十年中都是AI领域最重要的领导者和创新者之一）在1951年建造了第一台神经网络机SNARC。

1950年，图灵发表了一篇划时代的论文，文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义，他提出了著名的图灵测试：如果一台机器能够与人类展开对话而不能被辨别出其机器身份，那么称这台机器具有智能。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。

50年代中期，随着数字计算机的兴起，一些科学家直觉地感到可以进行数字操作的机器也应当可以进行符号操作，而符号操作可能是人类思维的本质。这是创造智能机器的一条新路。1955年，根据该理论开发的程序“逻辑理论家（Logic Theorist）”问世，它能够证明《数学原理》中前52个定理中的38个。开发者之一赫伯特·西蒙认为他们已经“解决了神秘的心/身问题，解释了物质构成的系统如何获得心灵的性质。”

1956年达特茅斯会议：AI的诞生

1956年达特茅斯会议的组织者是马文·明斯基，约翰·麦卡锡和另两位资深科学家克劳德·香农以及内森·罗彻斯特，后者来自IBM。会议提出的断言之一是“学习或者智能的任何其他特性的每一个方面都应能被精确地加以描述，使得机器可以对其进行模拟。”与会者中的每一位都将在AI研究的第一个十年中做出重要贡献。会上讨论了“逻辑理论家”，麦卡锡则说服与会者接受“人工智能”一词作为本领域的名称。1956年达特茅斯会议上AI的名称和任务得以确定，同时出现了最初的成就和最早的一批研究者，因此这一事件被广泛承认为AI诞生的标志。

3.黄金年代

达特茅斯会议之后的数年是大发现的时代。这一阶段开发出的程序堪称神奇：计算机可以解决代数应用题、证明几何定理、学习和使用英语。当时大多数人几乎无法相信机器能够如此“智能”。研究者们在私下的交流和公开发表的论文中表达出相当乐观的情绪，认为具有完全智能的机器将在二十年内出现。DARPA（美国国防高等研究计划署）等政府机构向这一新兴领域投入了大笔资金。下面列举这些研究中最具影响的几个

搜索式推理

为实现一个目标（例如赢得游戏或证明定理），它们一步步地前进，就像在迷宫中寻找出路一般；如果遇到了死胡同则进行回溯。这就是“搜索式推理”。这一思想遇到的主要困难是，在很多问题中，“迷宫”里可能的线路总数是一个天文数字（即“指数爆炸”）。研究者使用启发式算法去掉那些不太可能导出正确答案的支路，从而缩小搜索范围。1957年，应用此理论的程序“一般问题解决器”（General Problem Solver）诞生。1966年，历史上第一代能够自主“思考和行动”的机器人“摇摇”（Shakey）的开发项目启动。这是人类首次严肃地尝试制造一台自主机器人。

自然语言

AI研究的一个重要目标是使计算机能够通过自然语言（例如英语）进行交流。1964年，第一个聊天机器人ELIZA诞生。与ELIZA“聊天”的用户有时会误以为自己是在和人类，而不是和一个程序，交谈。但是实际上ELIZA根本不知道自己在说什么。它只是按固定套路作答，或者用符合语法的方式将问题复述一遍。

微世界

60年代后期，麻省理工大学AI实验室的马文·明斯基和西摩尔·派普特建议AI研究者们专注于被称为“微世界”的简单场景。他们指出在成熟的学科中往往使用简化模型帮助基本原则的理解，例如物理学中的光滑平面和完美刚体。许多这类研究的场景是“积木世界”，其中包括一个平面，上面摆放着一些不同形状，尺寸和颜色的积木。在这一指导思想下，1968年，能与人简单交流、决策，并执行的SHRDLU程序诞生，它能用普通的英语句子与人交流，还能作出决策并执行操作。

专家系统

早期的另一个里程碑是始于1965年的DENDRAL项目，它启动了一个全新的行业：专家系统。DENDRAL把专业领域知识（本例中为分子化学）编码到计算机程序里，利用自己的化学知识库，提出有可能加以影响的化学结构。它在专业领域的成功表明，在狭窄主题上，把人类的专业知识进行明确编码，计算机程序能够以专家级的绩效来完成特定任务。

4.首次低谷

到了70年代，AI开始遭遇批评，随之而来的还有资金上的困难。AI研究者们对其课题的难度未能做出正确判断：此前的判断过于乐观使人们期望过高，当承诺无法兑现时，对AI的资助就缩减或取消了。同时，由于马文·明斯基对感知器的激烈批评，联结主义（即神经网络）销声匿迹了十年。70年代后期，尽管遭遇了公众的误解，AI在逻辑编程，常识推理等一些领域还是有所进展。

AI领域的难题

70年代初，AI遭遇了瓶颈。即使是最杰出的AI程序也只能解决它们尝试解决的问题中最简单的一部分，也就是说所有的AI程序都只是“玩具”。AI研究者们遭遇了无法克服的基础性障碍。尽管某些局限后来被成功突破，但许多至今仍无法满意地解决：

计算机的运算能力。当时的计算机的内存和处理速度有限。
计算复杂性和指数爆炸。很多问题的解决需要近乎无限长的时间。
常识与推理。许多重要的AI应用需要大量对世界的认识信息。
莫拉维克悖论。证明定理和解决几何问题对计算机而言相对容易，而一些看似简单的任务，如人脸识别或让机器人穿过屋子，实现起来却极端困难。
框架和资格问题。如果不对逻辑的结构进行调整，AI就无法对常见的涉及自动规划的推理进行表达。

停止拨款

由于缺乏进展，对AI提供资助的机构（如英国政府，DARPA和NRC）对无方向的AI研究逐渐停止了资助。早在1966年ALPAC（Automatic Language Processing Advisory Committee，自动语言处理顾问委员会）的报告中就有批评机器翻译进展的意味，预示了这一局面的来临。NRC（National Research Council，美国国家科学委员会）在拨款二千万美元后停止资助。DARPA则对CMU的语音理解研究项目深感失望，从而取消了每年三百万美元的资助。到了1974年已经很难再找到对AI项目的资助。

5.重获繁荣

在80年代，专家系统开始为全世界的公司所采纳，“知识处理”成为了主流AI研究的焦点。日本政府在同一年代积极投资AI以促进其第五代计算机工程。约翰·霍普菲尔德（John Hopfield）在联结主义获得新突破。AI再一次获得了成功。

专家系统获得赏识

专家系统是一种程序，能够依据一组从专门知识中推演出的逻辑规则在某一特定领域回答或解决问题。1965年起设计的Dendral能够根据分光计读数分辨混合物。1972年设计的MYCIN能够诊断血液传染病。它们展示了这一方法的能力。

专家系统仅限于一个很小的知识领域，从而避免了常识问题；其简单的设计又使它能够较为容易地编程实现或修改。总之，实践证明了这类程序的实用性。使得AI开始变得实用起来。

1980年CMU为DEC（Digital Equipment Corporation，数字设备公司）设计了一个名为XCON的专家系统，这是一个巨大的成功。在1986年之前，它每年为公司省下四千万美元。至此，全世界的公司都开始研发和应用专家系统，到1985年它们已在AI上投入十亿美元以上。

重获拨款：第五代工程

1981年，日本经济产业省拨款八亿五千万美元支持第五代计算机项目。其目标是造出能够与人对话，翻译语言，解释图像，并且像人一样推理的机器。

其他国家纷纷作出响应。英国开始了耗资三亿五千万英镑的Alvey工程。美国一个企业协会组织了MCC（Microelectronics and Computer Technology Corporation，微电子与计算机技术集团），向AI和信息技术的大规模项目提供资助。DARPA也行动起来，组织了战略计算促进会（Strategic Computing Initiative），其1988年向AI的投资是1984年的三倍。

联结主义的重生

1982年，物理学家约翰·霍普菲尔德证明一种新型的神经网络（现被称为“Hopfield网络”）能够用一种全新的方式学习和处理信息，这项发现使1970年以来一直遭人遗弃的联结主义重获新生。1986论文集《分布式并行处理》问世。90年代神经网络获得了商业上的成功，它们被应用于光字符识别和语音识别软件。

6.AI寒冬

80年代中商业机构对AI的追捧与冷落符合经济泡沫的经典模式，泡沫的破裂也在政府机构和投资者对AI的观察之中。尽管遇到各种批评，这一领域仍在不断前进。

第二次AI低谷 1987-1993

从80年代末到90年代初，AI遭遇了一系列财政问题。变天的最早征兆是1987年AI硬件市场需求的突然下跌。Apple和IBM生产的台式机性能不断提升，到1987年时其性能已经超过了Symbolics和其他厂家生产的昂贵的旧机型。老产品失去了存在的理由：一夜之间这个价值五亿美元的产业土崩瓦解。

XCON等最初大获成功的专家系统维护费用居高不下。它们难以升级，难以使用，成了以前已经暴露的各种各样的问题的牺牲品。专家系统的实用性仅仅局限于某些特定情景，不再能满足普遍的需求。

到了80年代晚期，战略计算促进会大幅削减对AI的资助。DARPA的新任领导认为AI并非“下一个浪潮”，拨款将倾向于那些看起来更容易出成果的项目。

直到1991年，日本“第五代工程”并没有实现，事实上其中一些目标，比如“与人展开交谈”，直到2010年也没有实现。与其他AI项目一样，期望比真正可能实现的要高得多。从80年代末到90年代初，AI遭遇了一系列财政问题。

躯体的重要性：Nouvelle AI与嵌入式推理

一些研究者提出全新的人工智能方案。他们相信，为了获得真正的智能，机器必须具有躯体——它需要感知、移动、生存、与这个世界交互。

在发表于1990年的论文《大象不玩象棋（Elephants Don't Play Chess）》中，机器人研究者罗德尼·布鲁克斯提出了“物理符号系统假设”，认为符号是可有可无的，因为“这个世界就是描述它自己最好的模型”。

7.新的发展

现已年过半百的AI终于实现了它最初的一些目标。它已被成功地用在技术产业中，不过有时是在幕后。这些成就有的归功于计算机性能的提升，有的则是在高尚的科学责任感驱使下对特定的课题不断追求而获得的。“实现人类水平的智能”这一最初的梦想曾在60年代令全世界的想象力为之着迷，其失败的原因至今仍众说纷纭。各种因素的合力将AI拆分为各自为战的几个子领域，有时候它们甚至会用新名词来掩饰“人工智能”这块被玷污的金字招牌。虽然AI比以往的任何时候都更加谨慎，但也更加成功。

幕后的AI

AI研究者们开发的算法开始变为较大的系统的一部分。AI曾经解决了大量的难题，这些解决方案在产业界起到了重要作用。应用了AI技术的领域有例如：数据挖掘，工业机器人，物流，语音识别，银行业软件，医疗诊断和Google搜索引擎等。

AI领域并未从这些成就之中获得多少益处。AI的许多伟大创新仅被看作计算机科学工具箱中的一件工具。牛津大学哲学家Nick Bostrom解释说，“很多AI的前沿成就已被应用在一般的程序中，不过通常没有被称为AI。这是因为，一旦变得足够有用和普遍，它就不再被称为AI了。”

深度学习

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。深度学习的概念源于人工神经网络的研究。

深度学习已经在计算机视觉、语音识别和自然语言处理等其他领域产生了诸多成功应用。谷歌和百度公司利用深度学习的语音识别软件在语音转换为文本方面已经可以跟人类一较高下；利用了深度学习技术的AlphaGo在2016年初击败了世界顶尖围棋选手。

游戏里程碑和摩尔定律

游戏AI一直被认为是评价AI进展的一种标准。1997年5月11日，IBM深蓝（DeepBlue）战胜国际象棋世界冠军卡斯帕罗夫。

2005年，斯坦福大学开发的一台机器人在一条沙漠小径上成功地自动行驶了131英里。

2011年，IBM沃森计算机（Watson）参加综艺问答节目危险边缘（Jeopardy!）来测试它的能力，这是该节目有史以来第一次人机对决，在3集节目的对决中最终打败了节目最高奖金得主布拉德·鲁特尔和节目历史连胜纪录保持者肯·詹宁斯。在比赛中，Watson没有连接到互联网，而是运用了先进的自然语言处理、信息检索、知识表达和推理和机器学习技术，在包含200万页结构化和非结构化的信息的4TB磁盘内进行处理。

一般认为，计算机要在围棋中取胜比在国际象棋等游戏中取胜要困难得多，因为围棋的下棋点极多，分支因子大大多于其他游戏。但2016年3月，由Google DeepMind团队开发的AlphaGo以4:1击败顶尖职业棋手李世石；其加强版随后又在2017年乌镇围棋峰会上三比零完胜世界第一棋手柯洁，自此因没有人类对手而宣布退役。

上述计算机性能上的迅速增长，可以由摩尔定律解释：“计算速度和内存容量每两年翻一番。”计算性能上的基础性障碍已被逐渐克服。

人声交互技术

如果你曾经使用过Siri、Cortana、Alexa或者各类语音搜索功能，那么你就已经接触过人声交互技术了。人声交互的基础理论是人工智能研究的子领域之一——自然语言理解。近年得益于深度学习和大数据等新技术的发展和计算机运算能力的提高，人声交互技术已经逐步成熟。

8.结语

今天，计算机正以惊人的速度改变着我们的生活。因此，全球范围内，人们渴望对人工智能获得更深入的了解。许多评论家都预言会出现了不起的事情。2016年5月，微软英国分公司的首席构思官戴夫·科普林（Dave Coplin）非常大胆地提出：人工智能是“当今地球人们着手从事的最重要的技术”。他说：“这将改变我们跟技术的关系。它将改变人与人之间的关系。我认为，它甚至会改变我们对人类这个概念的看法。当然，也有其他不少评论家预测人工智能蕴含着许多危险。面对人工智能，我们应谨慎对待，深入了解，以科学的态度来对待新兴技术和它们为生活带来的改变。

本文内容资料均来源于网络