人工智能的语义学基础

快读书馆 2017-11-07

展开全文

一人工智能的语义学问题源起

人工智能作为科学与哲学研究所共同关注的领域，自诞生以来就一直在其发展过程中面临着诸多的理论困境与矛盾，其中最有意义和价值的一个问题就是人工智能如何才能够确立起其必要的语义学基础的问题。这一问题的研究，既关乎人工智能是否能够实现高层次的理论突破并增强其实践效力，同时也是传统语义学研究实现理论升华并最终构建起科学的、完整的语义学学科体系的必然出路。目前，人工智能的语义学研究所面临的三个最主要的问题在于：

1. 自然语言的意义如何才能够在符号推演的程序设计过程中加以表征？

2. 语义在形式语言的概念化过程中如何才能够获得其意向性的陈述？

3. 应该如何为人工智能的语义学研究确立起统一的、系统的理论框架？

传统人工智能研究的弊端在于，对于人的思维过程的模拟并不能够完全以形式化构造和符号化推演的方式来加以实现。例如，现有计算机的智能模拟是一种基于符号句法属性的认知模拟行为，这使其在语义理解和学习层面上存在着极大的短板：计算机的符号检索和操作行为本质上并没有涉及语义的逻辑推理，而计算机仅有的“联想”能力是建立在符号规则的有限归纳基础上而实现的，因此“语义解释在任何语言处理系统中都是非常重要的，因为单纯的句法分析使用结构性的规则并不能很好的应对自然语言的模糊性问题”。也就是说，在现有的计算机系统中，“意义”并不起作用，这就使得强人工智能的宏大构想遭遇到了极大的挑战。当代的脑科学和神经科学的研究表明，人的大脑思维并非是一种知识、信息不断累积的线性运作机制，而是一种成系统的、具有动态性特征的开放性网络。然而，目前已有的人工智能理解、翻译的程序是：采用低阶的概念、词条以解释高阶的概念和词条，这种语义处理程序仍然未能摆脱以语法决定语义的思维定式，同时也与人类实际的语言思维能力存在着差异。以计算机科学为例，语形符号作为程序分析与处理的基础元素，具有高度的抽象性，它本身是一种对于概念和语词的符号化表征。在这种符号化的过程中，丰富的语境信息和内容被屏蔽掉，以便于集中进行程序的逻辑推理和计算。问题在于，从世界事态中抽象出来的符号形式运作机制，原初的目的理应是满足于实际的事态需要，而近端的符号形式在运作过程中却不可避免地偏离了远端的实际事态，“对于数字计算机的概念关键的是其运算能够被纯形式的来加以确定…这些符号没有意义，并且没有语义内容，也与其他事物无关，它们只能单纯的依据形式的或者句法的结构来确定”。因此，涉及语义、语境的内在结构和关系以及人类大脑结构的联想、想象等超形式的信息联结在计算机近似独立的单元编码过程中是很难实现的。

相对形式语言而言，自然语言的语义分析功能更能体现出人工智能的本质特征。人工智能要想实现其在一定程度上的智能自主性、独立性，必须有能力对于人类的自然语言进行分析和处理，这就要求我们必须充分了解自然语言加工处理的内部机制，同时也必须深入研究自然语言意义的理解、交流及其互动语境的特征。那么，人工智能如何对于人类运用自然语言的能力进行模仿并复制呢？在这一点上，自然语言的语形与其所表征的概念之间并非总是处于一种直接关联的状态当中，而是还伴随着隐喻表征和意向说明等更为广泛的语境要素的介入。

我们知道，意向性是人类心智区别于计算机－机器的显著特征，而意向性就意味着语义性，即语言对于外部事物的一种指向关系，这种指向关系超越了单纯的语言本身和外部事物本身，从而使得这种 “指向”具有了意义和价值。然而，目前计算机－机器所构造的信息内容与世界事实之间的关联是被动的，而不是主动的。由于现有的智能机并不具备类似于人类一样的分属于不同层次、类型的意向性结构、机制，因此它很难对类似于在人类心智之中的 “虚拟指称”等问题做出回应。相对而言，人类的心智却能够妥善的将虚拟对象与外部实在对象进行自动区分，从而使得“虚拟指称”能够获得某种心智系统之中的意义，“计算机程序只是语法的，而心不仅是语法的，也是语义的。换句话说，心灵不仅是一个形式结构，而且也是有内容的。事实上，塞尔的 “中文屋”思想实验早已论证了计算机程序与人类心智之间存在的差异性，因为计算机程序本质上是以句法和语形构造为基础的，而人的心智却包含了特定的语义内容，并且人的思维能够有意识地将符号指向与其相对的目标物。因此，塞尔所提出的 “人工智能难题”的核心就在于，人工智能并不具备类似于人类主体那样的“意向－理解”能力，而“塞尔的“中文屋－机器”实验是一种对于意向性形式计算路径的反驳”。

如前所述，智能是一种具有“意向性”和“意义”的心智运作过程。问题在于，我们应该着重为“智能”本身所赋予的究竟是一种本体论的立场抑或是一种认识论的地位呢？很显然，对于人类而言，智能是一种复杂的大脑运行机制，这一运行机制的主体是人，即“智能”是主体“人”所具有的一种附属特征。在人类心智的活动过程中，主体以语境为基础，以行为目标为导向，由此而建立的信息模型的意义是相对于“主体”而言的，“意义”离开了这一“主体”也就自然地失去了意义。因此，人工智能的终极目标就是使机器－计算机具有类似于人的思维性，而人的思维本身不同于单纯的知识和信息库，其最鲜明的特征就是具有意向性，也即语义性。

目前来看，无论是就计算机科学的研究而言，还是从工程学的角度来说，人工智能的意向性语义学研究尚停留在初步的预测、假说阶段，其未来发展还有很长的道路要走。因为，机器的“意向性”是与人类心智的意向性存在差异的，所谓机器的“意向性”在现阶段实际上仍然只是一种外在的、非主动的模型解释，而解释的主体却是人类。对于人们所期望的人工智能的意向－语义能力来讲，无论是强人工智能理论，还是弱人工智能理论，其实它们只是在对于智能机器意向-语义性的理解上存在一些程度的差异而已。例如，强人工智能的心脑分离学说——— 即认为心灵可以独立于大脑物质和生理结构而存在的思想固然为人工智能的发展奠定了其最初发展的语义学基础，但是计算机符号处理程序的完善本身却并不意味着机器就已经具有了意向性。说到底，强人工智能也只是从功能上对于计算机符号语形表征的一种进一步强化，“强人工智能是建立在二元论思想基础上的…它认为心智只是一种在自然界之中的生物现象”。换而言之，心智的“意向－语义性”是人类所独有的，而我们所构造的人工智能只是尽可能地从结构上、内容上和功能上对于人类心智的模拟，任何计算机－机器程序所具有的意向性因果能力都无法和人类的心智系统本身相提并论。

二人工智能的语义学系统构造

我们对于人工智能的语义学基础的研究，其中很重要的一个出发点就是由关注符号表征的浅层 “结果”转向考察符号表征的深层语境基础，希望由此勾勒出人工智能运行过程中语义的组织结构和作用机制，并且将语义问题与智能展开过程的其他层面贯通起来，从而树立起整体的、系统的人工智能语义观。

历史地来看，乔姆斯基立足于心理语言的深层结构对于人类语义理解机制的研究可以说为人工智能的语义学系统构造奠定了初步的基础。众所周知，意向性是认知的本质，而意向性的本质既是一种关系的结构，同时也具有其特定的内在属性。也即，人类的大脑结构本身所具有的特征决定了其既受制于存在的环境并且与环境之间存在着信息的交流，同时也在大脑结构内部形成了活动的心理空间和心理内容。在心理的内部表征过程中，语义的传导和修正不同于计算机的算法结构，而是依据神经元结构的生理机制来加以完成的。为此，我们有必要在人工智能的研究过程中借鉴这种非逻辑化的语义策略，沟通信息表征与传递的中间环节，进而实现人工智能语义系统动态化、语境化的构造。

我们知道，计算机或机器具有语义性的一个主要特征就在于它能够主动地建立起机器符号与实在世界之间的关系。这种关系实际上体现为一种智能自我发现和认识的能力，它使得智能主体获得了一种用符号指示外部事物的能力，从而能够为符号赋予一种相对明确的意义。也就是说，在智能机器系统中，符号的意义不应当是固定的、抽象的、静态的，而应当是变动的、具体的、动态的，其意义需要依赖于特定的语境来加以确定。由此出发，我们认为，人工智能意向－语义能力的真正实现需要将人的语义解释机制内化为机器－计算机的系统结构，并且使其与机器－计算机的运行机制深入结合起来。例如，人工智能所涉及的计算语义分析需要模拟人类大脑的语义信息概念化的过程和语言概念符号化的心理机制。回顾历史，传统人工智能所采用的是表层－低阶的概念语义结构设计程序，尽管它非常重视语义的形式化表征层面，但它却忽视了类似于人类心智活动的语义整体运作机制的特征，而本质上语义的形成、解释和理解却是与人类作为系统的认知结构不可分割的，“在（计算机）赛博空间（CybeSpace）所使用的低阶语义学和人类所使用的高阶语义学之间仍然存在着巨大的语义鸿沟”。因此，要想使得人工智能的语义学基础能够在理论层面上更加巩固与完善，我们就必须深入考察人类的认知结构是通过什么样的方式、以什么样的形态来完成心智的语义构造过程的。在这一点上，由于人类心智的语义机制涉及大脑的神经反应、感知体验、语言表征等要素，因此智能系统的语义问题实际上也是人类作为整体的认知问题，只有深入研究人类认知的发生、起源、作用及其反馈机制，我们才能够更加全面地完善人工智能的语义系统。事实上，当代认知科学的研究已经表明，人类的思维本身并非是一种简单的符号运算过程———在自然语言背后所潜藏的是人类特定的认知图式，这种认知图式居于语词、概念的深层机制当中，而这种认知图式实际上就是自然语言的一种元语言———这种元语言不是一种静态的存在，而是一种处于动态发展过程中的、开源状态的存在，正是这一元语言机制为自然语言赋予了丰富多样的意义可能性。因此，人工智能的实现应当模拟这样一种元语言的意义处理机制，从而提升其智能水平。从某种程度上来说，人们使用语言的过程，就是人们展开认知的过程，因而人们对于语言意义的理解也就是认知的语境综合作用的结果。但是，语言的意义又绝不仅仅是一种内在的心理表征，而是一整套心理活动、操作的过程，“思维不仅能够对于没有意义的符号进行处理，而且还拥有关于意义的语义内容，这些语义内容即我们通常所谓的“意义”。从语用的层面上来看，人类的语言是一种与世界、实在交互作用的产物，而语言的“意义”就产生于这种交互作用的过程之中。

对于智能机器系统而言，语形和符号只是意向－意义的前提与条件，实在的对象要想成为有意义的意向性对象，必须有意向性机制的参与和作用。必须认识到，人脑的意向性活动机制是人工智能极力模仿的对象，同时也是计算程序和推理获得其 “意义”的关键。问题在于，机器－计算机如何才能够“主动”的把符号、概念和与其相关的事物联系起来呢？本质上来看，这种“主动性”就是人类心智意向性特征的独特表现。在这一点上，心理表征理论认为，意向性与心理表征之间存在着必然的联系，而正是由于心理表征具有“指向”某物的意向性特征，它才因此具有了语义属性。也就是说，心理表征与意向性之间存在着特定的关联，正是意向性决定了心理状态和心理内容具有意义，“思想在本源上具有意向性，因为构成它的心理表征的意义并不能源于其他的意向性”。由此可见，人工智能要想达到类似于人类一样的心智水平，我们就必须明晰意向性这一独特的心理现象存在的特征与方式，了解意向性现象产生、发挥作用的条件和前提，进而建立起特定的仿照人类心智的意向性运作机制，从而实现人工智能由“句法机器”向“语义机器”的转换。

在人工智能的研究过程中，如何在句法和语义的联结中去超越句法而实现语义的完整表达和交流，这是人工智能研究的一个重要突破点，这样才能够使得由符号所构成的语句具有类似于命题的真值。我们知道，命题态度是与心理状态直接相关的，它本质上是心理语句的一种特殊属性，而心理语句同样具有语形和语义两个构成层面。在这里，应当指出的是，心理语言区别于自然语言，心理语言的语义性并非来自于自然语言的语义性，因此由心理语言作为基础的心理意向性本身必然具有其特殊的语义性，这种心理意向的语义性就表现为“指向性”和 “关联性”等特征。问题在于：人类的心灵是否是一种句法机制呢？心灵的本质是否与计算同源呢？另外一个问题是，人类的心灵是否是一种语义弥散式的、去中心化的控制网络呢？在这方面，人工智能的联结主义理论认为由神经元的相互作用而产生的复杂联结网络构成了人类心智语义运作的基本框架， “联结主义系统能够利用和模拟…大脑的计算机制”。显然，在这里，由关注于语义的表征而转向关注于语义产生的具体机制，这间接地为人工智能的发展开辟了广阔的发展空间。

如前所述，人工智能的语义学在实现规范的语形构造的同时，必须考虑语义具有整体性的心理意向解释背景。在人工智能的运行机制中，一方面，意义的实现与语言的形式构造必然地相关，但是这种实现是建立在系统的算法“处理”基础上的，由此便能够建立起以语形为表层机制、以语义为深层机制的内在关联体系。另一方面，语义的构造——输入与解释——输出是一个复杂的运作机制，各种具有语用化特征的信息集合为人工智能的运作机制提供了一个基于事实的计算语境。因此，人工智能的语言编码必须考虑语境要素和条件对于概念、命题意义的决定性作用，而人工智能的意义构造也必须考虑其机器符号形式与解释者之间的动态关系，并且使得意义与语境的信息状态相互关联。可以看出，对于人工智能的“意义”理解能力而言，在某种程度上意义就意味着语境，而具体的语境也决定了意义的不同类型与特征。这也就是说，人工智能的意向性－语义理解能力的获得必须有一个结构性的、多维界面的本体论语境作为依托——这些与人工智能的意向－语义能力相关的语境要素包括：意义－语境的选择、意义－语境的表征、日常语言语境的使用习惯、历史和文化的语境渗透等。在这里，符号和语形是智能表征的工具与中介，语义是智能机制的核心，而语用则是智能驱动的动力来源和基础。可见，人工智能的语义能力要求其既具有即时性、有效性与具体性，同时也要求其具有长期性、稳定性与抽象性。换句话说，人工智能的语义学系统必须建立在动态性和稳定性、抽象性和具体性双向统一的理论基础上，必须有能力将符号体系与其所指的对象关联起来，并且在语境的基础上主动地检索、调集信息进行处理，进而实现有意义的理解和解释行为。

三人工智能的语义学难题求解

对于人工智能的未来发展而言，与之相结合的语义学研究为人工智能突破理论瓶颈、破解实践难题起到了基础性和支撑性的作用，这就要求我们从哲学和科学研究的双重视域出发，理性地看待人工智能的理论定位问题，妥善地解决有关于人工智能的各种思想论争，并且我们有必要借鉴和引入语境论的思想，以加深对于人工智能语义学问题求解的理论效力。

以人工智能的语义运行机制为例，早期的冯诺依曼计算机系统设计了一个位于 CPU 上阶的 BIOS 微系统，这一微系统执行着整体智能程序控制和下发运行指令的功能。然而，冯诺依曼的这一独特的程序机制实际上是从本体论上假设了人脑具有一个生理结构基础之上的独立心理世界——这一思想就是从笛卡尔心物二元论演变而来的心智“小人说”。事实上，人工智能的最新发展已经证明了这种内在语义论的、还原论式的程序设计理论的缺陷，因为自然状态的人类智能语义的实现并非是一种封闭的、局限的活动，而是一种基于语言应用和语境信息的开放过程。由此可见，人工智能的语义学基础构造尽管在一定程度上具有其本体论和形而上学的背景依据，但是其进一步的发展却必须摒弃纯粹抽象的思辨，并且借助于科学实证的原则来建立起人工智能的科学语义学基础。

从人工智能语义学研究的视域出发，人们发现，规范语言语义学和自然语言语义学在理论趋向上尽管存在差异，但是它们在彼此之间却存在着可以沟通、协调和统一化的可能性与必要性。从规范语言语义学与自然语言语义学各自的理论特征、研究对象来看，早期的逻辑经验主义者实际上是以确定的语义为目标导向而寄希望于逻辑语形的构造策略，这一策略遵循的是由语形再到语义的研究路径， “规范语义学模型认为语词的意义是在一种脱离语用语境的情况下被确定的”。相对而言，日常语言学派则奉意义的语用化理解为圭臬，倡导回归到纯粹自然语言分析的研究策略，这一策略遵循的是由语用再到语义的研究路径。可以看出，规范语言语义学和自然语言语义学在对于“意义”的探索方面，完全延续了差异化的理解思路，从而导致了多年以来双方之间的论辩与对峙。从规范语言语义学与自然语言语义学各自的发展动态来看，规范语言的语义学作为人工智能理论研究的基础，如果不突破规范语形的逻辑限制而间接通达于语义和语用的层面，它就很难在模拟人类实际心智能力方面取得成就，而自然语言的语义学如果不借助于逻辑语形的方式来加以表征，它也很难获得一种切实可行的程序来实现语义的“复制”与执行。也就是说，以行为目标和语用表征、交流为导向的自然语言表达并不会自发地通过一种逻辑化的策略和语形构造的方式来得以抽象化，而人工智能作为一种主体“人”之外的思维创造物却不可避免地需要借助于抽象的语形手段来建构起类似于人的大脑的概念框架。因此，从人类思维到人工智能，这实际上是延续了一个由语义到语形的抽象化再到由语形到语义的具体化的复杂过程，而以语义研究作为核心的人工智能是希望在规范语言语义学与自然语言语义学之间建立起可沟通的桥梁和管道，从而建立起语形－语义－语用的相互关联的系统结构，这从本质上揭示了人工智能的内在运作机理。从语境论的思想来看，人工智能的功能主义学派和结构主义学派之间也并非是完全对立的，而是相互协调、有机统一的。在人工智能的研究过程中， “图灵机”－功能论和“中文屋”－结构论的思想趋向之间并非是矛盾的、不可调和的，而是相互结合的、存在一致性的，两者实际上都揭示了意向－语义性现象某一方面的特征。事实上，无论是功能论的观点，还是结构论的观点，它们都不能忽视人类语言意义与其背后的语境之间的结构性关联，正是这种关联为语词赋予了语义性。作为智能机制的语义理解能力如果只是停留在思想内容的内部循环中而不能实现外部表征，显然是没有意义的。因此，对于人的内在心智语义结构的探索固然是人工智能语义能力获取的动力，但是要想使得人工智能在每个现实的发展阶段上都得到语义能力的充分展现，就必然要求其在符号的编码和程序的设计过程中以特定的功能实现为导向，并且忽略部分心智语义结构的特征，这是一种不可避免的人工智能语义学操作策略。针对上述一些人们所提出、借鉴和探索的人工智能的语义学研究路径、发展策略和理论趋向来看，我们的问题在于，应当如何科学地看待人工智能类似于人类心智的“意向－语义”能力呢？显然，人的思维机制对于语言的运用并没有遵循类似于人工智能程序设计的线性规则，而是以语义为基础形成了若干不同层次和类型的语义结构，这种复杂的语义结构支撑起了人类可被称之为理解性思维的心智能力。也就是说，在人类心智结构当中，语义的运作具有一种动态性的特征，这种特征表现在：人类心智能够准确地从丰富的语境当中做出信息的选择、判断和识别——而现有的智能机器却并不能够超越形式系统而具有把握外部信息的能力，“语义网络应当为信息表征提供一种便利的结构，以实现知识的连续性推理”。

事实上，认知科学的研究已经表明，语义问题并非仅仅是一个单纯抽象的理论问题，而且也是一个与人类多重认知结构紧密相关的脑科学、神经科学问题。这就意味着，人工智能的语义学基础构造联结了哲学和具体科学的双重层面——只有从语言哲学和认知科学相互交叉、融合的角度与视域出发，我们才能最终找到破解人工智能语义构造难题的有效路径。对于一个类似于人类心智的智能系统而言，语义－概念－符号是智能表征的基本程序，这一程序充分表明了语义在智能活动的展开过程中所具有的作用和功能。应该注意的是，在上述程序展开的过程中，无论是由语义到概念，还是再由概念到符号，中间都存在着一个联结、转换和过渡的中间环节，脱离开任何一个中间环节，智能活动的展开都是没有意义的。就人工智能的语义内容而言，上述三个阶段展开的过程都会发生语义的减损和偏差，原因是概念的符号化和形式化的构造在一定程度上会远离语义酝酿和产生的实在语境，从而使得语义内容的传递影响到了智能模拟的最终效用。因此，对于人工智能而言，符号语形的演绎是必要的，但绝对不是充分的，只有将语形的推理向后回溯，使得语义的本真内涵在智能展开的过程中形成链条化的、前后延续的状态，这样才能使得人工智能的内在机理与人类心智的结构特征更加接近。

对于在人工智能的研究中至关重要的语义自主学习和反应能力而言，我们需要为智能机器的程序寻求建立一种在具体语境中确定和“发现”语言意义的机制。其原因在于，句子或者命题的意义不是固定的、一成不变的，而是会受到语境的强烈渗透和 “感染”，这就对于人工智能的“意义”理解功能提出了更高的要求。具体来看，人工智能对于人类心智意向性的模拟也是使得其自身获得意义的必然途径，未来的人工智能的发展只有使得智能机器获得主动展开语境信息判断的能力，进而在其内部结构系统之中对于语境相关信息进行有效的处理，并且将这种处理的结果反馈于与其存在语境的互动之中，人工智能的语义学基础才能够真正地得到辩护和巩固。同时，人工智能的信息库应当具有静态和动态的双重特征，它不仅应当实现语义的表征，而且必须具有元信息推理、分析的能力。也就是说，人工智能的参数设计不仅应当包括句法、语形规则，而且也应当将语境参数融合起来，从而在模拟人类智能的前提下实现自然语言的超形式动态化处理，“意义是潜在的随语境而转换的……动态的语义学……整合了计算机科学、认知心理学和人工智能等不同领域研究的成果”。可以看出，人工智能未来发展的突破路径就在于必须将理性规则与非理性模块结合起来、将意义的语形界面和语义、语用界面充分结合起来，从而为人工智能运行机制的目标性、主动性特征的完善提供更加有力的支撑。