面向本体和Agent的常识知识库系统

Taylor 2005-10-18

展开全文

面向本体和Agent的常识知识库系统《盘古》

在国际人工智能界，一直公认常识性知识的处理是人工智能的核心难题。所谓常识，是相对于专业知识而方言的，专业知识被广泛应用于各类专家系统和应用软件之中，人类积累的专业知识虽浩如烟海，但比起常识来，专业知识还只如小巫见大巫，McCarthy曾指出：缺乏常识是当前专家系统的一大弱点。

常识问题的一个非常重要的研究方向就是常识和常识处理的数学模型，这里涉及到常识的各种表示（一阶逻辑、产生式系统、语义网络、神经元网络等），以及常识处理的各种原则（演绎、归纳、定性推理、模糊推理、非单调推理、次协调推理等），尤其非单调推理和非单调逻辑是专为研究常识推理中的非单调性而提出来的。有关常识问题的各种理论研究大大推动了常识推理研究的进展，其中某些研究已经开始向实用方面发展，例如利用非单调推理作真值维护。但是，这些研究就其主要方面来说还是理论研究，缺少“重量级”的应用，其原因主要是常识及其推理的特性广泛、模糊且复杂，例如：Sowa把常识比喻为“知识汤”，曹存根把常识比做知识云。非单调逻辑的研究仅仅抓住了常识推理中会出现非单调性这一特点做文章。实际上，常识推理中还有许多各种各样的特性有待于深入广泛的研究。

Feigenbaum从另一个角度强调知识的重要性，但他更重视的是专业知识，受他影响的Lenat前几年开始搞一个CYC计划。其理论基础是他们提出的所谓“知识原则”三阶段计划：通过构造一个海量知识库，第1阶段可支持相当大一部分现有问题的解决，第2阶段可用类比推理解决很多新问题，第3阶段可以令计算机自己发现知识，这是一个野心勃勃的计划，评论者对此意见纷纷。许多人认为这个计划是难以实现的。另外，Lenat等人正在建的CYC海量知识库，并没有考虑到专业知识和常识的界限，其重点没有放在常识本身。有人就批评他们把收集来的大批技术报告整本整本地录进知识库中，这种做法并不能提高人们对常识性知识的本质的认识，也难以使常识性知识库真正达到实用的地步。真实上，我们至今未见的CYC实际应用的报告。

我们研究常识问题走的是另一条道路。我们建立了一个大规模的常识知识库，并探讨利用常识知识库来解决一些实际任务（如机器翻译、自然语言理解）中涉及的常识问题，在此基础上进一步探讨一般的常识性知识的处理和实用问题。我们的工作在如下几方面与CYC不同：（1）我们的研究对象主要不是专业知识，而是地地道道的日常生活中的常识；（2）我们的研究对象不仅是自然现象中的常识，而且包括社会生活中的常识；（3）我们建立的常识库不是目前已有的各种知识的堆积，而是在深刻分析了常识性知识的本体论后按其内在的联系有机地组织起来的；（4）我们建立的常识知识库将面向广泛的应用，而不仅仅是简单的知识查询；（5）由于有实际应用背景，我们的工作将避免CYC的毛病：过于一般地收集百科全书式的知识，我们的常识知识库将更加实际有效。

常识知识库的组织形式是一个关键问题，需服从于功能要求。我们的常识知识库的功能粗略地分为3个层次。最高一层是应用层，解决各类不同应用领域的特殊问题。中间一层是问题类型层，归纳出各种不同的提问内容和方式。注意：不同的应用领域可以有某些相同的问题类型。最下面一层是问题表示层。表示的基本形式是语义网络Csnet。下面是一个不完全的应用层功能清单：

（1）常识查询。如“请回答：为什么新鲜牛奶要煮过才能喝？”

（2）常识检查。如“请检查‘公主在眼镜里游泳’这句话是否符合常识”

（3）常识展开。如“请根据本故事的上下文给出‘公主和王子结婚’的过程细节”

（4）常识联想。如“‘床上有一个足球，一块毛巾’，请对此情景给出解释”

（5）常识排疑。如“‘张三打了李四，他很生气’，这里的‘他’指的是谁？”

（6）常识分析。如“王五去打醋，过一会儿提着空瓶回来了’，这是怎么回事？”

（7）常识对话。如“用户输入‘我的表停了’，请设计一句应答的话”

以上功能涉及机器翻译、自然语言理解、动画自动生成、自适应人机界面等多种应用领域。为了实现这些功能，我们考察了已有的各种知识库的形式。通常专家系统知识库采用的规则、框架、产生式等表示方式在描述那些知识汤、知识云，用它们来解决上面列出的问题，其描述能力就显得过于简单了。Lenat的CYC系统原则上采用一阶谓词演算加框架树作知识表示，以框架树表示基本知识（客观世界中物理和精神对象的分类体系），以谓词演算作推理手段，并为每个问题领域建立一个微理论（公理体系）。经过10年努力，耗费200人年的工作量，才建立起一个拥有百万断言的知识库。易于看出，这样的知识表示和知识库结构还是以面向专业知识为主的。CYC中虽然加进了部分非单调推理功能，但这主要是一种理论上的点缀，并不能解决许多实用问题。基于对所需功能的分析，我们为常识知识库确定了如下组织原则：（1）常识知识要模块化，每个常识单元由一个专家代表，实行专家负责制。（2）专家按纵横双制组织。纵制是父子式的继承体系，如黄牛专家继承牛专家的知识。横制是联想式的网络体系，如由毕业生联想到就业。（3）专家通过讨论和合作共同解决问题。（4）允许模糊推理、不精确推理和非单调推理。（5）专家具有学习能力，能在推理过程中增加知识。（6）知识库具有自动维护能力。（7）专家之间的通信采用KOML及其扩充版本FOML和YOML。

为此，我们选定Agent作为专家的表示机制，以Agent类属作为纵向继承体系，并按本体论原则组织各Agent的横向联系。我们的常识存储是分布式的，它不仅体现在单个Agent的个体知识之中，而且体现在Agent集体的组织结构之中。由于常识性知识极其模糊和无边无沿，本系统起名为Pangu(盘古），取其劈开混沌，区分清浊之意。