信息生态学与语义信息论

虎牙变大猫 2018-01-29

展开全文

【编者按】２０１７年９月１4日，北京邮电大学计算机学院智能科学技术中心钟义信教授应邀在武汉大学信息管理学院作题为“信息生态学与语义信息论”的学术报告。经钟教授审阅并同意，本刊根据录音整理成文刊出，以飨读者。
［摘要］　提出了一种全新的信息科学方法论，从语义信息的生成机理及其在信息生态链条中的地位去理解语义信息，然后对其进行定义，强调语义信息是全信息的合法代表。讲座专家认为，语义信息的主要功能是支持内容理解，而不是数值计算，所以，信息科学进入到语义信息的新阶段具有里程碑意义。
［关键词］　信息生态学　语义信息　信息科学　方法论

１引言

人类生活在社会上，为什么能够生存？为什么能够发展？有很多秘密，但最重要的一条就是人类有办法把资源通过加工或处理，变成生产工具和消费产品，包括精神产品与物质产品。这样人类就有能力，一方面利用产品维持生存，另一方面有更好的生产工具向前发展。所以，如何把资源变成产品成为人类社会最基本的发展途径，也可以称为奥妙。

不同时代的科学技术发展水平不同，人类所能够利用的资源也不同。农业时代是物质资源，工业时代是物质资源与能量资源。在信息时代，除了对物质资源与能量资源的利用，人们也越来越明白怎么样利用信息资源，来不断研究和制造更加先进生产工具，更加丰富多彩的物质产品与精神产品。因此，把信息资源转换为这个时代的生产工具和各种产品，就成为我们这个时代“求生存，谋发展”的关键和核心能力。这个能力越强，信息生产的能力就越强，同时，信息生产的结果也会越来越丰富，越来越好。所以，信息问题是这个时代的基本问题。我们的生存发展依赖资源，没有资源就无法加工成工具和产品，那人类就只能停留在工业时代，甚至更原始的时代。既然信息资源如此重要，那什么是信息？而且为什么要特别关注语义信息？

２对经典语义信息理论的思考

２．１从“信息”到“语义信息”

我们所熟知的信息理论起源于通信领域。１９４８年，贝尔实验室的数学家与工程师香农（Ｃｌａｕｄｅ　Ｓｈａｎｎｏｎ）发表了《通信的数学理论》，它是关于信息载体（数据：信号波形）的传输理论（统计性语法信息理论）。通信的关键就是把信息从一个地方传递到另一个地方，为使信息传递效率高、可靠安全，需要一系列的技术（理论上是三个编码定理和一系列编码技术）来保证。

图１是迄今全世界公认的稳定了的信息模型，从发送端发出一个信息，信息本身是看不见摸不着的，需要一定的形态表示它，如把声波的振动转变为电信号（波形就是携带了信息的形式）。人类处理的信息是有内容的，但通信不关注内容，只关注波形从发送端转移到接收端。由于传送信息的通道（信道）一定会存在各种各样的噪声，波形Ｙ就和波形Ｘ不一样，需要从波形Ｙ中提取波形Ｘ，其中包含的编码理论、方法和技术就表达了香农信息论的基本思想。
　　从发端到收端，这个信道到底传送了多少信息？这里有一个互信息的公式：Ｉ（Ｘ；Ｙ）＝Ｈ（Ｘ）－Ｈ（Ｘ｜Ｙ）＝Ｈ（Ｙ）－Ｈ（Ｙ｜Ｘ）。Ｉ（Ｘ；Ｙ）表示Ｘ（发送端）向Ｙ（接受端）所传送到的信息量，叫做互信息量。Ｈ（Ｘ）表示Ｘ的不确定性，Ｈ（Ｘ｜Ｙ）表示Ｙ出现的情况下，Ｘ的不确定性。通过比较收到Ｙ前后的不确定性，两者的差值，即为收到的信息量——互信息量。

在通信领域，这个公式应用很多，互信息量是一个基本量，通过这个公式可以计算信道容量、率失真函数等问题。这个理论，一方面，大家承认了它的有用性与合理性，另一方面，很多人觉得不够了，其中有一个最重要的问题：信息不都是统计性的，概率不能涵盖非统计信息（模糊、混沌、粗糙信息），当信息论应用在其它领域时，具有不适用性。更为重要的是，它只关注信息的形式（如二进制编码０１０１０１），不关注信息的内容。而人类在使用信息时，最关注的还是信息的内容与价值。因此，香农的信息论就不够用了，也就出现了新的研究。通常我们知道：形式、形式所包含的内容、形式与内容体现出的对用户而言的价值，这三者是并存的。香农信息论只提供了形式上的描述与计算，没有涉及内容，因此，香农信息论提出后，很多人进行了语义信息的研究。
２．２经典语义信息理论面临的问题

从上世纪５０年代开始，就有人对语义信息进行了研究，那一段时间所研究的语义信息理论也称为经典语义信息论，现在也有人在研究语义信息，但这些研究也可归纳为这一类。这里所说的“经典”只是表明“以往的研究”。

经典语义信息理论的研究，主要存在以下问题：第一，以往所建立的理想语言模型与真实的自然语言模型相去太远，主要是为了研究语义信息，建立的语义模型过分简单，这种模型有助于理论研究，但不利于理解语义信息的全貌，因此也就没有实际价值；第二，从上世纪五十年代到最近，语义信息理论的研究受到了香农信息论的束缚，建立语义模型后，计算语义信息的量，用研究语法信息的方法去研究语义信息，完全没有涉及语义信息的实质，即语义信息的内容与逻辑演绎。实际上，我们往往并不关心得到了多大的语义信息量，顶多是关心几个语义信息之间的相对值（序或偏序），以及这个语义信息是否有价值。语法信息理论需要特别关心信息的数值度量问题，因为它必须计算传输语法信息所需要的通信资源。语义信息理论的主要关注点是它的内容理解和逻辑演绎能力，数值度量则将退居其次。因此，经典语义信息理论的研究没有抓住语义信息理论的本质。

３从信息生态学视角看“语义信息”

我们需要重新来研究语义信息，语义信息的定义是什么？语义信息不是一个孤立的概念，不能随意定义。信息有自己的生态系统（或简化为生态链），这个链互相之间有制约关系，必须满足这条链上前因后果对它的约束。语义信息存在于自己所依附的“概念生态系统”之中：它的根是信息，而信息过程是一个“生态系统”。因此，我们不能随心所欲地定义“语义信息”，必须扎根于信息的概念，而且要服从“信息生态系统”的制约。什么是信息生态系统？语义信息处在信息生态系统的什么位置？应该满足什么要求？回答这些问题后，定义的语义信息才比较科学。

３．１信息生态学：一种新的科学方法论

方法论是科学观的体现，是科学研究方法的宏观指南，也是科学研究的源头和龙头。所以，不能不高度关注。古代科学方法论是笼而统之的整体论，难以深入下去。到近代，人们最熟悉的方法论是“机械还原论”，它的特征是：用“分而治之”的方法来处理复杂问题。这种研究方法是工业革命以来（牛顿力学以来）我们惯用的，对物质科学发挥了很大作用。分而治之方法论主张把问题细分，使许多子科学、子系统的研究得以深入，因此，推动了科学研究向广度与深度发展，促使了近代科学的繁荣。但是，在信息科学、智能科学场合，这个方法论已经不够用了。用机械还原方法论研究信息科学，把后者分割为一群互不相关的碎片，丢失了碎片之间的关联，因而也丢失了总体规律。

信息生态方法论的精髓：从保障事物生长的多样性与和谐性出发，强调研究各个事物之间的相互关系，以及这些事物与环境之间的关系。还原论与生态论结合，才能揭示复杂事物的规律。信息生态学不是一个简单的技巧，不是一个简单的编程方法，也不是一个简单的测试电路方法，而是一个方法论，和“分而治之”相辅相成，对科学的发展做出了且将继续做出巨大贡献。信息生态学告诉我们在分而治之的基础上，把这些分离开的局部的碎片综合起来，找到它们的相互关系，找到相互作用的道理，恢复这个系统的整体原貌。否则，单是局部碎片不能等价于原系统，不能发现原系统的规律，所以信息生态学作为一个新的方法论，可能会对未来发展产生重大而深刻的作用。

用还原论进行信息科学和人工智能研究时，就看不见分支学科间的关联。上世纪八十到九十年代提出了交叉科学。为什么要提出“交叉学科”？原本关联的学科，被分而治之的方法分成不同的学科，学科之间不沟通，各自发展，变成孤岛。交叉学科则指出它们之间还有一定的关系，应该互相借鉴，互相交叉。在信息科学领域，由于仅仅运用了“分而治之”的方法论，使各个分支学科互相之间的关系没有得到关注，产生了很多碎片，而碎片化最重要的影响是忽视了信息科学整体的内在联系、规律和原理。不能把握总体是最大的损失。信息系统最大的原理就是“１＋１＞２”，系统整体作用大于单元作用之和，系统和单元是不同层次。因此，要将不同碎片间的联系恢复起来。

信息科学包括人工智能，人工智能是信息科学的一部分，是信息科学的核心前沿与制高点。人工智能的关键也在信息，因为人工智能源于信息，长于知识，成于智能。信息是源头，如果源头没有了，人工智能就是无源之水，无本之木。实际上，人工智能发展还很不成熟，总体规律的丢失是一个巨大的全局损失，我们应当努力去恢复总体规律。信息生态方法论最大特征是强调相互作用与相互关系。因此，光有“分而治之”不能解决复杂信息系统，需要关注“信息生态”这个方法论。

３．２信息生态系统的研究模型

客体是环境中存在的各种事物；主体可以是人、动物和植物。复杂系统最典型的主体是人，主体有两个特征：目的和知识。主客体之间的相互作用代表了万千世界的活动。它们怎么相互作用？

首先，客体在运动，就会产生信息（也即事物运动状态和状态随时间的改变方式），客体产生的信息称为客体信息，它作用于主体；主体为了更好的生存，必须对客体信息做出响应。为此，就需要在目的引导（牵引或支配）下，把知识转换为符合客观规律和环境要求的智能行为。在主体内部的这一系列的转换，直至生成智能行为，这就是人工智能研究的核心问题。智能行为的产生与主体目的和知识两者有关，所以，客体信息进到主体系统，一定要经历这些转换。从宏观来看，在目的引导（牵引或支配）下，利用知识对信息进行转换，最终产生智能行为，简单的来说就是“信息转换与智能创生”。人产生智能行为需要有一定的创造性，人工智能也是一个信息转换与智能创生的过程，也具有一定的创造性。可以说，这个简单的信息生态系统对人工智能发展具有重要启发意义（见图２的主客互动模型）。

对主客互动模型进行深化，可以得到图３的模型。这个深化过程包括如下步骤。第一步，主体要具有感知能力，人作为主体对客体信息进行感知（即感受＋知觉），判断客体信息对主体的目标而言是否有关，如果无关，就舍弃（即不予理会）这些信息；如果有关，就予以处理，产生感知信息（主体感知到的信息）；第二步，通过认识活动，实现感知信息向知识的转换，产生知识；第三步，综合基础意识、理智与情感，生成综合决策，形成一个智能策略；第四步，通过执行系统，将智能策略转化为智能行为，从而解决环境中的问题。

通过这些转换过程，主体认识了面临的问题，也解决了问题。对人类来说，也就是既认识了世界，也改造了世界。同时，在此过程中，通过误差信息的反馈，知识得到补充，决策系统也得到优化，促进人类自身取得进步。在科技能力所及的范围内，这个“主客互动”的信息生态系统模型基本包含了人类的所有活动，是一个典型的信息生态系统模型。通过这个模型，我们就可以知道语义信息到底在哪个位置出现，知道其前其后对它有什么样的相互制约，这样，我们才能准确地给语义信息下定义。

定义１客体信息／本体论信息：客体信息是指客体所呈现的状态及其变化方式。它与主体的主观意志无关，所以也被称为事物的“本体论信息”。

定义２感知信息／认识论信息：感知信息是指主体从该客体信息中所感知的该事物状态变化方式的形式（语法信息）、含义（语义信息）和效用（语用信息）。感知信息又称为“认识论信息”。

定义３全信息：语法信息、语义信息、语用信息的三位一体。可见，语义信息只出现在主体的“感知信息”中（定义２），而不在客体信息中。而且，语义信息与相应的语法信息和语用信息之间存在严格的制约关系，而不是独立的自由项。

４　语义信息：概念解析

４．１人类主体生成语法、语义、语用信息的模型

在语法、语用、语义信息的生成模型中（见图４），主客体相互作用，客体产生客体信息作用于主体，主体首先通过自己的感官产生语法信息，进一步，主体根据自己的经验，在脑海里（记忆库）中回想与语法信息相关的语用信息。这个前提就是，主体以前见过这个形态（语法信息），并把它存于记忆系统。如果主体从来没有见过这个形态（语法信息），主体就无法通过回忆来生成语用信息，只能通过知觉（心理学称为“觉知”）检验这个形态的事物对于主体的目标而言是有利的？还是有害的？还是无关的？这称为效用性检验。可见，语法信息最先被感官生成，然后产生语用信息。换言之，语法信息与语用信息靠这两种机制就可以产生，而语义信息的生成过程是：把语法信息与语用信息作为一个联合体，把这个联合体进行映射（这也就是人脑的抽象过程），映射到语义信息的空间中去，并对映射的结果命名。总之，语义信息是建立在语法信息与语用信息这个联合体的之上的抽象结果（映射）的命名，所以语义信息与语法、语用信息是紧密相关的。

４．２　语义信息的生成机理

语义信息是抽象层次，具有抽象性；语法与语用是具体层次，具有第一性。语义信息是建立在语法信息与语用信息二维空间的联合抽象化，由语法与语用信息的映射与命名得到。也可以说，语义信息是主体从客体信息当中感受到的客体的语法信息（运动状态与状态改变的方式）与语用信息（功效）这个联合体（共同体）抽象结果的名称。

了解了语法信息、语用信息与语义信息的生成机理，怎样在技术上具体实现？图５给出了这个技术原理和模型。

显而易见，没有综合知识库，语义信息不可能生成，这个知识库要包含有主体目标以及大规模的｛语法信息，语用信息｝集合。

根据语义信息的生成机理，主体收到外来的客体信息，首先通过传感器可以直接生成语法信息，所以，语法信息是最容易得到的。其次，为了得到语用信息，需要两种方法：①检索：以Ｘ为检索字到综合知识库去检索，看｛语法信息，语用信息｝中是否有语法信息与Ｘ匹配，如果检索出来了与Ｘ完全或近似相同的语法信息，那么与之对应的语用信息Ｚ就是与之相关联的语用信息。②计算：如果检索不到，就说明此时生成的语法信息Ｘ是全新的。在这种情况下，就需要通过计算才能生成语用信息，即把生成的语法信息Ｘ表达为一个矢量，把目标Ｇ也表达为一个矢量，把这两个矢量做相关性计算，两个矢量如果正交，说明不相关，如果不是正交，就计算它们夹角的矢量，便知道语法信息Ｘ与目标Ｇ之间是有关还是无关，是正面作用还是反面作用，即可以通过上述计算得到语用信息。

对人而言，通常通过实际体验去检验一个事物对某种目标而言是有关还是无关；如果有关，是正面还是负面。如果一个人经验丰富，也就是他存储的东西很多，就不需要去体验，检索就可以了。技术上则可以按照上述方法（对照图５）获得语用信息。

既然生成了语法信息Ｘ和语用信息Ｚ，那么，为了生成语义信息，就可以通过映射，将集合｛Ｘ，Ｚ｝映射到语义空间，给映射结果命名，用符号Ｙ表示，这就是语义生成的算法。这样，与语法信息和语用信息相关联的语义信息就产生了。

所以人和机器都可以产生语义信息，因为客体信息不同，产生语义信息的技术手段可以与之相适应变化。为什么要有一个抽象化过程？这是因为：语义信息就是抽象的，既不可以感觉，也不可以体验，需要抽象化才能得到语义信息。不过，它虽然抽象，却可以被生成出来，不是空中楼阁或海市蜃楼，它非常明确、非常合理，并且可以理解，可以把握。

总之，语法信息是事物呈现的形态（形状，大小，重量，颜色等），可通过人类主体观察或通过机器主体传感而生成。语用信息是事物对主体的效用，若是经历过的事物，就可通过回忆或检索而生成，若是新事物，则可通过人类的检验或机器的计算而生成。语义信息是事物的涵义，是抽象的，无法感受和检验，只能通过“语法信息与语用信息的联合”在语义信息空间的映射（抽象化）和命名而生成。可见，语义信息的内涵就是语法信息和语用信息。换言之，语义信息是感知信息的唯一合法代表。

４．３语义信息的表示和度量

由图５或图４都可以得出语义信息的定义，这就是：Ｙ＝λ（Ｘ，Ｚ），或｛ｘ，ｚ｝∈Ｘ×Ｚ!ｙ∈Ｙ。其中，Ｙ确实可以代表Ｘ与Ｚ，是全信息（感知信息）的合法代表，因为只要有了Ｙ，就可以从知识库中检索出Ｘ、Ｚ，当然前提是要有它的知识库。所以人们要利用语义信息进行各种信息处理，一定要有知识库。这也有助于理解语义信息的概念。

在这个二维空间里面，横轴代表各种各样的语法信息；纵轴代表各种各样的效用。如果看到了一个事物形态在ｘ，而它的效用落在ｚ，它们映射在这个语义信息空间中的ｙ就是语义信息所覆盖的区域。如果语法信息非常精确，精确到成为语法信息轴上的一点，而不是一个模糊的区间，又如果它的效用也非常精确，也精确到成为语用信息轴上的一个点，那么这两个点在语义信息空间中的映射结果就必然也是一个点，是唯一确定的，非常精准的语义信息。

Ｙ为什么那么重要？从直观上讲，认识事物最重要的不光要知道它的形态，而且知道它的意思，更知道它的用处。从公式可以看的更清楚，这个Ｙ（语义信息）可以在脑海里（知识库）检索出来对应的Ｚ和Ｘ，所以说它是全信息的代表，唯一的合法代表。Ｘ和Ｚ不能代表全信息，只有Ｙ可以代表全信息，因此比香农信息的语法信息更重要，这是一个概念的澄清。语义信息并非“只可意会，不可言传”，而是有清晰严格的定义。语义信息也不是普通一维参数能够刻画的概念，而是要用二维参数（Ｘ和Ｚ）才能准确刻画的抽象概念。同时，语义信息是可生成的，条件是：具备感觉能力和价值检验能力、强大的存储和检索能力以及抽象化能力。
（１）语义信息的表示若有一则语义信息ｙ∈Ｙ，可以用一个Ｎ维矢量表示，
Ｎ是有限正整数。因此有ｙ＝｛ｙ１，ｙ２，……，ｙＮ｝。若Ｎ＝１，称为原子语义信息，若Ｎ＞１，称为复合语义信息。对于ｙｎ，可设置“语义信息涵义”和“语义信息真度”两个描述参量来表示。

偶对（ｘｎ，ｚｎ）可以用来表示原子语义信息ｙｎ的

②对于相同的真度，不同涵义的语义信息量大小主要取决于各自目的本身的重要程度。重要目的的语义信息具有大的重要性，因而具有较大的语义信息量。

５语义信息在认知与决策中的作用

人们对于语义信息的主要兴趣，不在于量的计算，而是在于质的理解。这是语义信息论与语法信息论的最大区别。
（１）基于语义信息的模式理解

目前，所有模式识别都没有理解能力。例如一个模式识别系统，把输入的文字（汉字）或一段语音，经过处理，输出来一段文字（或者语音变文字），系统可以识别，但不能理解。所有模式识别都基于语法信息，但没用到语用信息，因此不能产生语义信息，有了语义信息才可以理解。到现在为止，模式识别还没到理解的层次，就是因为语义信息还没被掌握。若想把信息技术变得更有用，语法信息一定要走向语义信息这个层次。将来，计算机的存储方式要改变，如果计算机要变成智能计算机，不能只存储“０１０１０”这样的字符串，而要同时存储语法信息与语用信息，才能得到具体的概念（语义信息）。
（２）基于语义信息的知识库建构
例如，这里有几类具体的鸟：麻雀、燕子、喜鹊，如何建这个知识库？首先麻雀有麻雀的形式特征和功能特征，燕子有燕子的形式特征和功能特征，喜鹊有喜鹊的形式特征和功能特征。这是知识库的最底层（各种具体事物的语义信息）。在此基础上，可以把它们抽象为高一层———飞鸟的语义信息（飞鸟的共性形式特征和飞鸟的共性功能特征）。这时，飞鸟的“语义信息”事实上就被抽象成为了飞鸟的“知识”。接着，还可以对不同鸟的共性形态特征（语法信息）和共性功能特征（语用信息）进行提取，就可以生成比“飞鸟”更高一个层次放入概念（如飞禽），如此等等。便组成了一个关于“禽类”的知识库。

（３）基于语义信息的认知（机器学习）

根据上一个应用，有这样一个形态和功能特征，就能理解鸟是能飞的，机器如果把每一个能飞的鸟的特征（语法信息特征和语用信息特征）去归类，归到一定程度就可以得到一个结论———鸟是能飞的。这就是归纳法，认识一个对象主要是运用归纳法，联想是归纳，类比也是归纳。归纳法可以应用到机器学习———从一个事件中学到一个概念，所以语义信息使得信息科学技术可以从形式走向内容和价值，形成三位一体。
（４）基于语义信息、知识和目的的智能决策

在主客互动模型（见图３）中，有基础意识、情感、理智以及智能策略，还有语义信息。这些都可以在机器中生成，但过程并不简单，它的原理是演绎推理，但却是复杂的演绎推理系统，可能会有混沌现象、涌现过程。原理上可以这样解释：如要产生意识，一定要有语义信息作为输入刺激，这个输入的语义信息含有一定的形态（语法信息）以及效用（语用信息），那么通过主体的目的与输入的语义信息的语用信息去对照分析就可以生成意识：①如果输入语义信息内含的语用信息对主体的目标而言是有用的，主体就可以产生 “接纳”的意识；②如果输入语义信息内含的语用信息对主体的目标而言是有害的，主体就可以产生“拒绝” 的意识；③如果输入语义信息内含的语用信息对主体目标而言没有关系，主体就可以产生“漠视”的意识。

意识就是一个目的系统，它根据自身目的，对外来信息产生的一种本能和常识层次上的反应，是一种心理过程。它的要素就是它一定要有目的，外来的信息要对它的目的有影响，这样就会在本能知识和常识知识支持下产生“基础意识”的反应；在本能知识、常识知识和经验知识支持下长生情感反应；在本能知识、常识知识、经验知识和规范知识支持下产生理智反应；等等。

６信息生态学与语义信息研究的意义

信息生态学提供了一种全新的信息科学方法论，将开辟信息科学研究的新阶段。在信息科学与人工智能领域，将来一定离不开信息生态学理论，它与还原论是互补的，未来还原论还需要信息生态学理论带着它一齐往前走，使只考虑了统计性语法信息的“信息论”走向了形式、内容、效用三位一体的“全信息理论”。原来的香农信息论只有统计性的语法信息，没有语义信息，没有语用信息，但对于未来越来越复杂的信息科学，没有语义信息，理解是是不可能实现的。信息生态学与语义信息的提出使只关注信息传递的 “通信理论”走向了关注信息生态全过程的“信息科学”和有理解能力的智能科学。它揭示了信息领域的普适规律：信息转换与智能创生定律（图３就是一个 “信息转换与智能创生定律”的系统模型）。智能体现在两点：①能够达到主体的目的；②不破坏环境的客观规律。这两点归结到一起，就是“主客双赢”，或“天人和谐”。只要研究有生命的主体跟客体的交互作用（人类活动是最典型的概念），并在一定环境中不断生存和发展，就需要不断实行信息的转换，最后产生智能行为反作用于环境。智能行为能保证客观环境与人类生存发展的和谐统一。中国人所说的“天人合一”的行为，就是智能行为。

提问环节：

问（Ｑ）：首先，我非常同意您在信息科学领域里的看法，另外我有一个小问题，想请教您，就是在智能系统建设过程中，知识库非常关键，而知识库建设非常难，请问您有什么好的建议？

答（Ａ）：在建设知识库前，需要人工输入一些种子知识并进行标记，同时给这些种子一些学习算法，让它能够自身进行扩展。就好像人的学习方法发展分为三个阶段，第一阶段，幼儿的学习方法是接收来自父母的教育，“机械式学习方法”，死记硬背，这是必要的，这些死记硬背记住的知识，就相当于知识库建构中的“种子知识”；第二阶段，青少年的学习方法，不是仅仅听家里人的，而是听从社会上大多数人的意见，称为“统计学习方法”，这是比死记硬背更高明的学习方法，它的学习算法就是“以多为胜”，这样学得的知识是非常有用的；第三阶段，成年人的学习方法，这种学习方法的精髓是“理解”，根据自己的理解判断事情的正误，有自己的思考，并做出自己认为正确的决策，这就是基于理解的学习，是最高级的学习方法。对建造知识库而言，首先要给它种子知识，同时要让它有学习方法。将来遇到新的东西，首先，系统就会进行判断，是全新的正确知识就接受，如果与已有知识矛盾，就采用矛盾分析和处理办法。但是，无论如何，建立知识库的关键就是要下硬功夫，打好基础（给予种子知识和学习方法）。

马费成教授总结：今天系统地听了这个报告我觉得非常受启发，钟老师提出了一个非常重要的方法论———信息生态学，在这个重要的科学方法论基础上，对信息的所有层面都进行了系统与全面的思考。其实，全信息理论，我记得钟老师的１９８８年的《信息科学原理》当中就提出来了，但现在，我发现他在信息生态学基础上对语义信息的思考更加深刻，而且他认为信息生态学与语义信息理论的提出是信息科学发展的里程碑，我觉得这是非常有意义的。我们可以讲，香农信息论在上个世纪４０年代提出来的时候，它解决了通信问题———我们在通信线路中如何来理解和计量信息问题，这是里程碑式的，直到今天它意义还很重大。那么我想钟老师刚才讲的在语法信息基础之上的语义信息、语用信息，尤其是在语法信息和语用信息之上去生成语义信息，它的生成机制、度量，我觉得是一个非常系统的理论。更重要的是，上个世纪８０年代到现在，钟老师的思考是一以贯之的，而且是一步一步深入。语义信息理论的确意义重大，但是也非常难，比香农的语法层次的信息难度要大得多，信息生态系统与语义信息的完善，可能进一步解决信息科学、人工智能上面的一些重要问题，所以非常期待！

摘自《图书情报知识》2017.11