分享

第3章计算与信息——信息哲学手册选译

 智慧先生图书馆 2016-10-14

计算与信息

Gualtiero Piccinini and Andrea Scarantino

 

计算与信息是紧密相关的。存在着诸多种计算与信息的观念,因此我们要仔细地辨析它们之间的关系。

 

计算种种

 

数字计算是计算的范式性概念。数字计算是对离散状态的操作,即所谓的数位。就现在的应用而言,数位是变量的值,可以取得有限多不同的状态,如10。这种数位无需表征一个数字(或任何其它东西);它仅仅是一种状态,计算机可以可靠地将其与其它状态区分开。数字计算机根据数位规定上的规则来操作数位的序列;此规则详细指定了输入数位和输出数位之间应该遵循的关系;通常,此操作采取一系列改变数位的离散步骤来执行。在此意义上,由英文字母组成的单词便是数位的序列。针对此类数位的计算可以通过这一规则加以规定:将英文单词以混序的方式作为输入,而后以字母表的秩序返回作为输出。

 

通常的数字计算机并不限于仅仅操作一种类型的数位计算。换言之,它们并不限于遵循处理数位的单一规则。反而是,数字计算机可以遵循以具有相关确定执行步骤的计算机程序的形式所给予的任何规则。计算机程序是指令的序列,即确定计算机在任何特定时间(基于它所接收的输入与它所处的内在状态)执行哪一步骤的数位序列。换言之,程序根据计算机的内在状态,清楚地说明了操作输入数位的规则。

 

数字计算机执行指令,时常被认为是对指令信息的处理,这是以计算机回应其指令所执行的操作来规定的。这类信息不应与我们之后讨论的信息类型相混淆,它们不是由计算机指令而是由记忆存储的输入或数据所负载的。

 

程序采用适当的程序语言来编写,某些程序语言比其它的更为强大,因为它们允许程序清楚地说明一大类数位序列规定上的规则。在1936年,逻辑学家阿朗索·丘奇和阿兰·图灵认为某些标准程序语言(如图灵机,回归函数和λ演算)完全足以清楚地说明任何能讲清楚的数位操作规则。这些语言都在计算上相互等同——用其中一种可以清楚说明的规则便可以被其中所有语言讲清楚。结论性的观点即丘奇-图灵论题;它指出,任何数字计算机都可以根据这些标准程序语言所清楚说明的指令执行演算。这是一个不得不注意的观点,具有极多的支持证据并无明显的反对。

 

图灵还说明了如何设计一个能够执行以标准程序语言编写的任何程序的计算机器。给定任何以标准程序语言编写的任意指令序列,此机器都能每次针对相关数据执行一条指令,而后前进到下一条指令。具有这种性质的机器便被叫做图灵机。既然普通的计算机可以针对任何输入执行任何程序,直到它们耗尽记忆或时间,那么它们在图灵的意义上便是通用的。

 

所谓通用的机器,有时是与能够执行任何数字计算,或者任何无论什么计算,或者甚至与能够做任何事情相混淆的。计算机不能仅仅通过计算来执行任意行为;例如,它们不能仅仅通过操作数位创作一尊雕塑或做出一盘菜肴,尽管它们或许有助于此,如果它们的计算用来操作合适的雕刻或烹饪机器的话。更为重要的是,计算机仅仅能够执行包含程序的计算。明确而言,包含着具有最大可数数量实体的范围上被规定的程序的计算,例如一个有限字母表中的字母所组成的序列。另外,从数位序列到数位序列的绝大多数都是那些并不具有计算它们的程序的函数。此类函数最好的例子便是停机函数,例如针对任何程序和任何输入的返回函数,无论该程序是否将返回一个输出或停止计算或简单的永久持续计算下去而不返回一个输出。因此,通用机,包括普通的计算机,仅仅能够计算从数位序列到数位序列的所有函数的一小部分子集合。

 

有些作者推测,可能存在着能够计算那些通用机不能计算的东西的物理系统。这种假设的物理系统被叫做超计算机。以某种方式,超计算机将能够至少计算一种不存在计算机程序的函数,例如停机函数。到目前为止,还没有可以制造超计算机的强有力证据。

 

至此,我们关注了通常的数字计算机。还存在其它的计算系统,例如量子计算机和模拟计算机。它们相应地执行量子计算和模拟计算。量子计算机根据多维量子比特上的适当规定来操作多维量子比特(此外,也许包括量子计算机的内在状态)。多维量子比特类似于数位,它们都由有限多的可能状态所规定,但是不同于数位的是它们能够处于不同状态的叠加态(叠加态是两种“基本”状态混合的一种量子状态;例如部分由1,部分由0合成的量子状态)。模拟计算机操作根据在连续变量上所规定的规则来操作连续变量(此外,也许包括模拟计算机的内在状态)。连续变量能够在一特定的间隔内采取任何真值,由此而与数位不相同。

 

量子计算机可以计算与通常的计算机相同的函数——它们在计算上是等值的——但是在一些情况中它们可以做的更有效。模拟计算机计算一种与数字计算机不同类型的函数,但是它们的计算能够由数字计算机,通过将模拟输入编码为数位序列,并对它们执行数位计算而近似地实现。

 

人工神经网络是另一种重要类型的计算工具,而且他们执行诸多不同种类的计算。它们是关联单元的集合,其中每一个单元根据在变量规定上的规则处理一个变量。通常,人工神经网络具有从环境中接收输入的单元(输入单元),向环境中输出的单元(输出单元),和仅仅与系统中的其它单元相交流的单元(隐藏单元)。每一个单元都接收输入信号并传递作为其输入和当前状态的函数的输出信号。作为单元行为和组织的结果,人工神经网络将其输入单元所接收的输入转变为其输出单元所产生的输出。

 

一些人工神经网络具有固定的结构,以离散的步骤处理数位序列。这些网络如同普通的数字计算机一样执行数字计算。事实上,普通的数字计算机是这种人工神经网络的一个特例——其特殊之处在于它们有多大和组织得多好。其它的人工神经网络具有随时间而改变的结构,并服从于学习;它们还可以处理数位但是并不采取离散步骤的方式;而是,它们通过持续地内在处理来操作数位。然而其它人工神经网络对持续变量的操作,就如同那些模拟计算机的操作一样。

 

真实的大脑里发现的神经网络是什么情况?它们处理连串的动作电位或放电串,在神经元之间传输的一种特殊类型的信号。一些作者认为放电串既不是那些由数字计算机操作的数位序列,也不是那些由模拟计算机操作的连续变量;如果这是正确的,在放电串上的计算便是一种既不同于数字也不同于模拟计算的计算。

 

为了把握所有这些类型的计算,引入一种计算的一般概念是有用的。在一般意义上的计算是根据工具规定上的规则而对工具的操作(此外,也许包括系统的内在状态)。根据所操作的工具的类型,我们获得数字计算、模拟计算、量子计算等等。

 

计算的一个重要特征在于,它仅仅根据所操作的工具的特定自由度而被规定,无需考虑任何实现媒介所特有的进一步的物理属性。因此,相同的计算可以在任何拥有相关自由度的物理媒介中得以实现(机械的、水力的、电子的等等)。在这个意义上,计算是独立于媒介的。独立于媒介使得多重实现成为可能——存在实现相同计算的多种方式。但是多重实现并不能使得媒介独立性成为可能——许多属性都是多重实现但依赖于媒介的,因为它们受特定物理事件的约束。例如,存在着多种产生光的不同方式,所以光的产生是多重实现的;但是光的产生是依赖于媒介的,因为它总要依赖于被产生的光,即一种特定的物理事件。

 

我们现在再来看看信息。

 

信息种种及其和计算的关系

 

一般计算和信息是如何相关联的?这依赖于我们所讨论的是何种信息。在本章,我们将区分三种信息概念:克劳德·香农的非语义信息概念、自然语义信息和非自然语义信息。

 

香农(1948)的志趣在于解决“通讯的基本问题”:在接收者的终点(例如飞机),重新产生由信源产生的符号序列(例如控制台)。香农指出,存在一种谈论信源和接受者之间信息传输的方式,它无需对符号的意思做出任何假设,即便是有。

 

这里关键的洞见在于,当一个符号被选择出来,即所有与其不同的符号没有被选择的时候,我们告知了一些事情。香农意义上的信息,事实上是一系列可选结果之一的发生事件所产生的不确定性的消除。

 

我们设想一个实验,假定一个任意变量X,所取值a1和a2,相应地具有p1=0.9999和p2=0.0001的概率。在这个任意的实验发生之前,符号a1几乎确定是被选择的,而a2则极为不可能。对这两个符号的选择产生出信息,因为它们都解决了描述实验发生之前的情形的不确定性。

 

根据先前的概率分布,选择a2比选择a1产生更多的信息,因为它更难以预期而更令人吃惊。香农信息是以比特来测量的,其中1比特即具有50%发生概率的结果的发生事件所产生的信息。任何具有少于50%概率的结果都将产生多于1比特的信息,而任何多于50%概率的结果则产生少于1比特的信息。

 

香农引入了两种信息的测量,并将其应用于对穿过通讯渠道的信息传输效率的研究。第一个是熵,对从整体上描述信源的不确定性的客观测量,告知我们信源处的符号选择上的平均惊奇度。零熵相对应于一个概率为1的特定符号被选择的事件,当然完全不令人吃惊。最大熵相应于具有同等概率的符号之一被选择的事件,其中将被选择的符号具有最大不确定性。

 

香农引入的第二个测量是交互信息。从告知的意义上讲,交互信息是一种对我们能在多大程度上把变量Y和另一个变量X区分开的客观测量。更确切地说,交互信息告诉我们通过观察接收者Y处被选择的符号是什么,而描述信源X被消除的不确定性的平均量是多少。如果两个变量在统计学上而言是独立的,那么通过观察其中一个并无法获知另一个,它们的交互信息是零。当在接收者的终点处得知所选择的符号,清除了关于信源处所选择的符号的所有不确定性时,交互信息是最大的。

 

使用非语义的、客观的和定量的熵与交互信息的概念,香农证明了大量的开创性定理,对通讯工程领域产生了深远的影响。例如,在“噪声通道的基本定理”中,香农证明穿越一个随机分布通道的信息传输中的错误率,在理论上可以随意降低,直到每一单位时间的信源信息速度开始大于每一单位时间的通道容量的值点。

 

值得注意的第一点是,严格来说,计算的工具的选择或者它们根据规则的转换都无需产生任何香农信息。这是因为香农信息需要不确定性,尽管一般计算,在其所有变量中,原则上与其操作的决定性变量和规则是相一致的。在实际中,现实世界的计算机在多种交接处存在噪声(例如元件之间、计算机之间的通讯)。噪声是信号传输中任意随机的扰乱,可能导致接收信号和信源传输的原始信号之间的差别。编码理论,通讯理论的分支,关注符号向信号的有效转换,有助于我们设计编码信息的方式,从而使得意向讯息在噪声干扰时时可获得的。

 

认知科学家和计算机科学家最大的兴趣在于计算和语义信息之间的关系,例如,信息关联于信息载体的意义(而不仅仅是它们多么令人惊讶)。跟随格赖斯对自然和非自然意义的区分,我们将区别自然(语义)信息和非自然(语义)信息。

 

自然信息是烟携带关于火的信息的类型,尽管非自然信息是类似于“那里有烟”携带关于烟的信息的类型。自然信息已然被阐释为两种主要的方式。有的人主张一个信号承载着关于其根据自然法则而完美相关联的任何事物的自然信息。这种法则基础的自然信息理论保证信息是真实的:如果一个信号所负载的信息被一条自然法则所承担保证,那么它便承载着自然信息,即P承载着P。这与许多作者所辩护的观点相一致,即信息总是真实的。这种法则基础的方案的问题之一在于,相关于信息处理的有机体和人工物的极少数事件之间的关系是法则相似的。例如,并没有自然法则保证如果一个堆火没有燃起,烟就将不会产生,所以基于法则基础的理论,我们将必须得出烟并不携带关于火的信息的结论。

 

自然信息的概率论用信号必须可靠地关联于信号相关物的要求,替代了通常的要求。由此看来,烟携带关于火的自然信息是因为它可靠地关联于火,其中烟的存在,由于其与火之间的因果关联而明显提高了火的概率。对信息进行概率分析的意义之一在于,烟能够携带关于火的存在的信息,例如即使没有火存在也能提高它的概率。这种情况下,基于概率论理解的自然信息是非现实的。

 

计算工具可能携带,或可能不携带关于外在环境特征的自然信息。许多通常的计算在不携带外在环境信息的工具上进行操作。例如,在计算机上进行的通常的数学计算是在数字上所规定的,无关于计算机所操作的数位与什么可靠相关。还存在着许多计算系统中自然信息处理的例子。任何可靠的相关于一些环境变量的计算机输入都携带有自然语义信息。计算机可以处理这些输入,使得信息更为有用或可得,与其它信息结合起来(来自记忆或其他感受器),执行控制功能。例如,飞机的计算机便应用关于飞机状态的自然语义信息,来调节燃料注入、海拔高度、速度等等。

 

自然信息的处理必须通过计算的方式执行,因为自然信息是一个独立于媒介的概念。这是因为自然信息是否能够与一个既定的工具相结合,并不依赖于它特定的物理属性,而是它如何改变其所相关事件状态的概率。既然一般计算正是独立于媒介的工具的处理,所以任何自然信息的处理便相当于一般意义上的计算。

 

非自然信息的载体,不同于自然信息的载体,无需可靠地关联于它们的相关物。例如,“那里有烟”这个短语非自然地意味着那里有烟,无论它们是否关联于烟的存在。因此必然有一种替代性的接地性处理,使得非自然信息的载体承载着非自然信息。正如在英文单词的意义的例子中,惯例是一个关于什么建立了非自然语义信息连接的清楚的例子。

 

非自然信息无需建基于惯例。可能存在着其它的处理,如生物进化,非自然信息连接可以由此得以建立。“功能性地指涉”不同类型的肉食动物的长尾猴警报呼叫提供了一个范例,尽管事实上并无惯例将呼叫与相关的肉食动物结合起来。对于承载非自然信息的事物而言,重要的仅仅在于它代表了相关于一个信号接受者的其它事物。一旦这种连接建立起来,信息载体便能够成功地或不成功地表征某种事件状态。错误的可能性是自然信息和非自然信息(或表征)之间的关键差别。

 

自然和非自然信息之间差别的一个重要推论在于,非自然变量的语义信息可以正确或错误。例如,“水是不透明的”这一陈述包含错误的非自然信息,意指水是不透明的。一些作者将错误的非自然信息作为一种真正的信息类别,即使它在认识论上次于正确的信息。按照这些作者所说,信息消费者在其是正确的范围内尊重非自然信息,但是否认错误的非自然信息也是信息是不可取的,因为它妨碍了我们在科学中的一大片的信息应用。

 

大多数一般计算处理工具都携带有非自然信息,编码在计算机的输入或记忆状态中。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多