分享

读书随笔:信息简史(中)

 书虫小记 2022-01-19

电报系统、新的数学思想,这些都为二十世纪初的大事件发生奠定了物质和思维基础。

1874年,一个伊利诺伊州的农场主取得了一项美国专利——用于隔断农场范围的铁丝网。铁丝网用于隔开公共用地和私人领地,很快在全国范围普及。一年之中,全美就铺设了一百万英里长度的铁丝网。电报开始普及后,是农场主们首先发现了铁丝网的另一个用途——本来用于隔离的铁丝网,现在加上电池和绝缘夹子,用额外的铁丝把各铁丝网联通起来,各终端安上通话器,就构成了一个局域电话网络

也就是说,世界上第一个电话网络,诞生在美国农场边缘的铁丝网上。各农场基于自己的铁丝网络逐步形成了最早的通信合作社——几个农场合作起来,构建了区域电话网络,向使用这个网络通话的人们收取费用。——这都是典型的美国模式,一切都是由民众自发而来,自下而上建立起来的体制和机制

1916年克劳德·香农就出生在这样的农场里,到他意识到可以自己动手制作电话时,铁丝网电话网络早已成熟。香农的祖父是农场主,发明过一系列玩意,家里什么东西都是自己做的——美国人的动手能力——其父亲则是个行商,靠勤奋致富。

香农就是在农场的铁丝网边玩大的,成天就是各种小制作、小发明,制作飞机,为通信合作社投递电报赚些零花钱,坐在农场大树下读爱伦坡关于密码和谜题的小说,异想天开——这种方式是至今中国的孩子们都无法实现的。一直到他进了麻省理工,到了贝尔实验室,他也骑着独轮车抛着球在实验室的过道里转来转去

在硕士阶段,他谋取了一份为麻省理工的万内瓦尔·布什教授的微分分析机担任操作员的工作。就是在枯燥的日复一日的吱吱嘎嘎作响的分析机旁边,香农突然联想到,这些电路的开合,与布尔代数所说的数学,与人类的逻辑推理,其实是一回事。——任何电路都可以用一套算式来表达,并且像符号逻辑一样进行演算。他写道,比如串联电路就是“与”,并联电路就是“或”,加上一个继电器就可以得到“否”,通过电路构造,可以进行数字运算。

平遥城的屋顶

在上世纪二十年代,这属于典型的狂想。然而,布什教授鼓励香农写成论文,并通过这篇异想天开的硕士论文——谁都没想到,这篇硕士论文就是二十世纪计算机科学的开端。布什甚至鼓励香农转向遗传学领域,对刚刚起步的遗传学算法进行完善,香农很快就掌握了生物遗传学基本理论,然后提出了可以预计基因组合的算法。

香农还在农场边捣鼓他的模型时,罗素和怀特海已经出版了他们胆大包天的著作《数学原理》,他们用一整套逻辑,清除掉人类语言文字有史以来的所有矛盾和悖论,诸如“这句话是假话”之类的元语言悖论。他们拿出一套体系,可以严格地推导和检验所有理性和非理性的结论,为人类向确定性迈进一大步。

哥德尔在沿着罗素的路径信心百倍的前行时,这个瘦弱且带着黑框眼镜的小男生却发现了一个令人绝望的问题——当他完全采用符号逻辑来演算罗素们的体系时,发现并不存在一个完全且自洽的逻辑体系,也就是说,任何逻辑体系,必然有它既不能证明,也不能证伪的命题。这就是影响至今的著名的哥德尔不可能性定理

1930年哥德尔把他的发现在格尼斯堡的一次数学会议上宣读了,几乎没有引起什么反响。只有一个叫亚诺什的数学家听进去了,他和哥德尔一样感到震惊这个亚诺什很快就移民去了美国普林斯顿大学,改名冯诺依曼。他把哥德尔的论文在普林斯顿进行了宣讲,声称这可能是二十世纪最重要的数学发现之一——因为哥德尔是用极其严谨的数学方法证明了,任何逻辑体系都可能导出矛盾的结论或悖论。

当哥德尔、爱因斯坦们都聚集在普林斯顿时,香农也到了普林斯顿,他跟随导师外尔进行高射火炮自动控制数学研究——这又是一个信号传递并给予反馈的系统研究。

1880年,贝尔把电报转变为电话时,引起了同行以及几乎整个欧洲学界的嘲笑——美国佬的小玩意——他们很容易把电话与孩子们用绳子和纸筒做的土电话联系起来。当然,更深层的道理是,本来电报是基于文字的,现在贝尔又把电报变回了口语。谁知,从贝尔的第一部电话诞生,到全美普及六万部电话,仅用了四年——电报从发明到普及用掉十余年时间,到1890年,已经有50万人开始使用电话

回想起欧洲人对于贝尔电话的嘲笑,只能说,人类对于新发明创造有一种本能的抵制和想象失灵。是电话而不是电报更快地推动了电力网络的建设和推广,到1918年,从事电线架设成为了一种职业,电话交换、编号以及网络逻辑等问题,促使电气工程师们开始研究和思考信号传输和噪音消除的问题了

晋祠里宋代的铁狮子

1879年底,马萨诸塞一个由四个接线员管理的电话交换机,因为麻疹疫情爆发,导致接线员人手不够。当地一名医生叫帕克的,建议给每个电话配一个号码,按照电话归属的主人姓名的字母表顺序排列以供查询——电话号码由此诞生。同样的,人们又抵制这种做法——一个人居然能用一个号码表示!工程师和学者们则质疑人类是否能记住超过五位数的号码

很快,不但电话号码越来越多,越来越长,为了应对指数级增长的电话用户,人工交换机也换成了自动交换机,人们开始通过电话号码盘拨打,发出电脉冲给中央交换机自动实现电话线路对接。

就像电报一样,用量增长,很快就产生了容量和带宽问题——信息的量化也开始提上日程。

1943年,阿兰·图灵来到了贝尔实验室。香农此时正在解决给罗斯福和丘吉尔专线电话的加密问题,图灵则正在解决恩尼格码机的解密问题(敝号在前年的《图灵传》中有详尽介绍)。两个人在食堂吃饭时开始讨论一个毫不相干的问题——机器能思考吗?

图灵还在22岁的时候就已经思考出了一个原型——图灵机,即可以模拟人类计算数字时的心智的机器,也就是把人类计算数的过程机械化实现。这一过程实际上就是编程。图灵正是通过对图灵机的运行、循环和停机的思考,得出了与哥德尔一样的结论——存在一些不可计算出来的数,也就是存在一些不可判定的命题。其实就是证明了,纯粹的逻辑本身存在悖论,尤其是当我们把逻辑运算过程机械化后,就会发现,存在机械齿轮无法运转到的位置

正是这两人的交流,促发了香农的灵感——信息的本质不在于其所传达的意义,所谓意义都必须去除掉,也就是要去除掉那些不可度量的心理因素,只剩下物理因素。香农剥弄到最后,发现,信息其实是不确定性,是出人意料,是困难程度——本质就是熵

如果只有一条信息,不存在其它的选择,那就是绝对的确定性,实际上也就是没有信息(告诉你只有一条路是正确的,没有其他选择,这就不是知识了,是灌输。一条信息可以看做一个随机过程的结果,这个过程借助一组离散的概率生成一系列事件。香农借此把度量信息变成了度量在这个随机过程中我们的选择有多少,结果由多大的不确定性。一般而言,选择越多,不确定性程度越高,信息内涵也就越多

他提出了公式:H=-pilog2pi,这个pi是信息的出现概率,H就是信息熵,也就是不确定性。如果以2为底,也就是采用01的二进制,掷硬币如果各是二分之一的几率的话,那么2的底数就是-1,套到公式中H就等于1比特。同样的,包含32个字符中的字母表中随机挑选一个字符,则H等于5比特。

香农还提出了语言的冗余度概念——所谓冗余,就是如果一个字词或字母能够根据前面的内容猜出来,那么它就是冗余的。考虑这样一句话:c u d th? 如果你能很快得到can you do this?就说明前文那些省去的字母就是冗余的。据此,他对英语进行了结构统计,发现在不超过8个字母的统计结构下,英语的冗余度在50%,如果考虑句子或段落,则冗余度可达75%显然,冗余度越大,则信息量越小。但反过来看,冗余度越大,则信息的精确度越高——也就是纠错程度越高。用上述例子就是,ca yu d thi?的冗余度一定高于c u d th,但精确度一定高于后者。所以,适当的冗余度,其实就是消除信息噪音,实现纠错的关键

他还提出了一个惊人的见解——只要信息传输速率没有超出信道容量(容量就是传输速率上限),那么就总是存在一种纠错编码方案,可以克服任何噪声影响,使得信息的错误概率任意小。——多年后大家回忆,错误概率居然可以任意小,当时有谁能这样去想?然而,现代所有通信理论都基于他的这个结论。

1949年,香农在一张笔记本活页上,写了10的各种幂,他标明这是比特存储容量。其中,103旁边他标明这是打孔卡片存储容量,104旁边他标明这是单行距打字页面的容量,105旁边,他标明这是人类基因的容量!这是历史上首次提出,人类基因组是个信息仓库,可以用比特来度量。——此时詹姆斯·沃森还只是21岁的学生,还得几年才会发现DNA的结构。

历史上几乎所有的理论都是慢慢形成并成熟的,唯独香农的信息论例外——诞生之日就已经完全成熟

对香农的信息论密切关注的,当然还有差不多同时开创了控制论的诺伯特·维纳。香农和维纳是当时为数不多的美国本土出生和培养出来的思想家。维纳的控制论所涉及的范围要广于信息论,讨论到了信息和控制问题。两个天才小心翼翼地保持了对对方的尊重,也适度地展现出了对对方的超越,相比而言,维纳更加张扬——毕竟他从小就顶着神童的光环,维纳认为他更早想到了香农的信息论。

随后就是信息论和控制论的蓬勃发展——1950年,数学、物理、生物学、心理学、神经科学,都开始应用信息论和控制论的相关观点进行拓展。特别是心理学的发展,受益于信息论的概念和方法,逐步发展出了刺激-反应型的实验研究理路。香农发挥他小制作的特长,用75个继电器制作了一个微型迷宫,让一只机械老鼠在里面探索迷宫路径,这75个继电器展现了他所谓的机器记忆或存储功能,它能记住摸索出来的路径。很快,香农和他的信息论就成了学界、政界甚至是商界的明星,各行各业都以应用信息论相关概念为荣。

香农本人的性格内向,因此对这种热衷有本能的反感——他从一开始就拒绝为各种其他学说去证明或打招牌,并且反复强调,信息论就其本质而言是一门数学,其概念的使用要非常小心。

被信息论热炒起来的,除了信息本身以外,还有另一个物理学概念——熵。前面说了,信息本身就是熵,是不确定性。那么熵又是什么呢?

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多