约翰·霍兰德(John
Holland,1929.2.2-),何许人也?他是复杂理论(Complexity)和非线性科学的先驱,“遗传算法”(Genetic
Algorithm)之父! 主要研究领域为复杂自适应系统(CAS)、认知过程的计算机模型等。目前他是美国约翰·霍普金斯大学心理学教授,美国著名的职业指导专家,也是著名的麦克阿瑟研究奖获得者、麦克阿瑟协会及世界经济论坛的会员、圣达菲研究所指导委员会主席之一。1950年获得麻省理工学院学士学位。后获得密歇根大学博士,并长期任教于该校。现为心理学和电气工程与计算机科学教授。
那么“复杂的适应性系统”是什么呢,其实,包括人脑、免疫系统、生态系统、细胞、胚胎、蚂蚁群。。。他们似乎有某种直观重要的共性。 第一、每一个这样的系统都是一个由许多平行发生作用的“作用者”(Agent)组成的网络。更进一步说,一个复杂的适应性系统的控制力是相当分散的;而一个系统所产生的连续一致性结果,是产生于作用体之间的互相竞争与合作! 第二、一个复杂的适应性系统都具有多层次组织,每一个层次的作用者对更高层次的作用着来说,都起着建设砖块的作用。更重要的是:复杂的适应性系统能够吸取经验,从而经常改善和重新安排他们的建设砖块,这是最根本的适应机制之一! 第三、所有复杂的适应性系统都会预期将来。就是内部的规则和假设,如:“在ABC情况下,可能要采取CDE行动”。可以把内心的假设模型想象成是行为的建设砖块。他们就像所有其他建设砖块一样,也能够随着系统不断吸取经验而被检验、被完善和被重新安排。 第四、复杂的适应性系统总是会有很多小生境(Niche),每一个这样的,每一个这样的小生境都可以被一个能够使自己适应在其间发展的作用者所利用。每一个作用者填入一个小生境的同时又打开了更多的小生境。。。因此,复杂适应性系统的均衡就毫无意义:这种系统永远不可能达到均衡的状态,他总是处在不断展开,不断转变中。这里我们看到,复杂适应性系统的特点就是永恒的新奇性!(这让我想起复旦胡守钧教授在《社会共生论》里,讲到人的本性就是“自我实现”,某种意义上,就是对可能行空间的不断探索!这似乎就是生命的本源性的东西)
我对Holland的认识,来自于那本旷古的经典科普之作 - 本文的很多对他的介绍文字,都来自该书。而之所以在今天写下这篇博客,因为今天终于在中科院数学与系统科学研究所,见到了这位仰慕已久的科学家,有幸与他和国内复杂性科学的年轻学者 – 集智俱乐部的张江一起合了影! 我手里捧的这本书,就是霍兰德的第一本书,1975写的《自然与人工系统中的适应》- 理论分析及其在生物、控制和人工智能中的应用(Adaptation in Nature and Artificial Systems)。 霍兰德在其序中说到,“这第一本书就像我的第一个孩子一样,受到了特别的关爱”。这部著作,他是参考冯.诺依曼的《博弈理论》为样本写作。至今30多年过去,仍旧持续不断的被翻印出版。可见其“价值”!此书总结了荷兰德早期二十多年对学习、进化和创造性之间深刻的内在关联的思考,也是对著名的“遗传算法”(genetic algorithms)做了周密的陈述。而张江恰好是这本书中文版的译者!(上面照片中右边的那一位)而我与张江是因为集智俱乐部而认识。 霍兰德现在已八十高龄,此次来中国的访问演讲非常的难得,今天他在中科院的演讲主题是:Steering Complex Adaptive Systems:Signals, Boundaries, and Niches 他即将出一本新书,将在明年上市。他另外两本重要的著作是:1995年的《隐秩序》(Hidden Order: How Adaptation Builds Complexity)和1998年的《涌现,从混沌到有序》(Emergence: From Chaos to Order) 这两本书都是非常赞的复杂性科学的著作!强烈建议细读!
Holland Holland 的能力很大程度上从其重小爱玩游戏、发明游戏开始的;中学就迷恋上了科学,吸引他的地方在于:“科学可以告诉你,几条简单的规律是如何产生整个世界变换无穷的行为表现的。”宇宙在一个极端上十分易于理解,在另一格极端上却又永无可能理解(无穷的可能性)。 21岁的他参与了 IBM701 (在当时 IBM 普夫吉普斯 实验室)开发,美国最早的编程人员之一。计算机天才集中地,其中有约翰.麦卡菲(John McCarthy)- 人工智能创始人;阿瑟.塞缪尔(Arthur Samuel),他的计算机跳棋是人工智能研究方面的一个里程碑!他能针对对方的步骤调整自己的战术 – 抓住了学习和适应的某种最本质的东西。。。
1952年春,他听了 MIT 心理学家 就是从这时起,形成了他后来 三十年 的思想。他一直在思考:什么是突现?什么是思考?思想是如何进行的?什么是思想的法则?一个系统的适应究竟意味着什么? 1952 年秋季,Holland来到密西根大学读数学博士,碰到了阿瑟.伯克斯(Arthur Burks),曾与冯诺依曼研制第一台计算机-ENIAC。1954年,死于癌症的 冯诺依曼希望计算机用在两个方面,一方面是一般性功能的计算机设计;另一方面是,基于自动机理论、自然和人工智能知识的计算机。 1959年,Holland 获博士学位,是通讯科学授予的第一个博士学位!要知道,1967年时,计算机与通讯的学科才产生!
影响Holland的一本书:菲舍尔(R.A.Fisher) 他觉得,基因是一种长期的适应性;神经是一种短期的适应性;两者的总体性理论框架是相同的。 1961年7月,Holland发表了48页的技术报告- 《适应性系统逻辑理论之非正式描述》。1962年开始,他全力投入适应性理论的研究,下决心解决多基因的选择的难题。1964年获终身教授,并开始研究遗传算法。 1985 年,受法默(Doyne Farmer)邀请,在洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory,LAN)的“非线性研究中心”年会(此次年会主题:“进化、游戏与学习”)上,Holland 做了“涌现”的研究。那里,他认识了盖尔曼(Gell-mann),从而被引入了圣塔菲。1986年8月,乔治.考温(George Cowan)与斯坦福大学生物学家马克.菲尔德曼主持的《复杂的适应性系统研讨会》上,Holland 唱了主角。那次将 斯图尔特.考夫曼(Stuart Kauffman)介绍进了圣塔菲。这些都是圣塔菲里神一样的人物! Holland是一个乐天派,一生都在做他喜欢做的事,拥有一个真正快乐的人的坦率和好脾气,大家都喜欢他。《复杂》一书里的主角-阿瑟,认为 Holland 是圣塔菲中最复杂、最吸引人的知识分子。他们合住一个房间。 Holland 遗传算法的思考起源: 假设某个物种有 1000 个基因(与海藻基因数相当),每个基因含两种信息,自然选择要经过多少次尝试才能发现使海藻发展到最强壮的那组基因搭配呢?如果基因之间无关联,那是2000次,如果基因之间有关联,那尝试2的1000次方次,所花时间是宇宙大爆炸到现在的好多倍还不止。因此,“这是一个向着无穷无尽的可能性的空间探索的系统,不存在哪怕为一个基因找到“最佳”点的现实希望。进化所能达到的是不断改进,而绝非尽善尽美。” 荷兰德想知道的是,进化是怎样于无穷无尽的可能性的探索中找到有用的基因组合,而不需要搜遍整个领域。 直觉告诉Holland,某些基因组之间能够很好地相互作用,形成统一而自我强化的整体。如果一个基因群有足够的统一性和稳定性,那么这个基因群通常就可以作为更大的基因群的建设砖块。细胞的结合形成生理组织、生理组织的结合形成器官、器官的组合形成生物体、生物体的组合形成生态系统,等等。荷兰德想,确实,这就是“涌现”的全部意义:一个层次上的建设砖块组合成更高层次上的建设砖块。这似乎是这个世界最根本的规律之一。这一规律当然也表现在所有复杂的适应性系统之中。它急需解释:为什么这个世界会形成这种结构呢? 当Holland思考这个问题时,他越来越觉得,更为重要的理由还基于更深的层次,因为这个等级分明的建设砖块结构能够彻底改变系统的学习、进化和适应能力。
适应性系统能够重组它的建设砖块,从而产生巨大的飞跃,而不需要总是要逐步地在可能性的无限空间中缓慢进展。他认识到,这就是解开多基因之谜的关键之所在。“进化过程中的放弃和尝试并不只是为形成一个优良的动物,而是在于发现优良的建设砖块,并将这些建设砖块结合在一起,从而产生许多优良的动物。” 对Holland来说,遗传算法的核心是两性交换。他认为,所有复杂的适应性系统——经济、精神、生物体等,都能建立能让自己预测世界的模型。在认知领域,任何我们称为“技术”或“专业知识”的,都是一种内含的模型,或说得更精确些,是一组长期经验积累和凝练而成的,即铭刻在神经系统的巨大而相互环扣的常规操作程序。这样的例子不尽其数。DNA本身就是一个内含的模型,基因说:“在这种条件下,我们期望我们特意选中的生物能有机会得到很好的发展。” 确实,模式和预测随处可见。但模式从何而来?最终的答案只能是“没人操纵这一切。”(这不就是 KK 的“失控”的真谛吗)但幸运的是,还有一个选择:从环境而来的反馈,这是达尔文的伟大洞见。在认知学上,这个过程基本上是一样的:作用者是独立的心智,反馈自老师和直接经验而来,改善被称为学习。 下一个问题就是,怎样做到这个? 到了1977年,人工智能的研究领域无疑已经取得了很大的进展。比如在斯坦福大学,人工智能小组正在研制一系列被称为专家系统的极富成效的程序。专家系统能够模拟专业知识,比如可以通过运作成百条规则来模拟一个医生:“如果病人患的是细菌感染性脑膜炎,正在发高烧,那么也许是某种细菌感染。”(想到循证医学专家系统:是否建立一个智能循证医学专家系统,具备遗传、进化、学习能力。。。?) Holland对于应用性研究并不感兴趣。他想要的是一个关于适应性作用者的基本理论。从他的角度来看,这二十年来人类在人工智能领域取得进展的代价就是忽略了所有重要的方面,从对学习的研究到对来自环境的反馈的研究都受到了忽略,在Holland看来,反馈是最根本的问题,这正是问题之所在。拿现存的“学习模型”草草拼凑成一个软件解决不了任何问题。学习是认知的最根本的问题,正如进化是生物学的最根本的问题一样。荷兰德的理想模式仍然是赫伯式的神经网络,其最重要的一点是,每一次思维的神经冲动都强化了其神经连接,从而使思考成为可能。荷兰德确信,思考和学习只是大脑中同件事物的两个方面。 Holland决定自己设计一个杂交的模拟适应性作用者,把神经网络和专家系统的长处相结合。六十年代,卡内奇-麦伦一派的爱伦·纽威尔和赫伯特·西蒙已经把“如果……则”的规则语言介绍进计算机编程里来了。基于规则的系统对大脑的神经分布来说具有很大的意义。比如说,一条规则就相当于计算机中希伯式的细胞集合之一。 “赫伯的每一个细胞集合都包含了大约一千个到一万个神经元。”Holland说。“每一个神经元又有一千到一万个与其它神经元相连的突触。所以每一个细胞集合就与其它许多细胞集合相互关联。”大体上说,激活一个细胞集合,就等于在某种内部布告栏上张贴了一个布告,就会被大脑中大多数、或所有其他细胞集合看到。纽威尔-西蒙式的基于规则的系统的内部组织与这个布告栏的比喻非常接近。但Holland 不想用纽威尔-西蒙式里面的象征性语言。“我们陷入的困境,与我们在不懂物种如何进化之前就对物种进行分类时所陷入的困境是同样的。” 必须从赫伯的角度来理解概念:涌现的结构是从某种更深层的、不断在环境反馈中调整的神经基质中发展而来的。荷兰德决定,他的规则和布告不用具有特别意义的符号手段来编写。它们将就是一排排1和0的二进制的任意序列。荷兰德只得给他的这些规则取一个新名称,“分类器”,因为它们的办法是根据布告的特殊类型来分别不同的布告。他认为这个抽象的表示法至关重要。 同时,Holland还从基于规则的系统的中央控制的常规概念中找出了例外。他认为,这种自上而来的争议解决法恰恰是错误之所在。难道这个世界是如此简单、如此可以预测,以致于你总是能够在事先就知道什么是最好的规则吗?几乎不可能。Holland想要的是,让控制由学习而来。他要控制从最底层涌现而出,就像大脑的神经基质中的涌现一样。如果两个分类器规则相互意见不能统一,那就让它们在自己的表现的基础上去竞争出一个结果来,这个结果就是被证实了的对完成任务的贡献,而不是有一个软件设计人员事先编好的程序的选择。
“与主流人工智能研究正相反,我认为竞争比连贯一致性更为本质。”
想一想神奇的竞争能够产生出合作的巨大推动力。“竞争和合作看上去也许是对立面,但在某种深层次上,它们是相同事物的两个方面。” 为实现竞争的机制,Holland决定把张贴布告变成某种拍卖活动。每一个循环开始时就像以往一样,所有的分类器都在扫描布告栏,寻找与自己相关的布告。它们就像以往一样,一发现与自己相关的分类器会站起来,准备张贴自己的布告。但与以往立即张贴自己的布告不同的是,每一个分类器都会先量力叫价。一个对“明天太阳会从东边升起来”的经验确信不疑的分类器也许出价一千,而一个确信“猫王还活着,晚上出现在华拉华拉汽车旅店6号”的分类器也许出价一。然后这个系统就会收集所有的出价,用抽彩给奖法选择一组赢家,叫价最高的最有可能赢。中选的分类器就会张贴它们的布告,就这样循环往复。(因为出价高的比选中的比率也高,最后应该呈现一种幂律分布的情形,也是自相似的。) 返回到学习这个问题上来了:分类器怎么来证明自己的价值,又怎么为自己获取可信值呢?对荷兰德来说,最显在的答案就是采用一种赫伯式的强化作用。每当一个作用者做对了什么事,从环境中得到了一个正反馈,它就应该强化那些与此相关的分类器。而每当它做错了什么事,它就同样应该削弱相关的分类器。无论采取强化的方法,还是采取削弱的方法,它同时应该不去理会那些不相干的分类器。他的布告栏前的拍卖已经为他在系统中建立了某种市场机制,通过允许分类器量力叫价的办法,他已经创造出了通货。所以,为什么不采取下一步行动?为什么不创造一个完整的自由市场经济,让强化能够在利益驱动下发生作用呢? Holland认识到,如果把张贴在布告栏上的布告当作是上市叫卖的货物和市场上提供的服务,那么就能把分类器想成是生产这些产品和提供这些服务的公司和厂家。当一个分类器赢得了张贴自己的布告的权力,它就得将自己的一部分力量转给供应商,也就是那些触发其张贴布告的分类器。这些财富究竟是从何而来的呢?当然是从最终消费者而来的:环境就是系统的所有报偿之源。所有能够产生有效行动的分类器都会被强化,任何参与布局的分类器都不会被忽略。随着时间的日积月累,随着整个系统不断汲取经验和从环境中获得反馈,每一个分类器的强度就会与自己对作用者的真正价值相符。 Holland将适应性作用者的这部分称为“水桶队列”算法,因为其方法是将奖赏从一个分类者传到前一个分类者。这有如希伯的强化神经突触的大脑理论的直接翻版。 以利益为驱动力的经济强化是一个极为强大的组织力量,就如亚当·斯密的那只看不见的手在现实经济中具有强大的力量一样。一句话,学习从头开始就被设入于系统之中了。开采式学习与探险式学习之间是有区别的,水桶队列算法能够强化作用者已有的分类器,可以打磨已有的技能,但它却无法创新。仅仅只依靠水桶队列算法,会使系统趋于最大化的平庸状态,正是基因算法可以承担的工作。事实上,当你想到这一点时你就会看到,达尔文的比喻和亚当·斯密的比喻恰好可以相辅相成:企业能够随时间进化,为什么分类器不能够呢? 在大多数情况下,分类器会像以往一样在市场上欣然买进或卖出。但系统会经常性地选择最强的一对分类器来繁衍后代。这些中选的分类器会通过性交换来产生一对后代,从而重组它们的数字化建设砖块。而新生代会取代一对力弱的分类器。然后,新生代将有机会来证明自己的价值,通过水桶队列算法使自己越变越强壮。 由此你就会达到目的:将遗传算法当作第三层,置于水桶队列算法和基本的基于规则的系统之上,荷兰德终于构筑成了一个不仅能够吸取经验,而且具有自发性和创造性的适应性作用者。 1977 年,开始开发第一个“分类者”系统,这个系统的早期版本是他与密西根大学心理学教授裘迪·瑞特曼(Judy Reitman)共同研制的,发表于1978年。在对这个版本系统的测试中,其作用者学会了如何用遗传算法运行一个模拟的迷宫,运行速度要比没有用基因算法快十倍。 从此开始,“分类者”系统被应用到了很多方面。对Holland来说,最感欣慰的是1983年戴维·高德勃格(David Goldberg)应用煤气管道的优化。这个系统从一组完全随意的分类器开始,在经过一千天的模拟试验之后,达到了对控制煤气管道的专家水平。 自1980年起,他一直在与三位密西根大学的同事,心理学家凯瑟·赫力约电(Keith Holyoak)、里查德·尼斯伯特(Richard Nisbett)和哲学家保尔·查加德(Paul Thagard)密切合作,致力于创立一个关于学习、推理和知识发掘的认知理论。正如他们在1986年出版的《归纳法》一书中所说的那样,他们四个人都相信,这个理论必须建立在三项基本原则上,而这三项基本原则也正是Holland的分类器系统的原则,即: - 知识能够以类似规则的思维结构来表达; - 这些规则始终处于竞争之中,经验使得有用的规则越变越强,无用的规则越变越弱; - 具有说服力的新规则产生于旧规则的组合之中。 他们特别指出,这三项原则应能够产生缺席的等级制度的自发涌现。 分类器系统总是从零起步,它最初的规则完全是在计算机模拟的太初混沌中随意设置的,然而就在这混沌之中,美妙的结构涌现了出来,令人惊喜,让人讶异。 |
|