分享

再议演化博弈论

 skysun000001 2022-03-08

图片

来源:《中国社会科学文摘》2022年第2期P15—P16

作者单位:复旦大学哲学学院科学哲学与逻辑学系,原题《与博弈何干?——再议演化博弈论》,摘自《自然辩证法通讯》2021年12期,崔晋摘

当代演化生物学理论综合了达尔文的进化论与孟德尔的遗传学说,被称为现代综合理论,其核心是由费歇尔、霍尔丹和赖特开创的群体遗传学。这种理论关注的是基因频率和基因型演化,而由史密斯和普莱斯开创的演化博弈论(EGT),则研究由于使用不同策略之间的博弈竞争导致的动物行为或表现型的演化。在竞争策略下的动物或有机体行为的稳定性及动力学原理是该领域的焦点。其中,引入博弈模型来表征看似使用了不同策略的个体间互动,一组复制子动态方程则表征了重复性博弈中的动态过程。博弈的成败通过生命体所采用的致胜或致败策略之后分别导致的存续或灭绝来表征。用来表征输赢的收益函数正是基于生育率的适应度函数。即便在高度理想条件下,这些一阶微分方程几乎不可能得到精确解。但是,其轨迹的长期变化趋势并不难计算。这些趋势可以说明竞争策略的使用者(例如捕食者与被捕食者)在混合共栖之后究竟会迎来繁荣还是毁灭,或是达到稳定。

作为另外一个独立发展的领域,理论生态学或者种群动力学研究的是种群分布、物种形成、以及同一生态系统中不同物种(群体表现型)的稳定性。此类研究始于罗马大学的数学物理学家沃尔泰拉和美国科学家洛特卡各自独立发展的工作。这一系列用途广泛、富有成果的动力学方程组现在被称为洛特卡—沃尔泰拉方程(Lotka-Volterra,简称LV方程),它们可以描述生态学或种群的动力学过程。该方程组包含了一阶微分方程,其正常条件下的解已经被理解清楚;虽然大部分时候不能获得精确解,但是长期行为的极限值可以进行严格计算。这些长期行为极值正是理论生态学家所需要的,因为它们呈现了存续、灭绝或者稳定的演化趋势。除此之外,洛特卡—沃尔泰拉方程的应用方式与分子动力学理论用于研究流体行为的方式惊人地相似。

另一种可能的反对也许会认为:如果基于EGT的解释总是能够翻译为一个非博弈论的说明,例如通过LV模型的说明,那么反过来也会成立。即,每一个LV模型的说明都可以翻译为博弈论的说明。“博弈”没有被消除;相反,“博弈”掌管一切!这个反对意见揭示了另一个深层问题:在我们的讨论语境下,究竟什么是博弈?

根据卢斯和莱丰的早期经典文献,或弗登博格和梯若尔更新近的标准文本,博弈应该包含三个基本元素:行动者、策略和收益;它构成了一种动态的利益冲突。诚然,行动者并不必然理性,但参与者需要成为某程度上的“行动者”。行动者最基本的性质是做出选择。选择某种行为可能不是理性的,甚至可能不是深思熟虑的,但它必须有选择的意味。这就是为什么没有生命的物体,比如碎石头,不能被视为行动者。当存在一个选择的时候,需要从一些策略中进行挑选。如果理解了上述行动感,那么采用或选择策略就可以像通常那样被简单地解释。动物可以采纳或选择行动方式,虽然对此我们理解的尚不透彻;但无论人们对碎石头发挥多么丰富的想象力,石头都不会去做选择。此外,是否具有繁殖能力与能动性的概念无关。无法繁殖的个体完全可以参与博弈。另一方面,许多类似于机械复制的过程则不能被看作行动者。

基于上述的博弈概念,我们首先看看将所有LV模型的说明翻译为博弈论说明是否合理(即反过来翻译)。有些人会认为LV方程经典模型中的“捕食者”和“被捕食者”等概念可以解释为采用两种不同策略的行动者。这时LV说明确实可以翻译成博弈论的说明。的确,这样的解释对于海洋中的鱼类来说可能已经足够了,但在某些情况下,归因于行动者是没有意义的。除非有人愿意淡化博弈的概念,以至于任何形式的互动都被视为利益冲突、互动系统中的成分都被视为行动者,否则可译性命题似乎就站不住脚了。只要LV模型同等充分,博弈在研究动物行为或生命体表现型的演化时就没有一席之地。当EGT被重新引入社会科学来研究人类行为时,这就不再成立。

在经济学和社会科学的博弈论中,博弈的本意显然是不可缺少的。但这不是演化论的情况,至少在其原始或主要的领域不是这样。当博弈论被引入演化生物学时,我认为博弈的概念就变得可有可无了。当然,我的论点的一个附带条件是,当考虑到生存的斗争时,生物系统不会做出选择。如果这个假设不成立,或者有理由认为有机体能够像认知主体一样做出选择,那么我的论证就不会成立。

虽然将博弈论引入演化生物学只是引入了数学而不是其概念,但将演化论反过来引入经济学和社会科学博弈论并不会赶走“博弈”的概念。因此,在人类参与博弈的演化理论中,博弈概念不可或缺。而这样一种理论——以一种合作的演化理论的形式——确实已经出现并成为了有关合作和/或利他主义的主要演化理论之一。

囚徒困境是关于两个或更多理性行动者决策的“困境”。问题来了:如果博弈像锦标赛一样重复进行会发生什么?尝试不同的策略会产生不同的成功记录,而最成功的策略会存续下来。用计算机生成对该博弈的试验时发现一种特殊的策略TFT(以牙还牙)占了上风。它至少能够打败ALLD(总是叛变)和ALLC(总是合作)。甚至可以通过巧妙设置选择不同行动的概率来改进TFT,即并不是在对手合作时合作、在对手的叛变时叛变,而是当对手合作时以概率p选择合作、当对手叛变时以概率q选择叛变。这样所谓的“反应策略”(原则上有无限多的反应策略)可以在囚徒困境博弈中击败TFT。

虽然将演化思想引入了涉及利益冲突的零和博弈(如囚徒困境),博弈元素的原本含义并没有被排除。参与博弈的行动者可能不是完全理性的模型,但他们肯定会在博弈中深思熟虑并做出选择。他们的决定也许对(反复发生的)博弈的最终结果几乎没有影响,哪一种策略会最终胜出可能是一个“演化动力学”问题,但毫无疑问,这些策略是由理性行动者精心选择的(也许只是有限理性)。同样,纽约证券交易所可能不会遵从在场股票经纪人的理性决策,交易结束时每个人都很沮丧,但毫无疑问,经纪人们在参与一场完全意义上的博弈。

演化论的引入为囚徒困境等问题提供了一个解决方案。对于其他拥有明确解决方案的博弈来说演化论是没有用的。若存在明确的占优策略,在重复博弈中使用演化论思想是多余的,因为每次博弈的结果都一样:使用占优策略的玩家将会获胜,并且只要选择该策略就会次次获胜。

然而,重复的“囚徒困境”仍然与生物学中的演化博弈非常不同。在其博弈矩阵中,收益仍然是收益,而不是按数量或后代比率计算的适应度值。在重复的囚徒博弈中,TFT优于ALLD,因为持续使用TFT的参与者会比使用ALLD的参与者获得更多的奖励。玩家可能会从其他策略(如ALLD或ALLC)切换到TFT或其他反应策略。然而,这种转变很可能是一个有意识的选择,而不是偶然的突变或模因插入造成的。

重新在社会科学中引入演化博弈的新工作构成了最近复兴的对人类社会中道德起源的演化解释的基础。假设演化博弈模型的多样性远远超过了本文中讨论的“简单”动力学方程和模型——大体上,可以看到有限离散空间博弈发挥了关键作用。然而,演化博弈中完整意义上的核心(博弈)概念始终扮演着不可或缺的角色。

这就完成了对于确实存在“演化博弈”这一命题的论证,并且是作为“游戏”一词完全本意的博弈。这些博弈游戏与生物学EGT中研究的博弈有着本质上的不同。

尽管演化博弈的概念具有历史意义,但它已经可以谢幕,取而代之的是不那么新奇、更加基本的生物或前生物实体的交互动力学概念。后者源于LV方程和种群动力学。

博弈必须与行动者和决策行为联系在一起。一旦这一点从问题的语境中移除,博弈的数学就与博弈游戏无关了,并且可以用更简单的交互动力学概念代替,就像从复制子方程到LV方程的例子一样。不过,可以设想一种关于人类行为或其他种类认知行为的演化博弈论,就像人类合作的演化例子。个体也许会在博弈中明确地做出选择,但是当博弈反复长期进行后,其结果是由“自然选择”决定的——即不受行动者选择的控制。仅在这些情况中才发生了真正的博弈。否则,博弈的概念只是一种隐喻:参与其中的个体奋力求生,仿佛他们在进行博弈游戏一样。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多