分享

博弈中的黑马——纳什均衡

 baojun 2009-10-26

博弈中的黑马——纳什均衡

    在《童区寄传》的故事中,牧童区寄假装软弱,扮猪吃象,杀死一名强盗,又以做一个人奴仆的美好前景打消了第二名强盗试图杀死自己的意图,保全了自己,再利用强盗睡觉之际,杀死对方。这其中的情节一波三折,惊心动魄。对于这场对垒,我们称之为博弈,区寄的策略称之为博弈策略。那么,什么是博弈,博弈的核心概念又是什么?掌握点博弈知识对我们有些什么裨益呢? 

    博弈是个外来词,在英文中用game来表示,如果直译的话,博弈就是游戏。但东方的游戏和西方的game还是有较大差别的。我们所理解的游戏中是一种纯粹的娱乐,而在英文中的game 的含义,却是指这种游戏是在一定规则之下的活动,而目的是要自己赢。所以,如果直接把“博弈”理解为东方的“游戏”,显然玩的味道太浓,很容易让人把它当作小孩子“玩家家”一类不登大雅之堂的小儿科,会让这门学科失去严肃性。于是,我们把西方的“博弈”翻译成game theory。这样,博弈又称为“博弈论”,就使得博弈有了理论的色彩和意味。

 

    博弈或者博弈论的准确定义应该是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

 

    一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。

 

    由于博弈的内容和方式是不一样的,我们可以从不同角度对博弈进行分类:  

 

    一是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的就主要是非合作博弈。

 

    二是分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零,各种赌博就属于零和博弈。常和博弈则是指所有博弈方的得益总和等于非零的常数。例如若干人分配一份总额既定的财产,依据不同的条件,个人所得不等,这就是常和博弈。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。例如炒股,不同的投资者采取的投资策略不同,或者赚钱或者亏损,这就是变和博弈。  

 

    三是分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。动态博弈则是指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。

 

    四是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。

 

    如果利用这些知识来看区寄与强盗的故事。我们就能明白,这场博弈是有丰富内涵的。博弈双方无疑是区寄和强盗。区寄的目的就是采用一切方法保护自己,而强盗的目的就是通过贩卖人口从而获得财物,这使双方存在根本的厉害冲突,就不可能形成合作性博弈,而是非合作博弈。由于双方力量悬殊,因此,区寄被俘获后,只能麻痹对手、利诱对方,最后使两个强盗先后丧命,这就是一场零和博弈。区寄始终把握对方试图将自己贩卖的意图,先后采取不同的麻痹、诱惑策略,所有这还是一场动态博弈;而区寄之所以能够取得胜利就在于他掌握了对方的心理,而强盗自始至终都没有意识到对方是一个有着坚定意志和超人胆识的对手,所以对区寄来说,他开展的是一场完全信息博弈,而强盗进行的却是不完全信息博弈。

 

    无论哪种博弈,都会形成一种均衡,在各种均衡中有一个纳什均衡。纳什均衡是博弈的核心概念,那么什么是纳什均衡呢?

 

    纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。而博弈学上频频用来讲解“纳什均衡”的最著名的案例就是“囚徒困境”。 

 

    a,b两个囚徒,两人联手作案,杀死了一个富翁,为了尽快破案,警察把两人隔离分别进行审讯,并告诉他们,如果都坦白,各判5年徒刑;如果自己抵赖,而对方坦白了,则坦白方判1年,抵赖方判10年。而事实上,如果双方都抵赖,警察找不到确凿证据,只能以扰乱社会治安各判2年。ab面临抉择。 

 

    显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照西方博弈学家亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,各坐5年,他要是不招,我招供,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。 

 

    原本对双方都有利的策略(抵赖)和结局(被判2年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

 

    囚徒困境所反映的纳什均衡说明,在形形色色的博弈中,尽管双方都觉得自己做出了对自己最有利的选择,但最后形成的均衡对双方来说并不是最好的,因此,在博弈中就存在各种问题,引发各种矛盾,这就解释了为什么人们常说地“人生不如意者十有八九”,也解释了为什么个人、集体和社会为什么总是处于各种矛盾之中,因为这其中存在各种冲突,形成各种纳什均衡,而这种均衡并不是最初参与博弈各方所没有料到的。因此,纳什均衡可谓是博弈学上的黑马,又如一盏明灯,使人们从种种困惑中找到了解释其中原因的线索。

 

    所以,对社会所有人来说,了解一点博弈知识,争取形成一个对双方都有利的结局,最低限度地保护自己的最低利益,是非常必要的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多