分享

“纳什均衡”悲喜剧

 陈农 2017-02-01

“纳什均衡”悲喜剧

2010-03-14  参见嘉华:《“纳什均衡”悲喜剧》 
海南省,《大科技》,200307

 
一、“囚徒困境”与“纳什均衡”

一次博弈最终总会形成一个结果,好比讨价还价,这就是博弈均衡。“纳什均衡”是一种最常见的、也是最重要的博弈均衡。它是美国天才数学家纳什在1950年正在攻读博士学位时提出来的,论文题为《n人博弈的均衡问题》。纳什巧妙运用数学技巧,证明了如下定理:对一任何一个n人参与的非合作博弈(零和或非零和),如果每个参与者的策略是有限的,那么一定存在至少一个纳什均衡解集。该论文只有短短一页纸,但却成了博弈论的经典文献,并使他获得了诺贝尔经济学奖。

“纳什均衡”的经典案例是“囚徒困境”:两个作案嫌疑人分别关在两间牢房,警察告知,如果两人都招供,则各坐牢3年;如果两人都不招供,则放出;如果一人招供而另一人不招供,则招供的坐牢3年,不招供的坐牢10年。局外人看来,最好两人都不招供。但从每个人来看,招与不招的代价分别为{3;3}与{0;10},还是招供为好。

但从纳什均衡却得出一个悖论:单个人的最优选择却没有导致全局最佳的结果。现实中的例子很多,如价格战的结果是两败俱伤。“纳什均衡”证明了一个道理:非合作博弈的情况下困境无法解脱。

 
二、自私的“纳什均衡”

假定参与者都是自私的,“纳什均衡”的实例是很多的。比如:一个大笼子里关着许多猴子,主人每天抓一只猴子杀掉。所有的猴子都不敢反抗,怕单独反抗会被主人先杀掉,结果所有的猴子都被杀了。如果所有的猴子群起反抗,有可能都逃脱逃掉。

 
人类在这方面的例子也很多。在波士顿树立的二战犹太人蒙难纪念碑上,德国神父马丁留下了一段发人深省的铭文:“起初他们追杀共产主义者,我不是共产主义者,我不说话;接着他们追杀犹太人,我不是犹太人,我不说话;后来他们追杀工会成员,我不是工会成员,我不说话;此后他们追杀天主教徒,我是新教教徒,我不说话;最后他们奔我而来,再也没有人站起来为我说话了。

 
在现实中,公共汽车的小偷偷东西,别人袖手旁观;有人挥霍公家的东西,没人制止;在公地上放羊,每人都想多养,等等。总之,自私条件下的非合作的博弈,悲剧是难免的。

这样,“纳什均衡”亚当·斯密的“看不见的手”的原理提出了挑战。斯密认为:“每 一个人都从利己的目的出发,而最终全社会达到利他的效果。”而“纳什均衡”却证明:从利己的目的出发,结果却是损人不利己,他反映了个人理性和集体理性的矛盾。

 
三、无私的“纳什均衡”

 
“纳什均衡”的深刻性,还在与它揭示出这样一个冷冰冰的逻辑:即使在一个毫不利己专门利人的社会也无法避免个体理性与集体理性的矛盾。

欧·亨利的小说《麦琪的礼物》讲述了一个动人的故事:新婚不久的吉姆与德儿穷困潦倒,除了德儿的美丽金发和吉姆的祖传金表,他们没有值得自豪的东西。但两人彼此相爱至深,关心对方胜过自己。圣诞节前夕,双方悄悄地为对方准备礼物,吉姆卖掉了金表,给德儿买了漂亮的发卡;德儿剪掉心爱的金发并换成钱,为吉姆买了表链和表袋。到了交换礼物时,发现自己花了惨重代价换回的礼物,却成了无用之物。

 
与“囚徒困境”中的囚徒截然相反,“麦琪困境”的主角都是无私的好人,即把他人的利益放在首位。他们的偏好顺序是:(1)自己付出,对方不付出,对方受益;(2)大家都不付出,对方利益不受损;(3)双方都付出;(4)对方付出,自己不付出,对方受损。但其结果却与“囚徒困境”相同:单个人的最优选择却没有导致全局最佳的结果,或最符合个体理性的行为却不符合集体理性。

 
所以,无私的社会很难说就一定更美好。所以,我们应该避免陷入集体非理性的困境,与其强调改造个人动机,不如建立一套协调个体选择的制度安排这样更为现实而有效。

 
四、消解困境:一报还一报
 
这是美国密西根大学的罗伯特·爱克斯罗德提出通过实现得出的结论。“一报还一报”的策略是:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略,即实行胡萝卜加大棒的原则。这种人应具备如下特点:善意、宽容、强硬、简明。这种人一般是消解困境的胜利者。
 
附:强盗分金——博弈论
       
有五个强盗抢得100枚金币,在如何分脏问题上争吵不休,于是他们决定:

1、抽签决定各人的号码(1,2,3,4,5)

2、由1号提出分配方案,然后5人表决,如果方案超过半数同意就被通过,否则他将被扔进大海喂鲨鱼;

3、1号死后,由2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号同样被扔进大海

4、以此类推,直到找到一个每个人都接受的方案(如果只剩下5号,他当然接受一人独吞的结果)

 如果你是1号,你该提出怎样的方案呢?

 这个严酷的规定给人的第一印象是:如果自己抽到了1号,那将是一件不幸的事。因为作为头一个提出方案的人,仅仅能活下来的机会都微乎其微。 即使他自己一分不要,把钱全部送给另4人,那些人可能也不赞同他的分配方案,那么他只有死路一条。

 如果这样想,那么答案会大大出乎你意料。许多人公认的答案:分配方案1—5号分别得(97,0,1,2,0)或(97,0,1,0,2)

5号的策略最简单,巴不得把所有人都送去喂鲨鱼(但并不意味他要对每个人投反对票,他也要考虑其他人方案通过的情况)

4号:若1-3号都喂了鲨鱼,只剩下4和5,5号肯定投反对票所有4号只有支持3号才能促命
3号知道这个策略就会提出(100,0,0)的方案,他知道4号一无所获但还是会投赞成票,再加上自己一票方案就通过

2号推知3号的方案,就提出(98,0,1,1)由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局以致由3号来分配。

2号方案被1号所洞悉,1号就提出(97,0,1,2,0)或(97,0,1,0,2)由于这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1 号的赞成票,再加上1号自己的,即可通过!

 这是1号能够获得最大收益的方案!

1号看来最可能喂鲨鱼,但牢牢把握住先发优势,结果不但消除了死亡威胁,还收益最大。而5号看起来最安全,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。
-摘自《趣味博弈学》

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多