《博弈经济学原理》作者:赵宁第一卷海盗分金古时候,有10名海盗抢得了窖藏的100块金子,并打算瓜分这些战利品。这是一群讲民主的海盗 ,他们的习惯是按下面的方式进行分配:最厉害的一名海盗提出分配方案,然后所有的海盗包括提出方案者本人就此方案进行表决。如果50%或者 更多的海盗赞同此方案,那么此方案就获得通过并据此分配战利品,否则提出方案的海盗将被扔到大海里喂鱼。保罗·萨缪尔森曾说“要想在现代 社会做一个有文化的人,你必须对博弈论有一个大致了解。”博弈经济学原理,它研究的参与者通常有两个或者更多相互作用的参与者构成,这些参 与者的行为,也就是在策略选择上是相互影响的。在博弈的过程中,没有任何一个参与者能够支配博弈的结果,博弈的结果不仅仅取决于你的行为, 也取决于其他参与者的行为。它源自于生活的方方面面,因为我们在生活中无时无刻都在进行着博弈。假如你是一位农民,有一块菜地,你会选择种 什么,白菜或萝卜?每一位智慧的农民都能根据其他农民的选择做出有利于自己的选择,如果种白菜的太多,那么最优的选择就是种萝卜,反之亦然 。再比如说品茶,品茶是中国独特的传统文化,茶叶的等级决定了茶的品味好坏,同样的茶叶,因为等级的不同,而卖出的价钱是不同的,有的人不 惜一掷千金买一些好茶叶,而实际它们的价值远远不值它们所付出的价钱,对于这一经济行为所能给出的解释是,虽然茶叶并不值那么多,但是它冲 出来的茶带给消费者的品味,它所带给消费者的附加收益可以弥补消费者的付出,从而让消费者认为自己的购买行为所带来的收益是超值的。对于这 一点,让我想起了孩提时代的一件事情,弹球我们都玩过,为什么成本只有2-3毛的弹球却可以卖到一元钱,并且还有许多人购买,尽管它不值那 么多钱。这些都是附加收益引起的,你为它付出的价钱和它所能够带给你的附加收益,要远远大于你付出的价钱本身,这就是为什么明明一件东西不 值那么多,而却有很多人购买,他们并为自己的行为感到满意,认为是值得的。博弈经济学理论有三个要素是必不可少的,第一,参与人,两个或者 更多,因为一个人是不可能实现对弈的,至少需要两个或更多才能构成博弈;第二,非单一性的策略,就是参与人可以选择的策略,至少两个,当然 它也可以是更多;第三,收益,参与人在不同策略选择下的收益是不相同的,收益是一种简单的数学量化,不过不用担心,它不会像陈景瑞证明1+ 1那么枯燥无味,这些量化后的数据便于参与者比较并选择出,那一项策略对于自己而言是最优的。这三个要素是博弈进行所必不可少的,其中,参 与人策略的多样性选择,会使博弈的结果产生多种可能,再加上参与人的策略选择,会直接影响博弈的结果,这个博弈的结果不仅取决于你的策略选 择,也取决于其他参与人的策略选择,这样就形成了一个个丰富多彩的博弈经济学模型。Ⅰ海盗分金一个非常经典的博弈案例“海盗分金”,它自 从1999年,在《科学美国人》正式把它发表之前,就已经流行很多年了,相信很多人都有所耳闻。关于海盗给大家的印象,大多数情况是这样的 ,一帮亡命之徒,在海上掠人钱财,夺人性命,干的都是些刀头上舔血的营生。他们一般都是独眼龙,用条黑布把瞎眼遮上。他们还有在地下埋宝藏 的习惯,而且总要画上一张藏宝图,以方便后人掘取。然而很少有人知道,海盗是世界上最富有民主的团体。参加海盗的都是桀骜不驯的汉子,富有 独立精神。平时,海盗们之间一切事都是通过投票来解决的。船长的唯一特权,就是拥有自己的一套餐具。可是在他不用时,其他海盗是可以借来用 的。海盗船上的唯一惩罚,就是被丢到海里去喂鱼。现在,船上有10名海盗,要分得来的100枚金币。自然,这样的问题,他们是需要通过投票 来解决的。投票的规则是这样的,先由等级最高的海盗来提出分配方案,然后大家(其中包括提出分配方案的海盗本人)一人一票进行表决,如果有 50%或者50%以上的海盗同意这个分配方案,那么就依此方案进行分配,如果少于50%的海盗同意这个分配方案,那么提出这个分配方案的海 盗,就将被丢到大海里去喂鱼,然后再由剩下的海盗中,等级最高的那个海盗再次提出分配方案,依此类推。博弈之前,我们需要做一些基本的假设 ,船上有10名海盗,他们分别是P1,P2,P3,P4,P5,P6,P7,P8,P9,P10,假定海盗P10的等级最高。这10名海盗 就是博弈的参与人,每一个参与者都是很聪明的人,都能非常理智的判断得失,并作出恰当的策略选择。每一个参与者都希望得到更多的金币,并且 没有被抛下海喂鱼的可能。每一个参与者都是功利主义者,如果在一个方案中他得到了1枚金币,而在下一个方案中,他有两种可能,一种是得到许 多金币,一种是得不到金币,他会同意目前的这一方案。每一个参与者都希望自己的同伴被抛到海里喂鱼,在不损害自己利益的前提下。最后一条也 是最重要的,参与者之间不存在私底下的交易,因为海盗除了自己谁都不相信。这些假设都基本符合海盗的生活习性,为了保证博弈能在公平的环境 中进行,也就是必须保证海盗之间不存在私底下的交易。对于这10名海盗而言,分配方案就是海盗们的策略,每一个海盗都可以选择1~100之 间的任何一个数字,并把这个数字的金币归自己所有,然后把剩余的金币分给同伴,如果你是海盗P10,你认为怎么分,才能获得更多的金币,并 且没有被扔下海喂鱼的可能?这是一个多参与者,多策略选择的博弈模型。我们要想知道海盗P10的最佳决策,必须从最后的情形开始向前推理, 首先考虑海盗船上只剩下2个海盗的情况,即海盗P1和海盗P2,其中等级关系是海盗P2>海盗P1。海盗P2选择的最佳方案是,在这之前要 强调一下,金币是不可分割的,不能你半枚,我半枚,很明显,海盗P2会分给自己100枚金币,而海盗P1一枚不分。在投票表决时,他自己给 自己投一票就足够50%了,这样就不会被扔到海里了,这是只剩下海盗P1和海盗P2两名海盗,对于海盗P2的最佳分配方案。现在我们把海盗 P3也考虑进去,也就是船上又多了一个海盗P3,海盗P1和海盗P3都明白,如果海盗P3自己的方案被否决了,这个博弈游戏就会只由海盗P 1和海盗P2来继续,这样的话,海盗P1就一枚金币也得不到。因此海盗P3知道,只要给海盗P1一枚金币,海盗P1就会同意他的方案。相反 ,如果海盗P3不给海盗P1一枚金币,海盗P1反正什么也得不到,宁可投票让海盗P3去喂鱼。所以海盗P3的最佳策略是:海盗P1得1枚, 海盗P2得0枚,海盗P3得99枚。再来考虑海盗P4加进来的情况,他只要得两票就可以不被丢到海里了,海盗P4比谁都明白,他只要给海盗 P2一枚金币就可以让他投票赞同这个方案,因为接下来在海盗P3的方案中,海盗P2什么也得不到。海盗P5也是相同的推理方法,他给在海盗 P4方案中,什么也得不到的海盗P1和海盗P3各一枚金币,自己留下98枚,就可以获得大于50%的支持率。依此类推,最终得到海盗P10 的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的海盗P2、海盗P4、海盗P6和海盗P8各一枚金币。“海盗分金”这个 模型的成立,必须保证10名海盗都是理性的人,有主见的人,并且不存在私下的交易,这是一个必要的前提。这10名海盗中,对于海盗P10的 最佳分配方案,结果是这样的,P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、 0、96枚金币。在“海盗分金”中,对于任何一名海盗而言,想让自己的方案获得通过的关键是,事先考虑清楚其他海盗的分配方案是什么,拉拢 那些在下一次分配方案中得不到金币的同伴,并且以最小的付出获得更大的利益。这个博弈看起来有些难以置信。海盗P10最有可能被扔到海里去 喂鱼,但他却牢牢地把握住先发优势,运用博弈推理,结果不但消除了死亡威胁,还获得了最大收益。而海盗P1,看起来最安全,没有死亡的威胁 ,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。拉拢那些在分配方案中最不得意的 海盗,这一策略是值得我们借鉴的。现实中这样的例子有很多,革命者往往找穷苦人,并最终获得成功,因为他们都是些最失意的人;恐怖分子拉登 在沙特阿拉伯没有市场,在阿富汗却大受欢迎,他们都是抓住了这一点。Ⅱ松鼠分坚果“松鼠分坚果”是关于两个松鼠如何分配10枚坚果的博弈 ,这个博弈模型与“海盗分金”不同,虽然都牵涉到分配方案,但在这个博弈原理中,所做的一些强制性的假设改变了博弈的属性。这个博弈有两个 参与者,它们分别是松鼠A和松鼠B,我们假定松鼠A是提议者,而松鼠B是回应着,它们准备分配10枚坚果。博弈之前,先做一些强制性的假设 ,这些假设在博弈的过程中,可以帮助我们说明问题,它们是建立博弈模型所必须的。首先松鼠A先提出一个分配坚果的方案,然后松鼠B决定是否 同意松鼠A的提议。如果松鼠B同意,就实施这一分配方案,然后它们各自将获得松鼠A提议的坚果分配数目,博弈结束;如果松鼠B不同意,那么 它们都将一无所获,博弈结束。我们来思考一下,如果你站在松鼠A的立场上,你会提议怎样分配这10枚坚果?现在,两只松鼠都是理性的,它们 都只关心自己的利益,并且它们都能找到追求自身利益的最优策略。在这个前提下,松鼠A会这样想,无论我提议怎样分,松鼠B都只能在接受提议 或一无所获之间进行选择。无论我的提议是什么,只要不是0枚,如果松鼠B足够理性的话,那么它都会无条件接受。松鼠A在这个博弈中,可以给 松鼠B尽可能少的坚果,使自己的利益最大化,例如只给松鼠B一枚坚果,我们知道坚果是不可分的。因此,松鼠A一定会提议给松鼠B这一最少的 数目,而松鼠B只能选择接受。因为松鼠B明白,如果不接受,自己最终将是一无所获。关于这个博弈,人们已经做过大量的实验。通常情况下,实 验者让24个左右的受试者聚集在一起,并让他们随机组对。每一对都要指定一个提议者和一个回应者,提议者提议如何分配10元人民币,然后进 行博弈。接着再次随机组成新的组合,重新博弈。通常,参与者们不知道他们会在博弈中和谁组对。通过实验,这个博弈的实际结果与松鼠分坚果的 结果不同,并且存在着巨大的差异,给予回应者的金额随着提议者的不同而不同。从实验结果来看,提议给回应者1元的情况非常罕见。经过反复实 验发现,5∶5的分割分配方法是唯一最常见的提议。然而也有大部分提议者提出给回应者少于总金额的30%的提议,这些被拒绝的概率是50% ,他们存在这样的思想,你不分给我足够多,我也会让你什么也得不到。这说明了纯粹的理性经济人是无法实现的,人是有思想有感情的,是一个复 杂的个体。Ⅲ选举博弈通过海盗分金和松鼠分坚果两个案例,我们至少明白了,如何在策略形势中,找到对于自己而言的最优策略,使得自己的利 益获得最大化。这里再列举一个关于选举的博弈模型,并找出最优的策略,你可以把这个模型看作是美国总统的大选。现在有两个候选人A和B,你 可以把他们想象成2000年美国总统大选中的布什与戈尔,在选举的过程中,候选人的首要任务是确定自己的政治立场,然后博得相同或相近立场 的人的选票支持。假定在这个博弈中有10个不同的政治立场,分别代表着候选人的10种不同策略,其中每一个政治立场对于候选人来说会得到1 0%的选票,选民会把选票投给最近的候选人。如果两名候选人A和B所得票数相同,那么他们将平分选票。在这个博弈模型中,哪个立场对于候选 人来说是最优的策略选择呢?我们来分析一下,候选人有十种策略选择,我打算用阿拉伯数字表示,它们分别是(1,2,3,4,5, 6,7,8,9,10),1在左端代表左派,10在右端代表右派,1和10是一对相互矛盾的立场,现实中,左派反对右行,右派反对 打左灯,如果你选择立场1,那么你绝对不可能获得立场10的10%选票,反之亦然。我们先看一下,当候选人A和B同时选择立场1时,那么他 们会得到同样的票数,因此他们会各得50%的选票;当候选人A选择立场2,B选择立场1时,那么B只能得到立场1的10%的选票,而A则得 到剩下的90%的选票;当候选人A和B同时选择立场2时,那么他们将平分选票,各得50%的选票;当候选人A选择立场1,B选择立场2时, 那么A得10%的选票,B得剩下的90%的选票。从这里可以看出,对于候选人A和B来说,选择立场2永远优于立场1。我们再看当候选人A选 择立场3,B选择立场2的情况,前面我们得到这样的结果,选择立场2明显优于立场1,因此候选人B不会再选择立场1,我们只考虑他选择立场 2的收益,在这种情况下,候选人B将获得20%的选票,而候选人A将获得剩余的80%的选票;当候选人A和B同时选择立场3时,这时他们将 平分选票,各得50%的选票,我们发现,对于候选人A和B来说,选择立场3明显优于立场2。同理,我们会得出立场4明显优于立场3,立场5 明显优于立场4,立场6呢,它是否优于立场5呢?情况并非如此,立场5和立场6拥有同等的优势。我们分析一下,如果候选人A选择立场5,B 选择立场6,那么A将获得左边的选票,B将获得右边的选票,他们的票数是一致的。根据对称性,我们可以推出,立场9优于立场10,立场8优 于立场9,立场7优于立场8,立场6优于立场7。我们可以看到立场5和立场6都是最优的策略,这是我们不断剔除劣势策略而得到的结果,这在 博弈中称之为迭代剔除劣势策略。假如这个博弈的政治可选立场为11个,那么无疑立场6就是最优的策略选择,事实上这就是所谓的中间选民定理 。这个博弈模型告诉我们,候选人不能单凭自己的喜好选择自己的政治立场,比如说候选人在政治立场上,他更喜欢左派或者是右派的作风,但他为 了选举能获得成功,也就是获得更多的选票,就不得不改变自己的政治立场,把自己表现的尽量靠中间的立场上,因为这样可以使自己获得更多的选 票,并在选举中获得成功。小结“海盗分金”是一个极具趣味性的案例,如果你要知道博弈中的海盗P10如何做决定,并且没有被扔下海喂鱼的 可能,就必须知道海盗P9如何做决定;而如果你要知道海盗P9如何做决定,并且没有被扔下海喂鱼的可能,就必须知道海盗P8如何做决定,依 次类推。从这个案例中可以明显的看出,如果海盗船上只剩下P1和P2两个海盗,那么我们就能很容易的得出对于海盗P2的最优分配方案,有了 海盗P2的分配方案,那么海盗P3的最优分配方案也很容易得出,依次类推,我们就可以得出海盗P10的最优分配方案。这就是在博弈中最常用 到的逆向思维归纳法。“松鼠分坚果”在理论层面上,它是成立的,但这样的分配方案在现实中是不适用的。比如说,你从你朋友那拿了100元做 生意,赚了10元钱,你作为提议者分给你朋友1元,这时你朋友理性的接受了,而在下次你做生意向你的朋友凑做生意的本钱时,他却没能爽快的 借给你,这就是财聚人散,财散人聚的道理。也许有人对博弈经济学原理产生这样的疑问,博弈模型都是建立在抽象的基础上,那么它的现实意义有 多大呢?博弈经济学原理是研究策略形势的一门理论,博弈的理论与模型可以引导我们,在现实中如何才能追求利益的最大化,如海盗分金和松鼠分 坚果,虽然这些例子与现实有一些距离,曾让我个人质疑它的现实意义,但是后来,我发现它的实际意义是相当大的。“田忌赛马”案例发生在现实 中,话说齐国的大将田忌,很喜欢赛马,有一回,他和齐威王约定,要进行一场比赛。他们商量好,把各自的马分成上,中,下三等。比赛的时候 ,要上马对上马,中马对中马,下马对下马。由于齐威王每个等级的马都比田忌的马强得多,所以比赛了几次,田忌都失败了。田忌觉得很扫兴,比 赛还没有结束,就垂头丧气地离开赛马场。这时,田忌抬头一看,人群中有个人,原来是自己的好朋友孙膑。孙膑招呼田忌过来,拍着他的肩膀说: “我刚才看了赛马,威王的马比你的马快不了多少呀。”孙膑还没有说完,田忌瞪了他一眼:“想不到你也来挖苦我!”孙膑说:“我不是挖苦 你,我是说你再同他赛一次,我有办法准能让你赢了他。”田忌疑惑地看着孙膑:“你是说另换一匹马来?”孙膑摇摇头说:“连一匹马也不 需要更换。”田忌毫无信心地说:“那还不是照样得输!”孙膑胸有成竹地说:“你就按照我的安排办事吧。”齐威王屡战屡胜,正在得意 洋洋地夸耀自己马匹的时候,看见田忌陪着孙膑迎面走来,便站起来讥讽地说:“怎么,莫非你还不服气?”田忌说:“当然不服气,咱们再赛一 次!”说着,“哗啦”一声,把一大堆银钱倒在桌子上,作为他下的赌钱。齐威王一看,心里暗暗好笑,于是吩咐手下,把前几次赢得的银钱全部抬 来,另外又加了一千两黄金,也放在桌子上。齐威王轻蔑地说:“那就开始吧!”一声锣响,比赛开始了。孙膑先以下等马对齐威王的上 等马,第一局输了。齐威王站起来说:“想不到赫赫有名的孙膑先生,竟然想出这样拙劣的对策。”孙膑不去理他。接着进行第二场比赛。孙膑拿上 等马对齐威王的中等马,获胜了一局。齐威王有点心慌意乱了。第三局比赛,孙膑拿中等马对齐威王的下等马,又战胜了一局。这下,齐威王 目瞪口呆了。田忌最初不是输在马上,而是输在对策上,田忌输的根本原因就是没有正确的把握策略形势。后来,田忌经过了孙膑先生的献策,并 最终赢得了齐威王,田忌赢得比赛的根本原因,就是孙膑找到了使得田忌获得收益最大化的策略。我们对其中各种策略进行收益分析,就会很清楚的 看到这一点:第一种情形,上等马对上等马,中等马对中等马,下等马对下等马,结局是三局零胜。第二种情形,上等马对上等马,下等马对中等马 ,中等马对下等马,结局是三局一胜。第三种情形,中等马对上等马,上等马对中等马,下等马对下等马,结局是三局一胜。第四种情形,中等马对上等马,下等马对中等马,上等马对下等马,结局是三局一胜。第五种情形,下等马对上等马,上等马对中等马,中等马对下等马,结局是三局两胜。第六种情形,下等马对上等马,中等马对中等马,上等马对下等马,结局是三局一胜。无疑,第五种情形是最好的策略选择,也正是孙膑所献的策略。还有三国时期的“空城计”,这个故事可谓是妇孺皆知,其情况是这样的,诸葛亮误用马谡,致使街亭失守,司马懿带领15万大军蜂拥而来,这时诸葛亮身边没有大将,只有一班文官和2500名军士在城中。我们可以清楚的看到司马懿如果要攻城,比踩死一只蚂蚁还要容易,诸葛亮明白无论选择守城或者弃城这两种策略,都要被司马懿擒获。因此诸葛亮惟一能做的就是让司马懿觉得后退策略比进攻策略的期望收益大,也就是说尽力降低司马懿进攻的可能收益,使之后退。于是诸葛亮经过一番盘算,焚香操琴演了一出古今称绝的空城计。这两个例子都是发生在现实的背景中,我们从中可以窥见它不是空洞的一套理论,它的现实指导意义是不可忽视的,因此,只有更好的掌握它,才能成为策略上的赢家。 |
|