分享

抛个硬币就好了,听天由命

 夏禾锄锄 2021-12-26

最近迷上经济学,在看某公众号文章时,手轻轻一抖即进入了文章底部的广告,阴差阳错买回一系列书籍。本以为可慢慢品读,让我学点常识。可是翻开第一本《博弈论'基础》,我就被一大串一大串的数学符号吓晕了,我认识书中的每一个字,却看不懂作者表达了啥意思。打开第二本、第三本……也是如此,我发现我掉了一个大坑

硬着头皮我啃完了能够理解的文字部分,却发现经济学和数学之间渊源,第一次领会数学的迷人之处。

2022年的主要任务之一花时间读完这一系列的十本书,在能够读懂的部分下,每本书至少做一篇摘记。

今天说说什么是博弈以及“匹配硬币”博弈的最佳策略

一,博弈:“博弈”字面意思是获取(得到)(下棋的)胜利,这里指的是由一组人参与(某个活动、事件),组中每个人的命运不仅取决于自身的行为,同时也取决于其他人的行为选择。

二,匹配硬币博弈的最佳策略。

匹配硬币博弈是考察策略相互作用的一个经典而简单的例子。

匹配硬币游戏规则:甲乙两人,每人同时出示一枚硬币,或者正面朝上,或者反面朝上。如果两枚硬币匹配都是正面或者反面,则甲给乙1元,反之,乙给甲1元。“匹配硬币”博弈的收益是赢得一枚硬币或者输掉 一枚硬币,每一个博弈方更想赢得一枚硬币。我们假设甲乙的选择刚好相反,甲的收益刚好是乙的收益的负数,这样的博弈称作零和博弈,这也是冯.诺伊曼1928年在《博弈论》一书中提出的。

如果最佳推测会使甲得出一个确定的结论:这个结论对乙而言根本不是秘密. 因为他的对手完全可以从甲的角度去考虑博弈,在这种情况下,最佳的推测将不可避免地导致他得出相同的结论。在“匹配硬币”的博弈游戏中,假设甲的最佳推测使得他更偏好选择正面,而乙所做出的最佳推测是基于考虑了甲的这个偏好。但是即使乙知道甲方偏好正面,他也会选择反面,因为只有当他与第一博弈方的选择不同时会实现收益最大化。

我们得到最佳推测的结论:甲方偏好正面,乙方偏好反面。现在我们将这一结论作为第一步,应用到甲乙两个博弈方的角色对换。由于当甲乙选择一样时,甲方的收益是最大的,我们的结论是,这时的最佳选择将导致甲方偏好反面。但是这与我们最初的假设甲偏好正面是相矛盾的。(这句话不太能理解,是不是角色对换以后甲的选择?)

正面和反面的互换也面临着同样的难题,因为既然是最佳选择,显然不能以博弈方在偏好其中一一个策略时牺牲另一个策略作为代价。为了避免出现这样的情况发生,甲乙一方可以用一个随机的机制来对正、反面分配相等概率。例如,他可以通过掷一枚硬币来决定选择正面还是反面。这就是冯.诺依曼对这个博弈的解决方案。直观地说,每个博弈方的目的都是防止其他的博弈方能够预测到自己的策略选择,那没有什么比随机做出的选择更难预测的了。

举几个栗子:

扑克牌游戏,有一种游戏规则是这样的发五张的纸牌开始时,每个玩家已放置一小部分(赌注)到底池中。然后发牌,之后开始投注。投注从庄家的左边开始沿着桌子顺时针旋转。每个玩家都需要投出至少和他右手边玩家样的赌注,不然就弃牌。弃牌的玩家将失去本轮所有投注,并且不再参与游戏,直到下个交易开始。投注多于右手边的叫加注,和右边玩家相同的叫跟牌。当所有没有弃牌的玩家都已经投注了相同的金额时,投注结束。所有没有弃牌的玩家开牌,手牌最好的人赢得底池中的所有赌注。

一般来说, “自然”策略是在手牌好的时候投重注,手牌差的时候投小注。但是这个简单固执的策略不太可能长期保持有效,因为最佳对大家而言根本不是秘密.其他玩家就会根据你投注的大小来判断你手牌的好坏。所以有时候就需要反其道而行之,即虚张声势有时候玩家要在手牌很差时下重注。这样做的目的并不在于手牌差的时候赢得胜利,而是通过这样做来吓唬别的玩家、让他们弃牌。目的是让别人知道下重注不一定表明自己有好牌。这样的话,当你有了一手好牌并选择下重注的时候,对手就不会自动弃牌,你就可以有机会赢得大笔钱。也就是说只有采取了随机策略才有一个最优的虚张声势率能实现利益最大化。

单位举行体检,为了避免集中,降低排长队的可能。按照博弈论思维,领导通知时说 “请尽量避免高峰时间赴医院就检”,就能降低排长队的概率。

但是每个人都会猜测别人大概会在什么时间去体检,从而选择一个他自己认为的非高峰时间去。假设一般人估计高峰期出现在8~10点,14~16点, 他就避开这些时间,但如果所有人与他的估计一致,都采取“避开高峰期”的策略,则还是会出现排长队的状况。所以还不如随机策略更加可行。

出现在考试中,一个老师在为学生出考试题时会随机从教科书中抽取内容。这样学生需要复习整本教科书才能保证自己考到最优的分数。

当然这个理论用故事来描述则有趣多了:

奥斯卡 摩根斯特恩(Oskar Morgenstern) 在普林斯顿的seminar上讲了这样一个问题:

福尔摩斯想从伦敦去巴黎,他有两种出行方式A(直接从伦敦坐船出发)和B (先火车转去一个小镇再出发)。

莫里亚蒂教授想干掉他,于是准备了一颗炸弹,众所周知,这2个人都绝顶聪明。

福尔摩斯是这样想的:如果我选A,莫里亚蒂猜到我选A,把炸弹放船上,我就死了。所以我应该选B;如果莫里亚蒂猜到我会这样想,把炸弹放火车上,我就死了。所以我应该选A ;如果莫里亚蒂猜到我会这样想,把炸弹放船上,我就死了。所以我应该选B……

然后无限循环 。

所以这个问题没有解决办法。

最后,冯诺依曼说:

“有啊,福尔摩斯抛个硬币就好了,听天由命。”

最后留个思考题:一位海军上将指挥一支护舰队,既可以驶向一座岛屿的北部也可以驶向一座岛屿的南部,而他的对手只有一艘舰艇,只能控制两条航线中的一条。海军上将的最优策略是什么?

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多