分享

非零和博弈(纳什均衡):真的存在共赢吗?

 晨渭 2019-12-28
非零和博弈(纳什均衡):真的存在共赢吗?

你好,欢迎来到我的《数学通识50讲》。我们上一讲讲了零和的博弈,其核心就是找到平衡点。今天我们来谈谈更难的一类博弈,非零和博弈。

很多人觉得,如果两个人分10000元的利润,各自拿了5000元就是双赢,这是一个对零和博弈的误解,也是对双赢的误解。

事实上,所有零和博弈,都没有双赢的可能性,只有平衡的可能性。今天媒体上常常喜欢用“双赢”这个词,其实它们所说的双赢,90%以上的情形都是达到平衡而已。但是,非零和博弈则可能实现双赢。

双赢到底存在吗?

那么什么是非零和博弈呢?就是双方的得失加起来不是零,也不是个常数的博弈,我们先来看一个著名的例子——囚徒问题。

囚徒问题讲的是这样一件事,假设有两个罪犯X和Y,他们一起做案被抓住,接下来要定他们的罪。为了防止两个人串供,警方将两人分开审讯。如果两个罪犯都认罪,那么由于认罪态度好,刑期不重,只有5年。如果一个罪犯认罪,另一个抵赖,认罪的那个检举有功,无罪释放,而后者态度恶劣,判10年。还有最后一种情况就是,如果两个人都不认罪,两人都判一年。

下表给出了在这个博弈中双方的收益矩阵。由于他们的“收益”是刑期,因此我都用负数来表示。接下来的问题是,X和Y应该选择认罪还是抵赖?

非零和博弈(纳什均衡):真的存在共赢吗?

根据我们上一讲的分析,每一个人要找出对方给自己造成最糟糕情况里的相对好的情况,也就是最小值中的最大值。

以X为例,他要考虑Y可能的策略。如果Y选择认罪,那X最好的情况是判5年,最坏的情况是判10年。如果Y选择抵赖,X不管怎么选择,最坏的情况不过是被判一年,比前一种情况好。因此,根据挑选最坏中的最好的原则,就是考虑到Y会认罪,而他的策略就是也认罪。类似的,Y也应该这么思考,于是他也会选择认罪。这样,双方都认罪就是上一讲提到的平衡点,都被判刑5年。

由于非零和博弈的平衡点问题最早是被纳什解决的,因此它也被称为“纳什均衡点”,它就相当于我们上一讲在零和博弈中讲到的马鞍点。在这种非零和博弈难题中,找到纳什均衡点就是最安全的解决办法。

讲到这里,你可能会说,不对啊,这个问题不是还有双赢的结果么?两个人都抵赖,不就是双赢么?这个说法没有错,但前提是双方要有默契,相互配合。如果一方不配合,对方就会有很大的损失。

因此,双赢点是大家主观上想达成的目标,但现实中客观的结局常常是纳什均衡点,也就是双输的结果。实现双赢的前提是彼此有信任,这种情况下的博弈,也被称为合作型博弈,而之前纳什解决的是非合作博弈。

囚徒问题在冷战时被战略家们用来说服美苏双方裁减核武器。我们可以看这样一个场景,如果一方发展核武,对方不发展,发展核武的一方虽然花点钱,损失是1,但是对方受到制约,损失是10。如果双方都发展核武搞军备竞赛,那么成本高,损失大,都损失5,但是这时双方形成了一种均衡。

在冷战时,美苏双方采用的就是这种策略。但是,如果双方能有信任,一同销毁核武,那么就会形成双赢。冷战最后的结局也是如此,美苏双方都不再建造新的核武器了。因此,囚徒问题一直被用来证明双赢的可能性。

想在现实中找均衡点,你得记住这五条:

但是,在现实生活中,双赢的可能性远比大家想象的小很多,因为双赢点在数学上根本不是均衡点,它严重依赖于玩家的表现,玩家通常做不到相互信赖。这里面重要的原因至少有下面五个:

  1. 博弈通常不是一次性的,而是反复进行的,长期坚持信任几乎做不到,而一旦一方开始采用不合作的策略,给对方造成巨大损失,对方也会马上调整策略。
  2. 博弈论讲的都是阳谋的策略,但是很多时候双方博弈使用的是阴谋。使用阴谋就无法让双方产生信任,而没有信任,均衡点就是双输。一战后美国总统威尔逊在总结大战爆发的原因时发现,秘密外交,搞阴谋是个重要的原因,因此他努力推动国际联盟,目的就是把阴谋变成阳谋。
  3. 人类还处于文明的初级阶段,人的道德水准不容高估,很多人并非在主观上想做违反规则的事情,也懂得双赢的道理,但是就是看不惯别人和自己一样好,更不能容忍别人比自己好,于是当他们看到能够在自己损失1,让对方损失10的情况发生,完全干得出这种事。
  4. 乌合之众效应。如果是两个人博弈,很容易达成双赢的结果。如果是两个由帮主说了算的帮会,或者独裁国家,这种事也不难做到。但是在两个民主国家之间,或者两个权力分散的机构之间,这种事情就很难达成。世界上有些重大事情,大家都很清楚双赢的点在哪里,比如全球贸易、均衡发展、消除贫困和疾病,但是在这方面很难达成一致,而且就算短期达成一致,各方也很难遵守。原因是博弈的各方不是一个人,而是每一方自身内部有各种利益冲突。比如说经济全球化,就意味着一些国家必须放弃一些产业,而那些相关的产业工人就会牵引政客们偏离共赢点。
  5. 很多时候看似是双赢,其实是在更大范围内通过零和博弈获利。信息时代针对员工的期权制度便是如此。在之前分配利润的工业时代,劳资双方是零和博弈,因为一方多拿点,另一方就要少一点。但是当下很多企业,通过给员工发放股票期权,只要把企业业绩做上去,期权会自动给员工带来巨大的收益,不用分配利润。这看上去是一个双赢的结果。但实际上它们和资本市场,包括股民,玩的依然是零和博弈。

我是怎么用博弈论的?

理解了零和博弈的这些特点,特别是双赢极其难以达成,并且长期遵守这个事实,我们就可以制定自己感觉舒服,利益得到保障的策略了。大家看我给双赢泼了这么多的冷水,可能会怀疑我是否相信双赢的存在,并且以达成双赢为目的。事实上我是非常喜欢双赢的,并且经常能够和周围人达成双赢。接下来我就分享一下我的体会。

首先,也是最关键的,就是找好你博弈的对象,这里面我说的博弈更多的是合作,不是竞争。我在《硅谷来信》以及在给女儿们的信中反复讲,我对任何人第一次都会相信他们是诚实的,也就是说愿意合作。但是对方只要做一次不诚信的事情,我会永久性地将这个人删除,因为只有在一个合作的环境中才有双赢的可能性。我们不能保证每一个人都是能够达成双赢的对象,但是我们可以选择和谁玩。

很多人会说,如果在某个特定情况下,那个不诚信的人会在某次给你输送巨大的利益,或者提供很多帮助呢?我的结论是,依然不要来往,因为轻易破坏自己的原则,就如同破坏几何学公理一样问题严重。

我从个人生活,到工作,再到这种活动,与合作者通常都是十几年甚至几十年的关系,他们并非完美,但是满足我能达成双赢的条件。很多人找上我,说我们能提供更好的条件,我都一一回绝,背地里的原因是,我在验证了那些人是可以达成双赢的人之前,不会把他们请进我的牌局。

其次,永远不要玩难以达成双赢的游戏,因为出来混总是要还的,人不可能永远在零和博弈中占别人的便宜。

大家听了我这段评论,可能会觉得这是我过去《硅谷来信》的风格,不像是在讲数学。实际上我们以通识为目的讲数学,就是要学习用主人的态度掌握里面的方法精髓,加以利用。

智猪博弈给我们哪些启示?

事实上博弈论对大部分人来讲就是明白博弈和合作的道理,而不是解数学题。博弈论也是一个工具,它能够解释我们看到的很多现象,比如用纳什“智猪博弈”的例子,就能解释为什么一个落后地区的起步总是先要从模仿做起。当初的日本、韩国和台湾地区,以及最近几十年的中国,都是如此。

“智猪博弈”讲的是就是这样一种情形:

假设猪圈里有一只大猪和一只小猪。在猪圈的一头有猪食槽,另一头有一个按钮。按一下按钮,机器立刻会往食槽里倒进10磅猪食。但是,猪每按一次按钮,就要付出消耗2磅食物的成本,而且如果一只猪跑去按按钮,转身再去食槽,一些猪食就会被另一只猪抢先吃掉。

如果大猪去按按钮,因为小猪会等在食槽,它只能吃到6磅食物,小猪吃到4磅;反之,如果小猪去按按钮,等它转身回来时,大猪会吃掉9磅食物,小猪只吃到1磅;当然,两只猪可以同时按,然后转身去吃,这时大小猪各能吃到7磅和3磅。那么两只猪的策略应该是什么样的呢?我们之所以称这两只猪为智猪,是假设它们能算得清账。那结果是怎么样的呢?

非零和博弈(纳什均衡):真的存在共赢吗?

「我们把大猪和小猪采用不同策略后的收益总结在下面的表格中,听音频的朋友可以扫一眼文稿中的表格。在表格中,竖着的是大猪的策略,横着的是小猪的策略,每个单元里第一个数值是大猪的收益,第二个是小猪的。

从表格中可以看出,如果大猪去按按钮,小猪如果也去按,那么它能吃到7磅,扣除了两磅的成本,净赚5磅。类似的,小猪在扣除成本后,净赚1磅。这就是第一个单元里两个数值的含义。从第一行的数值可以看出,不讨论小猪采用什么策略,它至少可以获得4磅的收益。

相反,如果它在食槽旁等待,虽然有可能获得9磅的收益,但是可能小猪也在等,结果双方所得都是零,时间一长就会因为吃不到东西而饿死。因此,大猪的最小值中最大值的策略是按按钮。相反,你仔细分析一下,小猪的策略则是应该在食槽旁等待。这样的结果能达到一种双赢,而且恰好是双方博弈的均衡点,因此它是稳定的。这就和前面讲的囚徒问题有所不同了。」

智猪博弈的结论就是,小猪应该等在食槽旁静静等待,如果用在管理学和商业上,就是鼓励小企业和后来者采用搭便车式的跟随策略,而不是投入大量的金钱进行研发。因为如果小企业投入大量资金得到新技术,而大企业也享用技术并利用体量优势竞争,小企业就要垮台。

因此,强调知识产权和专利保护的人,常常用这个例子说明问题,因为没有对知识产权的保护,小企业就不会有活力,从长远来讲,就永远是大企业垄断。

到此为止,我们关于博弈论的内容就讲完了。这些理论可以成为我们的行动指南,但是大家在使用时,千万记住不要生搬硬套,毕竟现实世界的博弈比那几张表格复杂得多。

下一讲,我来回答大家在这个模块的疑问,同时依旧放出五道测试题,看谁是率先给出全部正确答案的5位同学,正确答案会在课程结束时公布。我们下一讲见。——吴军《数学通识五十讲》

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多