你好,欢迎来到我的《数学通识50讲》。我们上一讲讲了零和的博弈,其核心就是找到平衡点。今天我们来谈谈更难的一类博弈,非零和博弈。 很多人觉得,如果两个人分10000元的利润,各自拿了5000元就是双赢,这是一个对零和博弈的误解,也是对双赢的误解。 事实上,所有零和博弈,都没有双赢的可能性,只有平衡的可能性。今天媒体上常常喜欢用“双赢”这个词,其实它们所说的双赢,90%以上的情形都是达到平衡而已。但是,非零和博弈则可能实现双赢。 双赢到底存在吗?那么什么是非零和博弈呢?就是双方的得失加起来不是零,也不是个常数的博弈,我们先来看一个著名的例子——囚徒问题。 囚徒问题讲的是这样一件事,假设有两个罪犯X和Y,他们一起做案被抓住,接下来要定他们的罪。为了防止两个人串供,警方将两人分开审讯。如果两个罪犯都认罪,那么由于认罪态度好,刑期不重,只有5年。如果一个罪犯认罪,另一个抵赖,认罪的那个检举有功,无罪释放,而后者态度恶劣,判10年。还有最后一种情况就是,如果两个人都不认罪,两人都判一年。 下表给出了在这个博弈中双方的收益矩阵。由于他们的“收益”是刑期,因此我都用负数来表示。接下来的问题是,X和Y应该选择认罪还是抵赖? 根据我们上一讲的分析,每一个人要找出对方给自己造成最糟糕情况里的相对好的情况,也就是最小值中的最大值。 以X为例,他要考虑Y可能的策略。如果Y选择认罪,那X最好的情况是判5年,最坏的情况是判10年。如果Y选择抵赖,X不管怎么选择,最坏的情况不过是被判一年,比前一种情况好。因此,根据挑选最坏中的最好的原则,就是考虑到Y会认罪,而他的策略就是也认罪。类似的,Y也应该这么思考,于是他也会选择认罪。这样,双方都认罪就是上一讲提到的平衡点,都被判刑5年。 由于非零和博弈的平衡点问题最早是被纳什解决的,因此它也被称为“纳什均衡点”,它就相当于我们上一讲在零和博弈中讲到的马鞍点。在这种非零和博弈难题中,找到纳什均衡点就是最安全的解决办法。 讲到这里,你可能会说,不对啊,这个问题不是还有双赢的结果么?两个人都抵赖,不就是双赢么?这个说法没有错,但前提是双方要有默契,相互配合。如果一方不配合,对方就会有很大的损失。 因此,双赢点是大家主观上想达成的目标,但现实中客观的结局常常是纳什均衡点,也就是双输的结果。实现双赢的前提是彼此有信任,这种情况下的博弈,也被称为合作型博弈,而之前纳什解决的是非合作博弈。 囚徒问题在冷战时被战略家们用来说服美苏双方裁减核武器。我们可以看这样一个场景,如果一方发展核武,对方不发展,发展核武的一方虽然花点钱,损失是1,但是对方受到制约,损失是10。如果双方都发展核武搞军备竞赛,那么成本高,损失大,都损失5,但是这时双方形成了一种均衡。 在冷战时,美苏双方采用的就是这种策略。但是,如果双方能有信任,一同销毁核武,那么就会形成双赢。冷战最后的结局也是如此,美苏双方都不再建造新的核武器了。因此,囚徒问题一直被用来证明双赢的可能性。 想在现实中找均衡点,你得记住这五条:但是,在现实生活中,双赢的可能性远比大家想象的小很多,因为双赢点在数学上根本不是均衡点,它严重依赖于玩家的表现,玩家通常做不到相互信赖。这里面重要的原因至少有下面五个:
我是怎么用博弈论的?理解了零和博弈的这些特点,特别是双赢极其难以达成,并且长期遵守这个事实,我们就可以制定自己感觉舒服,利益得到保障的策略了。大家看我给双赢泼了这么多的冷水,可能会怀疑我是否相信双赢的存在,并且以达成双赢为目的。事实上我是非常喜欢双赢的,并且经常能够和周围人达成双赢。接下来我就分享一下我的体会。 首先,也是最关键的,就是找好你博弈的对象,这里面我说的博弈更多的是合作,不是竞争。我在《硅谷来信》以及在给女儿们的信中反复讲,我对任何人第一次都会相信他们是诚实的,也就是说愿意合作。但是对方只要做一次不诚信的事情,我会永久性地将这个人删除,因为只有在一个合作的环境中才有双赢的可能性。我们不能保证每一个人都是能够达成双赢的对象,但是我们可以选择和谁玩。 很多人会说,如果在某个特定情况下,那个不诚信的人会在某次给你输送巨大的利益,或者提供很多帮助呢?我的结论是,依然不要来往,因为轻易破坏自己的原则,就如同破坏几何学公理一样问题严重。 我从个人生活,到工作,再到这种活动,与合作者通常都是十几年甚至几十年的关系,他们并非完美,但是满足我能达成双赢的条件。很多人找上我,说我们能提供更好的条件,我都一一回绝,背地里的原因是,我在验证了那些人是可以达成双赢的人之前,不会把他们请进我的牌局。 其次,永远不要玩难以达成双赢的游戏,因为出来混总是要还的,人不可能永远在零和博弈中占别人的便宜。 大家听了我这段评论,可能会觉得这是我过去《硅谷来信》的风格,不像是在讲数学。实际上我们以通识为目的讲数学,就是要学习用主人的态度掌握里面的方法精髓,加以利用。 智猪博弈给我们哪些启示?事实上博弈论对大部分人来讲就是明白博弈和合作的道理,而不是解数学题。博弈论也是一个工具,它能够解释我们看到的很多现象,比如用纳什“智猪博弈”的例子,就能解释为什么一个落后地区的起步总是先要从模仿做起。当初的日本、韩国和台湾地区,以及最近几十年的中国,都是如此。 “智猪博弈”讲的是就是这样一种情形: 假设猪圈里有一只大猪和一只小猪。在猪圈的一头有猪食槽,另一头有一个按钮。按一下按钮,机器立刻会往食槽里倒进10磅猪食。但是,猪每按一次按钮,就要付出消耗2磅食物的成本,而且如果一只猪跑去按按钮,转身再去食槽,一些猪食就会被另一只猪抢先吃掉。 如果大猪去按按钮,因为小猪会等在食槽,它只能吃到6磅食物,小猪吃到4磅;反之,如果小猪去按按钮,等它转身回来时,大猪会吃掉9磅食物,小猪只吃到1磅;当然,两只猪可以同时按,然后转身去吃,这时大小猪各能吃到7磅和3磅。那么两只猪的策略应该是什么样的呢?我们之所以称这两只猪为智猪,是假设它们能算得清账。那结果是怎么样的呢?
智猪博弈的结论就是,小猪应该等在食槽旁静静等待,如果用在管理学和商业上,就是鼓励小企业和后来者采用搭便车式的跟随策略,而不是投入大量的金钱进行研发。因为如果小企业投入大量资金得到新技术,而大企业也享用技术并利用体量优势竞争,小企业就要垮台。 因此,强调知识产权和专利保护的人,常常用这个例子说明问题,因为没有对知识产权的保护,小企业就不会有活力,从长远来讲,就永远是大企业垄断。 到此为止,我们关于博弈论的内容就讲完了。这些理论可以成为我们的行动指南,但是大家在使用时,千万记住不要生搬硬套,毕竟现实世界的博弈比那几张表格复杂得多。 下一讲,我来回答大家在这个模块的疑问,同时依旧放出五道测试题,看谁是率先给出全部正确答案的5位同学,正确答案会在课程结束时公布。我们下一讲见。——吴军《数学通识五十讲》 |
|