分享

博弈:你输我赢,或是两相欢喜?

 dch0328 2018-04-24


所有的人同时拥有更多,这是可能的;而越多的人与你想要的东西一致,你就越有可能得到它 —— 只是 “正和博弈”变得可能的时间,相较于人类漫长的争斗史还太短,所以这个概念可能违反我们的直觉,需要我们主动提升认知。


备受推崇的电影《美丽心灵》,再现了近代数学天才约翰·纳什的传奇经历。他是现代“博弈论”的支柱性人物,并在1994年获得诺贝尔经济学奖。1950年,年仅22岁的他发表的短短几十页的博士论文《非合作博弈》以及同年发表的《N人博弈中的均衡点》,完全改变了博弈论和现代经济学的发展,甚至可以说,彻底刷新了我们看待生活的视角。

 

为什么 —— 因为在那之前,博弈论的研究范围仅限于“二人零和博弈”,也就是研究两个人之间你赢我输,总获利为零的简单游戏。但真实生活中,多人博弈,错综复杂的利益得失,双赢、多赢或者两败俱伤的情况非常多见。纳什将博弈论的研究范围一下从“小胡同”引入广阔天地,为占博弈情况大多数的“多人非零和博弈”找到了意义,并彻底改变了人们对竞争、市场、合作关系等现当代社会重要概念的看法。

 

// 零和博弈,愿赌服输 //

 

如果世界是一个完全封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这就是一个“邪恶进化论”式的弱肉强食的世界。从奴隶社会到农业社会,当我们猎取食物、种植粮食的能力,以及可耕种土地都非常有限的情况下,世界就是一个“零和博弈”的战场。

 


如果“战场”这个比喻太过残酷,我们也可以想象一下这个世界的资源就是一个尺寸确定的蛋糕,大家一起来分吃蛋糕,那么,最好的可能就是平均分(当然一定有人不乐意均分),不然,一定有人多分,有人少分,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加的总和永远为“零”,你的幸福一定建立在别人的痛苦之上,你的所得一定建立在别人的损失之上。这是一种不可能产生“合作”的博弈,各方立场都很清楚:争取各自最大的利益。

 


所有对弈的游戏、下棋、猜拳、赌博、你赢我输的游戏,皆为如此。

 

—— 有限资源下的“零和博弈”,也可称为存量博弈。大家这些年热议并引起普遍焦虑的教育、医疗问题,从某种意义上说,都是这样的博弈 —— 直到每一次突破性的创新,来改变整个领域的格局。

 

// 非零和博弈,囚徒困境 //

 

这里,需要引用博弈论中最经典的例子:囚徒困境

 

甲乙两位盗贼犯案后被捕,警察对他们采取了单独审讯的策略,并告知他们:一方坦白另一方抵赖,那么坦白方当即释放,抵赖方重判10年;双方都坦白认罪,各判5年;双方都抵赖,拒不认罪,警方会因为证据不足而不得不同时释放二人。

 

那么,结局会如何?因为甲乙不能串供,不知晓对方的策略,出于自保的理性心态,可能都会选择坦白:最多坐5年,若是侥幸同伙抵赖,自己还能直接释放。两人都这么想,警察就获得了自己最理想的结果。由于无法“有效沟通”,两人都为了自己最大利益的追求,放弃了最好的“合作”可能,也就是最好的均衡(双方都抵赖),而选择了双输的“均衡”。

 

囚徒困境的经典之处,在于它告诉我们,第一,博弈常常是“非零和博弈”,可能双赢,可能双输;第二,一场博弈中并不一定只有一个“纳什均衡”,会因为双方的选择(可能存在有效沟通,也可能都是盲选),而成为好的“正和博弈”,或者成为“负和博弈”,好坏之间可以相互转换。第三,即使每个人都是理性的,得到的结果未必就是最理性的。

 

// 一个让人拍案叫绝的“正和博弈”案例 //

 

下面我们就来看一段精彩绝伦的“囚徒困境”的实际案例。

 


故事发生在BBC的一个游戏节目里,这个节目叫“金球” (Golden Balls)。经过多轮对人性的考验和角力后,到最后只剩下两名选手和一大笔奖金。

 

这个时候,主持人会给每人两个球,其中一个写着Split(平分),另一个写着Steal(偷走),他们需要从中选择一个球。根据两人的选择,会出现三种情况:

 

  1. 如果两个人都选择了Split,那么皆大欢喜,两个“好人”可以平分之前累积的奖金,这是最理想的情况;

  2. 如果其中一个人选择Split, 另一个人选择Steal,那么选择了Steal的“坏人”可以拿走全部的奖金,而选Split的“好人”则一分也拿不到;

  3. 如果两个人都选择了Steal,那么两个“坏人”同时分文不得。

 

在做出选择前,两个选手可以互相商量。于是在这个节目里,就经常出现这样的情况:其中一个人极力保证自己一定会选择Split,让对方也选择Split,这样两个人可以平分奖金,但最后他选的却是Steal,坏人伪装成好人,偷袭成功拿走全部奖金。

 


另一种常见的情况是,两个人都说好了选Split,然后两个人都反悔选了Steal,结果两个人都拿不到钱 —— 选手往往会被复杂的人性和游戏的规则所玩弄。但在其中一期节目里,一个选手却成功地玩弄了这个规则。

 

这期节目的最后两名选手,分别是尼克和易卜拉欣。易卜拉欣对尼克表示,自己一定会选择Split,请尼克也选择Split,这样两个人可以平分奖金。为了让尼克相信他,易卜拉欣还说了一个父亲教育自己要为人诚实、信守承诺的故事。

 

没想到,尼克却态度强硬地向易卜拉欣表示,自己一定会选Steal,但他同时表示,只要易卜拉欣选择Split,他会在节目结束后把拿到的奖金和对方平分。

 


这是此前节目从来没有出现过的情况,现场的观众和主持人都不敢相信尼克会公然做出这样的“坏人”姿态,易卜拉欣更是气得直骂人。所以,在尼克一定选择Steal的困境下,易卜拉欣面临的选择是:选择Steal,两个人都拿不到钱;选择Split,那么尼克拿到所有的钱,节目结束后可能如尼克所承诺的那样:两人平分。但谁也无法担保尼克是否会信守承诺。


显然,在尼克如此强硬的情况下,对于易卜拉欣,唯一的理性选择就是Split,而指望尼克能如约事后分钱。

 

结果产生了,尼克对着镜头展示了自己的选择:也是Split,而不是像他之前表示一定会选的Steal。就这样,两人皆大欢喜,平分了奖金。

 

但这个故事最精彩的部分是在节目之后:媒体调查了易卜拉欣,结果发现他从来没有见过自己的父亲,他从小是被母亲养大的。他讲的那个关于父亲教他如何做人的故事是他从一部电影里看来的情节,纯粹是欺骗尼克的借口。而他本来要选的是Steal,这样要么两个人都拿不到钱,要么他一个人拿走所有的钱。

 

而棋高一筹的尼克设计的策略,则成功地摆脱了这种状况,让易卜拉欣没法使坏,也戏弄了游戏规则。在超高的智慧和勇气的指引下,将一场很可能双输的游戏,变成了一场“正和博弈”。

 

// 做大“世界的蛋糕” //

 

所有的婚姻,乃至所有的合作关系,都可能是一场“囚徒困境”:如果我付出所有,全心信赖对方,那么我们可能获得一场百分百完美关系;但这样做,一旦失败,一旦对方“使坏”,就会一败涂地,获得最大的伤害。所以,双方往往可能选择有所保留,这样虽然不会获得最完美的结果,但也避免了最坏的可能。


我们身处的这个世界,正是这样一个复杂了千百倍的巨大困境:两个人之间的“有效沟通”尚且如此之难,彼此小心防备,更何况一个几十亿人,上百个国家参与的多方博弈。在《贫困 — 性格缺陷,还是就是差钱?》一文中,我曾经提到这样一个事实:数据表明,这个世界的总财富其实早就可以满足所有人的基本生活,保证所有人的温饱与衣食无忧,也就是让所有人摆脱极端贫困。然而,对于这样一个超大型的“合作型博弈”,其关键是“如何”分配利益。我们对此,并不乐观。


所幸,我们今天的世界,因为“创新”的不断产生与发挥效力,“蛋糕”正在不断变大,今天一个富人所捐赠的事业,无论是扶贫,还是聚焦于全球健康,他可能就是在造福所有人,包括他自己:




是的,所有的人同时拥有更多,这是可能的;而越多的人与你想要的东西一致,你就越有可能得到它 —— 只是“正和博弈”变得可能的时间,相较于人类漫长的争斗史还太短,所以这个概念可能违反我们的直觉,需要我们主动提升认知。


此外,正如上文提及:即使每个人都是理性的,得到的结果未必就是最理性的。解决方案是:找到一个策略的均衡,让大家都有所获,而不是以为建立一个公平的机制就能自动最大化所有人的利益(市场经济的局限性)。在位置博弈中寻求最合理的解,寻求最优的“纳什均衡”—— “正和博弈”。



为此,我们第一是需要实现尽可能的有效沟通(尽管彻底实现全世界的有效沟通几乎是个不可能完成的任务)。第二,不断创新,做大“世界的蛋糕” —— 因为这个世界,早已不是你多一块,我就必然少一块,固定尺寸的小蛋糕。




编辑:榕  |  作者、审阅:江洋




小编有话说

2017年,你为世界在变好做了哪些努力?或者在2018年,你打算做些什么?

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多