分享

什么才是长期合作博弈的最佳策略

 思明居士 2022-01-27
文章图片1

很多人都听说过“囚徒博弈”,博弈双方都朝着对自己最有利的方向进行理性决策,最终却无可奈何地得出“双输”的结果。

但现实并不是只博弈一次的一锤子买卖,参与博弈的对象往往也远多于两个。那么,在长期的、多次的、多人参加的博弈中,什么才是最佳策略呢?

1980年代,密歇根大学的社会学家/政治学家罗伯特·阿克塞尔罗德(Robert Axelord)组织了一个博弈竞赛,内容就是囚徒困境,所有参与者(不同策略)两两博弈,看最终谁的收益最大。

可以预想,参与者设计了各种各样复杂的博弈策略,但最终胜出的却是一个非常简单的策略,英文叫“Tit for Tat”,一般翻译作“以牙还牙”,更确切的含义可能是“针锋相对”。

这个策略其实就两条:

1、首先(第一轮)选择合作;

2、复制上一轮对手的选择。

上一轮对手选择合作,我就选择合作;上一轮对手背叛,我就选择背叛。

这不就是中国古话说的,“人不犯我,我不犯人;人若犯我,我必犯人”?

没想到这样一个简单的策略竟取得了最好成绩。阿克塞尔罗德也不太敢相信,又组织了第二次比赛,更多博弈论专家、计算机专家、心理学家参与进来,出现了更复杂的算法,结果胜出的还是这个“以牙还牙”。

那么“以牙还牙”策略有什么特点呢?

1、友善:“以牙还牙”首先选择合作,不主动背叛;

2、报复:遭到背叛,就一定还击;

3、宽恕:对方再次合作,就既往不咎;

4、不嫉妒:每一轮最好的结果只是和对方打平。

“以牙还牙”策略顾及的是大局,集体利益为上,长期利益为上。结果在复杂的多次多人重复博弈中,反而老实人获得了最终的胜利。

于是上述四个特点似乎也可以成为我们为人处世的参考。其中两条根本就是孔老夫子所说的“以直报怨,以德报德”嘛。

后来阿克塞尔罗德就写了本书,叫《合作的进化》,已经是名著了。我还没读过,但是看豆瓣评分挺高。

不过且慢,“以牙还牙”实际上是一个很脆弱的策略。在计算机模拟中,这个策略很有效,但在现实中则未必,因为现实容易出差错。

设想下,如果某一轮,对手不小心操作失误,或者像现实中经常会遇到的可能是“无心之过”,结果你选择了“以牙还牙”。那,既然大家都知道“以牙还牙”是个好策略,对方继续“以牙还牙”。结果呢,就是陷入无限的报复……

明明只是选择了“以直报怨”,却因为现实中的差错或误解,导致了“冤冤相报何时了”。

所以博弈论专家们发明了一个在现实中更“宽容”一些的策略,可以称作“以牙还牙(改进版)”或者“宽容以牙还牙”,英文是'Tit for tat with forgiveness' 。在这个策略里头,对方背叛一次,我继续合作;只有当对方连续背叛两次,我再报复。

假如人人都宽容一些,也许才更有利于全社会利益的最大化。

不过,直到前阵子,我才听说关于这个问题,最佳策略又易主了。

哈佛大学教授马丁·诺瓦克(Martin A. Nowak)在经过无数次计算机模拟后,发现了一个更优的策略,叫做“Win-stay, lose-shift”,意思是赢就继续输了就变,也有翻译作“赢定输移”。

诺瓦克也写了本书,叫《超级合作者》,我还没空看。

“赢定输移”策略比“以牙还牙”策略胜在哪里呢?

第一,它比“以牙还牙”更冷酷。遇到好骗的,它就骗;只要能骗,就一直骗下去。

第二,它对认知能力的要求更低。不需要观察对手什么策略,只要看自己的得失,赚了就继续,亏了就换招。

这个策略,击败了“以牙还牙”和“宽容以牙还牙”。而且,它竟然更简洁。我们不由得怀疑它是不是已经很接近最终“真理”了。

但是所有思想实验都是有边界条件的,它们都能给我们启发,但都不会是复杂世界的简单真理。

“赢定输移”这个策略其实也有瑕疵,就是它假定的是博弈双方同时出招。但是,各位,我们现实中的博弈,哪有什么同时出招,都是有先后的(不过很多场合可简化视作同时出招)。

科学家们通过大量的实验发现,在“同步型”的囚徒困境博弈中,“赢定输移”是最优策略;然而在“交替型”囚徒困境博弈中,“宽容以牙还牙”反而更胜一筹。大概,是因为“宽容以牙还牙”更鼓励合作,也更注重集体利益吧。

复杂的世界,既不会是纯粹的“同步型”,也不会是纯粹的“交替型”,甚至可能都不会是囚徒困境博弈。但话虽如此,这些有趣的思想实验对我们的决策模式还是有很大参考价值。

无论是“赢定输移”策略,或者“宽容以牙还牙”策略,它们都有很重要的一点,就是——重视反馈。归纳法诚然有遇到许多谬误,但从实践的结果中不断地去学习和调整,恐怕是我们不完美的人类所能做出的最佳选择。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多