分享

善意无关道德, 贪婪没有好处

 柳家李红 2020-05-29

我很早就明白几件事,1应该对世界施以善意,就算确实存在不怀好意的人;2自己要交付确定性,要靠谱,通常好的战略都是阳谋,不怕别人知道,甚至希望大家都知道;3永远不要试探人性。 我只是模模糊糊知道这么做对自己有好处,就算精致利己,毫无善心,为了自己能过得更好,我们也应该释放最大的善意。这本书(《合作的进化》)剖析了其中的道理,面对任何人都选择善意合作,当遭遇背叛时就跟他斗到底,对方一旦悔改,就原谅他继续合作,这就是最好的策略。

书中有一个游戏贯穿始终,“囚徒困境”你和作案伙伴被逮住了,你要选择揭发伙伴或者死守秘密。这是个游戏,假设你们都死守秘密,双方各加三分,而互相背叛则各得一分,如果你揭发对方,但他为你死守秘密,你得5分,他得0分

点击加载图片

当规则稍微变化,这个游戏可以和很多对手重复玩,并且你可以记住对手和他之前的选择,就变得有意思起来,怎样策略会得到最高的分数? 总是背叛、背叛合作交替、完全随机、合作开始,一旦遭到背叛就一直选择背叛?

第一次合作,然后复读对方的选择,这样的一报还一报的策略从中脱颖而出,书中写了两次计算机策略竞赛,第一次有8个策略参赛。一报还一报得到了最高的分数,而第二次竞赛,大家在知道一报还一报的优势后提交策略,一报还一报在总共63个策略的比赛中得到了最高分数。

我们发现这个策略能赢下两轮比赛,并不是靠诡计,想方设法背叛,赢得比对手更高的分数,仔细思考,一报还一报策略根本没法得到比对手更高的分数,如果对方愿意一直合作,就可以一直合作下去,得到相等的分数,而反之总是首先遭到背叛,然后就一直会比对手分数少一点点。他从没胜过对手,他的胜利依靠引导对方的合作。并且可以和另一个愿意合作的策略相处的很好。而不愿意合作的策略之间常常会互相背叛,他们之间相处的不好。如果我们说一个首先合作的策略是善意的。释放善意,绝不首先背叛能带来好处,因为首先背叛会引来对方的报复,这是非常糟糕的局面。

一报还一报的策略非常简单,以至于其他策略会很快发现,面对一报还一报最好的策略就是一直跟他合作下去,他是可以被激怒的,也是宽容的,可以被激怒让别人占不了他太多便宜,不让那些狡猾的策略尝到甜头。宽容给了对方背叛后的机会,他接受别人的诚心道歉,在对方尝试背叛遭到报复后,没有陷入只能相互报复的局面。一报还一报的策略很容易被对方明白,而且对方什么时候明白都不晚,这是一个引导对方和他合作的阳谋。

第二轮比赛中有一个策略是一个狡猾一些的一报还一报,他十分之一的概率首先背叛对方,试探对方是不是可以被激怒,尝试占一些过于宽容策略的便宜,结果是他最终和很多策略陷入了相互背叛,在第25次选择中,他第二次无故背叛了一报还一报,连续的两个背叛让他们陷入了无止尽的背叛中。这个小聪明策略轻视了偶尔背叛的代价,一个单一的背叛会引来一长串的报复,最终陷入无止尽的相互背叛中。而试探人性会让对方认为你已经产生了怀疑,甚至恶意,你的恶意会引来对方的恶意。友谊就在怀疑中消失了。

关于一报还一报策略的优势就只讲这么多,接下来是一些注解。

我们要知道这个策略的一些局限性,它的边界在哪里?

首先,没有最好的策略,最好的策略总是根据环境变化的,比如 所有对手都是只会背叛的环境下,最好的策略只能是总是背叛,一次都不让对手占便宜。

好的策略还受到得分排序的影响,显而易见当一个背叛的诱惑超过两个合作时候,交替背叛会有更高的得分。而数值并不重要,只要四种情况的排序是上述一样,一报还一报就还是具有优势。在真正的合作中,这个收益甚至不用是对等的,这意味着你的选择不必可怜对方或者嫉妒对方,只有四种情况的排序是真正重要的。 在囚徒困境中。双方的选择没有绝对输赢,双方的利益有一部分是一致的,这不是一个零和博弈。而在零和博弈中,所有的策略都是为了胜过对方,占完所有的好处。生命有限,不要参与任何一场零和博弈。

现在讲一个之前一直忽略的问题,重复囚徒困境,到底重复多少次。 在有限次的囚徒困境中,假设5次,显然 最后一次最好选择是背叛,于是第四次的选择不影响第五次的选择,第四次的背叛不会遭到报复,所以第四次也肯定是背叛。推到第一次也就全是背叛了。所以肯定不能是有限次的,书中的假设是选择将越来越不重要,未来收益没有当下的收益更高,引入一个收益系数,每次选择都多乘以一个收益系数,假设收益系数0.9,那么第一次0.9^ 0,第二次0.9^1 第三次0.9^2.可以想象如果一直合作 可以得到30分,是有确定结果的。

而我们发现 当这个收益系数足够低的时候,未来可以忽略的时候,那些首先背叛的策略会拿到高分。所以当你希望对方是善意的时候,我们应该让对方相信未来合作的机会是重要的。书里的话更绝“合作的基础不是真正的信任,而是关系的持续性”。我们通过频繁的接触让对方相信,我们还有很大可能性会反复合作。甚至可以创造这样频繁的接触,我们把一次大的合作拆成很多次小的合作,每一次都很容易达成,并且建立信任。举例就是想结婚的人都不是上就谈结婚的。之前都要反复商量各种问题。

这个游戏能反映一些智慧,但我要说明,这是简化的,是忽略了一些问题的,1对策者没有手段可以做出承诺,没有交流的可能。也不能看见对手和其他策略的对局情况,不能建立信誉,让对方事先就相信自己的策略。最好的信誉不是一报还一报的信誉,而是恶棍的信誉,有概率选择合作,但是一旦遭到背叛就永远背叛。建立这样的信誉并不容易,他从不原谅别人。2不能放弃对局,这可能是最大的问题,现实中最后的底牌通常是说不,在交易中离场,在关系中离开,你永远有说不的权利。而假设中忽略了这一点。3对策者不必顾及他人的看法,现实中,部分合作会伤害到他人,商业勾结只对参与者有好处;贿赂枉法会让很多事情变得麻烦。偶尔人们也会反用其中的方法来阻止一些合作。4对方的上一次选择有时并不确定。现实生活中,有些情况会是一直的欺骗,但是最后才能明白对方一直在选择欺骗。传销和庞氏骗局,一些许诺带来的错误预期。

尽管如此,一报还一报在计算机竞赛中显示出的优势,还是给我很有价值的启发:

1、最大的善意

2、交付确定性以引导对方合作

3、不要耍小聪明试探人性

4、引导合作本身就是最好的策略,无关道德

*[美]罗伯特·阿克塞尔罗德《合作的进化》

点击加载图片

点击加载图片

点击加载图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多