善意无关道德, 贪婪没有好处

柳家李红 2020-05-29

展开全文

我很早就明白几件事，1应该对世界施以善意，就算确实存在不怀好意的人；2自己要交付确定性，要靠谱，通常好的战略都是阳谋，不怕别人知道，甚至希望大家都知道；3永远不要试探人性。我只是模模糊糊知道这么做对自己有好处，就算精致利己，毫无善心，为了自己能过得更好，我们也应该释放最大的善意。这本书（《合作的进化》）剖析了其中的道理，面对任何人都选择善意合作，当遭遇背叛时就跟他斗到底，对方一旦悔改，就原谅他继续合作，这就是最好的策略。

书中有一个游戏贯穿始终，“囚徒困境”你和作案伙伴被逮住了，你要选择揭发伙伴或者死守秘密。这是个游戏，假设你们都死守秘密，双方各加三分，而互相背叛则各得一分，如果你揭发对方，但他为你死守秘密，你得5分，他得0分

点击加载图片

当规则稍微变化，这个游戏可以和很多对手重复玩，并且你可以记住对手和他之前的选择，就变得有意思起来，怎样策略会得到最高的分数？总是背叛、背叛合作交替、完全随机、合作开始，一旦遭到背叛就一直选择背叛？

第一次合作，然后复读对方的选择，这样的一报还一报的策略从中脱颖而出，书中写了两次计算机策略竞赛，第一次有8个策略参赛。一报还一报得到了最高的分数，而第二次竞赛，大家在知道一报还一报的优势后提交策略，一报还一报在总共63个策略的比赛中得到了最高分数。

我们发现这个策略能赢下两轮比赛，并不是靠诡计，想方设法背叛，赢得比对手更高的分数，仔细思考，一报还一报策略根本没法得到比对手更高的分数，如果对方愿意一直合作，就可以一直合作下去，得到相等的分数，而反之总是首先遭到背叛，然后就一直会比对手分数少一点点。他从没胜过对手，他的胜利依靠引导对方的合作。并且可以和另一个愿意合作的策略相处的很好。而不愿意合作的策略之间常常会互相背叛，他们之间相处的不好。如果我们说一个首先合作的策略是善意的。释放善意，绝不首先背叛能带来好处，因为首先背叛会引来对方的报复，这是非常糟糕的局面。

一报还一报的策略非常简单，以至于其他策略会很快发现，面对一报还一报最好的策略就是一直跟他合作下去，他是可以被激怒的，也是宽容的，可以被激怒让别人占不了他太多便宜，不让那些狡猾的策略尝到甜头。宽容给了对方背叛后的机会，他接受别人的诚心道歉，在对方尝试背叛遭到报复后，没有陷入只能相互报复的局面。一报还一报的策略很容易被对方明白，而且对方什么时候明白都不晚，这是一个引导对方和他合作的阳谋。

第二轮比赛中有一个策略是一个狡猾一些的一报还一报，他十分之一的概率首先背叛对方，试探对方是不是可以被激怒，尝试占一些过于宽容策略的便宜，结果是他最终和很多策略陷入了相互背叛，在第25次选择中，他第二次无故背叛了一报还一报，连续的两个背叛让他们陷入了无止尽的背叛中。这个小聪明策略轻视了偶尔背叛的代价，一个单一的背叛会引来一长串的报复，最终陷入无止尽的相互背叛中。而试探人性会让对方认为你已经产生了怀疑，甚至恶意，你的恶意会引来对方的恶意。友谊就在怀疑中消失了。

关于一报还一报策略的优势就只讲这么多，接下来是一些注解。

我们要知道这个策略的一些局限性，它的边界在哪里？

首先，没有最好的策略，最好的策略总是根据环境变化的，比如所有对手都是只会背叛的环境下，最好的策略只能是总是背叛，一次都不让对手占便宜。

好的策略还受到得分排序的影响，显而易见当一个背叛的诱惑超过两个合作时候，交替背叛会有更高的得分。而数值并不重要，只要四种情况的排序是上述一样，一报还一报就还是具有优势。在真正的合作中，这个收益甚至不用是对等的，这意味着你的选择不必可怜对方或者嫉妒对方，只有四种情况的排序是真正重要的。在囚徒困境中。双方的选择没有绝对输赢，双方的利益有一部分是一致的，这不是一个零和博弈。而在零和博弈中，所有的策略都是为了胜过对方，占完所有的好处。生命有限，不要参与任何一场零和博弈。

现在讲一个之前一直忽略的问题，重复囚徒困境，到底重复多少次。在有限次的囚徒困境中，假设5次，显然最后一次最好选择是背叛，于是第四次的选择不影响第五次的选择，第四次的背叛不会遭到报复，所以第四次也肯定是背叛。推到第一次也就全是背叛了。所以肯定不能是有限次的，书中的假设是选择将越来越不重要，未来收益没有当下的收益更高，引入一个收益系数，每次选择都多乘以一个收益系数，假设收益系数0.9，那么第一次0.9^ 0,第二次0.9^1 第三次0.9^2.可以想象如果一直合作可以得到30分，是有确定结果的。

而我们发现当这个收益系数足够低的时候，未来可以忽略的时候，那些首先背叛的策略会拿到高分。所以当你希望对方是善意的时候，我们应该让对方相信未来合作的机会是重要的。书里的话更绝“合作的基础不是真正的信任，而是关系的持续性”。我们通过频繁的接触让对方相信，我们还有很大可能性会反复合作。甚至可以创造这样频繁的接触，我们把一次大的合作拆成很多次小的合作，每一次都很容易达成，并且建立信任。举例就是想结婚的人都不是上就谈结婚的。之前都要反复商量各种问题。

这个游戏能反映一些智慧，但我要说明，这是简化的，是忽略了一些问题的，1对策者没有手段可以做出承诺，没有交流的可能。也不能看见对手和其他策略的对局情况，不能建立信誉，让对方事先就相信自己的策略。最好的信誉不是一报还一报的信誉，而是恶棍的信誉，有概率选择合作，但是一旦遭到背叛就永远背叛。建立这样的信誉并不容易，他从不原谅别人。2不能放弃对局，这可能是最大的问题，现实中最后的底牌通常是说不，在交易中离场，在关系中离开，你永远有说不的权利。而假设中忽略了这一点。3对策者不必顾及他人的看法，现实中，部分合作会伤害到他人，商业勾结只对参与者有好处；贿赂枉法会让很多事情变得麻烦。偶尔人们也会反用其中的方法来阻止一些合作。4对方的上一次选择有时并不确定。现实生活中，有些情况会是一直的欺骗，但是最后才能明白对方一直在选择欺骗。传销和庞氏骗局，一些许诺带来的错误预期。

尽管如此，一报还一报在计算机竞赛中显示出的优势，还是给我很有价值的启发：

1、最大的善意

2、交付确定性以引导对方合作

3、不要耍小聪明试探人性

4、引导合作本身就是最好的策略，无关道德

＊[美]罗伯特·阿克塞尔罗德《合作的进化》