分享

公平与正义是虚构的理想,博弈和均衡才是真实的世界

 MatheMagician 2024-03-10 发布于广东


曾几何时,每个孩子心中都有一座灯塔、一盏明灯,我们一同天真地向往着美好的世界,仰望星空,自命不凡。
好景不长,总有一天,保护我们的象牙塔要被冲垮,我们赤身裸体暴露在社会洪流中,在这所大学里学习真实的规则。
恍然大悟,世界似乎和自嘲戏谑着说的草台班子并无二致,面对一个个实际问题和压力,所谓人类文明并没有想象的那般高尚,社会给出的运转法则也实在难说先进。
本文尝试以我对世界信息的感知、认知、估计和构建结果为基础,总结我世界观下的世界公理和推论。


公平与正义是虚构的理想


我们在成长中,一开始总是会沉迷于一些美而空的概念,除了公平、正义以外,还有美好,和平,善良等等。虽然在与现实的碰撞中,每个人会逐渐调整自己的认知,有的逐渐彻底放弃这些只存在于书本的图腾,有的则依旧坚持把这些作为道理律己,而有的则在不同的事情中模糊地摇摆,时而追求内心正义,时而希望自己善良,时而也会陷入矛盾混乱的自我否定。
这种人们不同的关于公平与正义理想的选择,以及同一个人时而混乱的判断,都源于一点,就是这两个词的概念,实在太过抽象。它从不曾在全世界、全国,甚至全家、夫妻俩的内心中统一过,再甚至,自己前后两件事情认为的公平选择,都可能因为没有严格地自我逻辑反思过而自相矛盾。
美国人认为的公平是每个公民都按照宪法获得选票,中国人的公平是在高考中统一考试内容和录取分数;你认为的公平是你赚钱老婆带娃,老婆认为的却是你钱不能少赚娃也不能少带。西方推行那套民主自由代表的正义,而我们却嘲笑他们天天开会也不能用集体的力量办出如此震撼的奥运会,里程这么长的高铁;你的正义是要饭的来了有社会机构救助,给钱给他可能遇到骗子,而你妈可能觉得现在给他一碗热腾腾的饺子吃,才是真的心中有爱心和正义。
以及,你可能觉得,我说的这些代表公平与正义的例子,你大部分都不同意,觉得我简直不可理喻。
你看,问题来了,都用这两个字符串来代表自己的理想,可实际上,每个人实际想的,都不相同,这种没有客观性,不能通用的概念,即伪概念是也。
这虚无的伪概念,作为聚拢一帮没打算经过逻辑思维再入脑的人的精神概念,确实好用;但作为有明确自我意识、需求目标的独立个体,实在是应该进博物馆欣赏的历史沉淀才对。
所以,这俩背后无法代表一个统一的理想,虽然一部分是相似的,但细节一定也不同,同时也可能是各种人有意无意的胸怀鬼胎。它也一定不是世界真实的目标,而是被一些人利用,而一些人被利用的工具罢了。
那什么是世界真正的运转逻辑呢?它到底存不存在?


博弈和均衡才是真实的世界


下面,我尝试用博弈论的模型来建模我们生活的世界。我私以为这是从宏观层面最适合理解社会的思维模型了,如果再多量化一点就可以成为可计算的数学模型。当然这基于我习惯和喜欢的构建,有我的偏好,你可以看看有没有道理,好不好用,来决定要不要兼收并蓄。
整个社会就是一个巨大的一盘棋(游戏),其要素是参与者(智能体)身上的策略空间,以及在所有人策略上结果的偏好或收益目标函数。每个人的目标都是自己的目标函数值最大,以此作为自己的决策准则。
简化一下可以想象成一场篮球赛、一盘吃鸡、王者荣耀、再简化一点就是一把德州、围棋,再简单点,就是石头剪刀布。
只不过,这种局部的游戏是人为构造的虚拟游戏环境下的游戏,而每天真实的生活,还要比这复杂得多,因为无论是个人的目标还是游戏规则都随时在变,以至于随时要修改决策和执行结果。
每时每刻的人类的行动可以看作是以下五项内容涉及的工作的循环:
确定目标:模糊或明确地知道自己要什么;比如,想最快速、便宜、安全地吃最好吃的东西吃饱;
收集信息:借助自身传感器或其他工具,收集相关信息;比如,家里有什么菜和烹饪条件、外卖有什么吃的价格和送货速度怎么样,楼下的馆子有没有熟悉的等等;
推断信息:对无法直接查找获取但又有用的信息,进行经验性地推测;比如:估计家里的煤气应该够今天的菜,从外卖的价格、地址等判断食品是否安全,以今天的天气和是否节假日和平日的生意判断楼下馆子要不要排队等等;
作出决策:根据目标对应的目标函数,以及收集和推断来的信息,辅助以经验,形成若干候选的可行方案,再逐个对比得出策略;比如,吃饭策略为,先看家里有没有现成的,没有就订上次订过的外卖,不考虑去楼下吃,又贵又慢;
执行决策:按照给定策略,在实际环境中执行。
注意,当你的博弈对象几乎不会因为你个体的行为而改变策略时,此时博弈问题退化为优化问题,博弈的其他智能体变为给定的环境。比如,这里你能买到的外卖和商店的价格,送货速度。服务水平等,其实是稳定的消费者整体和商家博弈得到的结果,个人你买不买,买多少,对商家整体策略没有影响,你直接享用了这个成果,好坏都是个人无法迅速改变的。因此这实际上是个优化问题了,对面策略空间为空,可以直接用剥削策略而不用考虑均衡,此时二者也是等效的。
但是,如果你是讨论和同伴一起去哪吃,吃什么,谁买单等问题,那就是真的典型的合作博弈了。所以我们要感谢为公共事业博弈的历史上帮助我们的所有人,是他们留下的遗产让我们能享用博弈下来习惯沿用的规则,包括华盛顿放弃个人权益拼命定下的三权分立、为儿童发声设定的六一儿童节的领袖、以及每一个打假、精心挑选商品倒逼商家做好品质和降价的人。
而所谓均衡策略,指的是,假定对方也无限聪明时,我们应该采取的应对下来不吃亏的策略,即也应该足够聪明。即此时只要你采取了这种策略,对方采取任何其他策略,对比也采取均衡策略,一定会自我剥削。当然,均衡策略不是自身收益最高的策略,因为大可以剥削对方漏洞来获取更多,但是如果是一项长期博弈,那随时还要提防着被反制回来。因此,从对方不蠢和长期稳定获益的角度来说,均衡无疑是最好的,别谈什么公平正义了。
不过吧,因为每个人掌握的信息和策略制定能力有限,从上帝视角来看,仅因为制定策略能力的缺失,就距离均衡好远了,所以可剥削的点一定是无处不在的。你愿意去钻研,总有零和收获,可是就看效率值不值得你去做便是了。而当规则过于复杂,门槛过高,钻研者过度利用的时候,总归就不是什么好事了。所以我也这样定义,君子就是自动追求均衡,小人则极尽剥削,傻子则是暴露出来等着小人剥削。
由此,我总结了人间三定律:
增广理性人定律:世界所有人都在其当下能力(收集、处理信息、决策)范围内选择当下内心定义目标函数下的最优选择来选择执行行为,任何内外条件的改变所导致的不同结果,都可以归结为外界环境和个人行为五元组(目标、收集、处理信息、决策、执行)的区别;
沟通定律:除直接作为目标外,人类任何形式的沟通(个人、公司、国家),本质都是在通过收集信息来寻找合作博弈双方都有利益点的机会,来可行地获得更大的自己的目标偏好的收益值;
合作结束定律:个人行为和外界环境变化导致决策五元组状态瞬息万变,合作不成是常态,破裂是必然;
其中,增广理性人定律前文说了,个人行为五元组描述了个人的博弈状态,它决定了个体将以怎样的策略执行,并在其他人组成的环境中获得结果,结果的规律符合物理规律和人性。而沟通定律说的是沟通这一收集交换信息的方式,本质没有脱离五元组的行为,当然不排除聊天本身就是目标,获得放松快乐的极少情况。而合作结束定律是说,通过非零和的博弈创造联合收益再分赃的机会确实无处不在,可是这并不是一个稳态,随着局势发展,打破合作,赢家通吃,结束合作,才是稳定的结局。
所以,所谓的要如何过好这一生,其实就非常明确和简单了,我们在增广理性人定律的规律下,不断地循环着面对着一个又一个环境下的一个又一个的博弈决策的制定和执行,人生的目标自然就是所有当下目标的总和。因此,对于这样一个序贯博弈,每一步都要考虑清楚目标中的当前收益和状态价值。并尽可能地收集和处理信息,作出能力范围内最优的决策和执行。这里的每一项都应该考虑强化学习中说的状态价值,即你掌握的规律,比如收集和处理信息的方法,决策的套路和执行的经验,可能于当次决策是无效甚至打折扣的,但是为长期目标,这都值得做。
你回想一下,当你面临过去的人生重大十字路口的时候,是不是这么做决策的:设定好目标,并收集处理信息,寻找最优解?
你看了我的拆解,想不想尝试一下,看看能否避免自己在决策中变得纠结和混乱?
这里还有一点,就是哪怕是这几项事情,因为都有时间限制或目标,比如最快或者deadline为何,于是如何分配自己的时间,看清自己的大脑状态,选择最优的任务排列给大脑,拿到最优的目标结果,也是十分重要的。想清楚怎么分分配又需要时间,又要进一步决策……在科研中,往往除了游戏本身的目标外,是不太过度考虑需要的时间精力消耗的,直到有巨大的矛盾。而真实的游戏里,我们只能给定一个经验的决策时间精力分配的时间上限,固定它,再去执行,也许上帝看来给多了给少了,可我们只能自己模糊地感知,在实践中缓慢调整罢了。更有甚者,你天生的,或者不知不觉养成的习惯,就是天然的最低成本能执行的决策的底色了。


落后的人类文明


人类文明是人类个体的总和,他们一起组合出了这个庞大的名词,但是没有谁真的一出生就为它负责。所谓人类不过是一个个自私自利的参与博弈的个体组成的,哪来的什么文明?
不过人类真的就统治地球了,你怎么一定就认为是因为人类为万物之灵,而不是其他动物都太不能打,侵略者还没找到我们?
人类文明中最大的一bug在于,我们的发展,相比较真正的集体主义的合作方式,其均衡解的效率是远远落后于帕累托有效结果的。因为每个人的均衡策略,只能让这个社会达成纳什均衡,确实每个人都没法剥削别人,但这也丧失了很多更高级别合作带来收益的可能。比如富人有100块钱花不完也要带到棺材里,而穷人只有1块钱买不起菜只能选择饿死。这就是纳什均衡的结果,明明转移一块钱财富一方几乎无损而另一方可以大大收益,但均衡解下这并不会发生。
帕累托有效中描述的能让社会总福利最大化的结局现实中根本不会发生,人类几千年来都毫无办法,到现在也只能采取一些上帝看起来可能很低级的做法。我们靠着历史上为数不多的所谓伟人、公知,推动着道德和法律的进步,留下遗产供人们享用。比如三权分立分裂个人权利,让总统并不能驾驶尸速列车,让全体民众不陷入危机之中;比如设定刑法,让渡报复的私权为公权,让冲突的终局以更高效的方式进行,并进行警示。
可是,谁又保证当时的伟人自己没有私心呢?难道寄托在他的个人理想目标刚好和全人类要的一致吗?
靠这些伟大的智者留下的为自己私心实现过程中留下的点点财富来获得人类发展,就没有更好的方式吗?
假设美国仅剩下一个黑人了,那种族歧视问题发生的时候,他还能受到原本法律规定的公正待遇吗?
法律中的种种条款,到底是全体人类一起共商发展大义,为全体人类发展作出的牺牲小我,成就大我的结果,还是各种势力各怀鬼胎,为自己的所代表的群体甚至干脆自己的私利博弈出来的结果呢?是否曾真的以哪怕虚幻的公平正义的理想作为目标呢?
之所以现在的法律看着还行,是不是因为那些异己早就消失不见,或者至少你已经难以听到他们的声音了?而你也是有代表你的利益群体的人帮你争夺到了对你的保护呢?
看起来,那些条款,只不过是为了达成各个群体自身更大的目标,所附赠的迫不得已得做的事情罢了,根本不是出自本心。
而人类的规则文明的进步,只能靠迫不得已?
各种社会制度、意识形态的打架,确实基本能决定宏观的社会发展的方向和趋势,积累千百年程现在的样子。但,它们不过也是卧龙凤雏罢了?
还是,这些本身就是足够文明的智慧,已经值得骄傲了?
比如,我们通过倡导多元的目标价值,使得大家都能更好的安居乐业,并提供更多合作博弈的可能机会,一起发展,各取所需,而不是一卷到底?
不过,可以想象的一点是,但凡,人类有蚂蚁或蜜蜂们一丢丢的合作意识,可能未来受到另一个高度发展的平行世界人类藐视的机会都能小一点。
可似乎如此合作,又不可能激励和诞生出如此伟大而有思想的个体推动人类前进,好似人类已经聪明地均衡过了?
你觉得呢?

我们是谁:

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多