每个个体的理性行为会导致所在群体的非理性行为吗？如果会，在实际活动或经济学中有哪些相关例子或模型？

pgl147258 2016-06-24

展开全文

【remind的回答(18票)】:

这个问题很有趣，我就不请自来了。让我先定义清楚概念，然后给出我的回答，最后给解释。

1. 定义：个体理性，集体最优，纳什均衡，集体混乱

本答案的所有定义和讨论都是在博弈论下进行的，即对于每一个要分析的情景，都由这三个要素构成：a. 行动个体, b.每个个体的可选行为的集合，和c. 每个个体的定义在所有人的选择结果上的效用函数。

定义1：个体理性 = 给定其他人的选择，个人总是能做出让自己效用最大化的行为，即不会犯错。对应地，我们把个体非理性定义为行动者有一定概率作出非效用最大化的行为，即会犯错。
定义2：集体最优 = 达到有效率的社会状态 = 不存在帕累托改进的可能 = 没有一个人可以通过不降低其他人效用的方式来提高自己的效用。
定义3：纳什均衡 = 一个相对稳定的集体状态 = 给定其他人的行为，每个人所选择的行为最大化了自己的效用。
定义4：集体混乱 = 不稳定的集体状态 = 达不到任何纳什均衡。

首先，请留意，我们并没有给出集体理性、非理性的定义，部分原因就像 @慧航的答案里说的，经济学里压根没有集体理性or非理性的概念啊亲。另一个原因是我想说明这一点：虽然个体（非）理性不能保证导致集体最优，但往往能成功避免最坏的集体混乱的情况；就算没有外部权威（如政府）的协调，社会秩序也能自发形成。

其次，我们是按照经济学的范式来定义个体理性的，即效用最大化行为。请注意这里已经把人们可能存在利他等偏好的情况也包含进来了，因为一个人的效用也可以是其他人的收益的函数。所以按此定义，存在利他等偏好并非不理性。

2. 回答

（1）几乎在任何情况（game）下，人们的行为都会收敛到一个纳什均衡（Friedman, 1953; Young,1993；Vega-Redondo, 1996）。这意味着：

a. 给定一个情景，如果该情景下的集体最优不是一个纳什均衡，那这个集体最优几乎无论如何都是达不到的，无论个体是理性还是非理性，无论有没有外部权威（政府）的协调（除非他改变了这个game）。

b. 虽然个体理性和非理性都不能保证集体最优，但往往能避免最坏的集体混乱的情况发生，即就算没有任何外部权威（如政府）的协调，社会秩序也能自发形成（Sugden, 1986）。

（2）当存在多个均衡，并且有些均衡有效率有些没有效率时，相比起所有人都百分百理性（不会犯错）而言，有时候一定程度的个体非理性（偶尔犯错）反而会达致集体最优的那个均衡，即使没有任何外部权威的协调(Young,1993, 1998)。

3. 解释

……先占个坑，有空再继续码……

References:

Friedman, M. (1953). The methodology of positive economics.

Sugden, R. (1986). The economics of rights, co-operation and welfare (Vol. 22). Oxford: Basil Blackwell.

Vega-Redondo, F. (1996). Evolution, games, and economic behaviour. Oxford University Press.

Young, H. Peyton. "The evolution of conventions." Econometrica: Journal of the Econometric Society (1993): 57-84.

Young, H. P. (2001). Individual strategy and social structure: An evolutionary theory of institutions. Princeton University Press.

【zhaowei的回答(7票)】:

从合作博弈的角度来考虑：如果把“集体理性”的各种不同的理解作为某solution concept的公理，就要对其他公理和希望有的solution concept的性质进行取舍。

比如我们可以认为对于一个合作博弈

,Shapley value是一个满足“集体理性”的solution concept，因为它要求efficiency axiom，所有参与者分配的收入总和等于他们可以达到的最大的收入总和：

。但问题是我们会问，为什么只有grand coalition才算做集体？一些参与者也许希望把其他人排除在外，组成一个“小团体”，这不也是“集体理性”的一种理解吗？一些博弈，比如没有一票否决权的选举博弈，不管怎么分配收入，总有人会想组成新的“小团体”，也就是empty core。

为此，我们可以放弃“集体理性”的假设，最终达成的分配方案的分配方案不一定要满足在Pareto surface上，也因此更没必要为empty core，或者Shapley value不在core内而困扰。这是Dubey, Neyman, and Weber(1981)的semivalue的思路。

我们也可以认为，我们模型中的参与者和我们一样明白对“集体理性”要求那么强是做不到的，所以会克制，或者限制自己为了更高的收入，不断地要求组成新的coalition的做法。毕竟，这样周而复始的改变分配方案现实中对谁都不利(情感关系中这种例子不要太多了)。我们可以把这种追求coalition的收益最大化的动机，限制在某些coalition内。比如某个集合

内的参与者的能力只能帮助到这个集合以内的人，也就是对

内的人没有外部性，我们可以要求最终的给予

的分配的收入总和应该至少等于

。也就是只要求

这样的集体具有“集体理性”。而这就是Kalai and Samet(1987)的 weighted Shapley value的刻画条件之一。

【MORISEFENG的回答(23票)】:

以上是经典的MWG对理性偏好的定义。以上是经典的MWG对理性偏好的定义。

我们按照这个定义来讲。很容易构建一个个体的理性但群体非理性的行为。

例如共有3个人（1、2、3）和3个商品（a、b、c）。（下边用>来表示偏好关系）

1：a>b；b>c；a>c

2：b>c；c>a；b>a

3：c>a；a>b；c>b

可以发现这三个人都满足完备性和传递性。因为他们每个人都对abc做出了偏好的判断，且判断满足传递性。

那么理性的个体所导出的群体偏好也满足这两条吗？问题在于如何通过个体导出“社会”的偏好。一个最简单的方式是民主，也就是按照多数人的偏好来决定社会偏好。

那么

对于a和b，由于1和3都认为a>b，所以社会也会认为a>b

对于b和c，由于1和2都认为b>c，所以社会也会认为b>c

对于c和a，由于2和3都认为c>a，所以社会也会认为c>a

这里的社会偏好仍然满足完备性。但是不满足传递性，因为根据传递性，a>b和b>c意味着a>c，然而社会偏好则认为c>a。

所以这里通过民主达到的社会偏好就不是理性的。

【吴致霆的回答(13票)】:

那么反问题主，如何定义「群体非理性」呢？

比如 @Ivony提到的囚徒困境，为什么囚徒困境是群体非理性呢？因为没有达到最优的结果么？

如果定义「群体的行为没有达到最优结果就是群体非理性」，那么仔细想一想，从委托代理问题到公共物品问题，到外部性问题，都是群体非理性？如果是这样，同样由于信息不对称带来的信贷周期算不算群体非理性？

个人的rationality是有定义的，我们可以很容易的进行讨论。但是群体非理性？定义是啥？

至少我没看过类似的文献定义了群体的理性。只能求大神科普文献了

【黄若林的回答(22票)】:

当然会，

最典型的不就是囚徒困境么？

【活屠匪的回答(4票)】:

团购啊，以饭店为例说明。

现在饭店的效益普遍不好，至少媒体是这么说，并且归因于反腐倡廉，这可真会给自己脸上贴金。其实根本原因是团购的大发展，导致菜品质量和价格透明度提高，利润率自然大跳水。

刚开始一些新开张的，还有一些位置不太好上座率不高的饭店被团购网轻松攻陷，毕竟房租水电和服务员薪水这些（固定成本）无论客人多少都不能拖欠的，上团购网打些折扣薄利多销（摊薄固定成本）是有赚头的。

但是当原本生意兴隆的饭店被团购网上的同行抢光了客人，不得不加入团购网之后情况就比较有戏剧性了，这就像剧场里有人踮起脚尖，那他身后的人只能跟随，最后所有人都踮起脚尖，该看不到的还是看不到，但每个人却都比原来更累。

【夏川至的回答(4票)】:

这不是索罗斯的反身性理论吗。

其实这个问题取决于信息。

囚徒困境为什么是困境？因为他们不能互相交流。

泡沫为什么能疯狂膨胀起来？人们都不觉得自己是最后一棒。

像柠檬市场，二手车市场，也是因为人们难以对商品的真实情况有所了解。

总结一下，这类问题的本质不是每个个体的不理性导致群体非理性，而是在不充分的信息下做出的理性行为，不见得是理性的。

【哒哒哒的回答(4票)】:

Information Cascade (信息小瀑布？)：一群人依次独立地获取信息，每个人根据前人的行为和自己的信息做出理性决定，结果可能所有人的行为都不是最优的。

举个栗子，一个箱子里装了很多红栗子和黑栗子，我们需要判断出红栗子多还是黑栗子多。如果我自己一个人不停地抓栗子，那么抓的个数越多，抓出红（黑）栗子的比例越接近箱子里红（黑）栗子的比例，我就能越来越准确地判断出红栗子多还是黑栗子多。

但是当一群人依次摸栗子……

第一个人摸了个红的，他说：“我猜红的多！” 很科学。

第二个人又摸了个红的，他想：“第一个人猜红的，那他肯定摸了红的，我这又摸了红的，当然猜红的多。” 科学。

第三个人摸了黑的，他看前两个人都猜红的，心想：“第一个人肯定摸了红的，第二个人如果摸了黑的，就会选黑的（假设每个人判断红黑出现个数一样时，优先猜自己摸的颜色）。既然他也选了红的，肯定也是摸了红的。我这才一个黑的，我也猜红的！” 科学。

第四个人知道第三个人不管摸着啥都会选红的，所以第三个人的行为不能提供任何信息。于是第四个人和第三个人面对的情况一样，还是选红的。科学。

……所有人都选了红的。

事实上只要出现相邻的两个人猜了同样的颜色，后面所有人都会猜这个颜色。一点点信息就决定了所有人的行为。

这个模型可以解释各种跟风随大流的行为，而且是“理性”的。

【知之为知之的回答(1票)】:

再次po出我的答案：

本答案来自：

为什么大学上课的时候很多人不愿意坐前排？反映了什么心理？ - ruiz Posi 的回答

答案正文：

我想以一种动态的视角来回答这个问题，因为我经历过这种场景而且自己琢磨过这个问题。下面是我的一个思考。

由研一上学期马哲课座位选择行为引出的思考

一、背景

研一上学期有一门马哲课，记不清具体名字了。这种课大家都懂得，如果老师没有很强的人格魅力是不可能吸引大家去认真听课的，于是我就观察了一下一学期以来同学们上课时座位在教室位置的动态变化，做了一个小的建模，对动态行为演进过程简单的拟合。

二、现象分析：

1、现象：

教室是大的阶梯教室，大约能座200人的样子，而我们上课的人数本来也应该是这个数，但是由于逃课现象太猖獗，真正去上课的不到100人，顶多有50—60人，所以教室是坐不满的。那么学期一开始人比较多，大家也都会往前座，但是随着时间的推移，整体就开始逐渐往后移动，最后全部都聚集到最后几排。

中间老师也警告大家不要往后坐，并且又一次特别生气，强制大家全都挪到前几排，但是随着时间的推移，大家的位置还是逐渐的向后排移动了。

2、分析：

根据自身体会以及同学们的交流，感觉同学们不是不喜欢坐前面，而是不喜欢坐在别人前面。换句话说，坐在教室前面可以，但是希望前面有人坐着，这样比较有安全感。或者是这样一种心理，不喜欢不合群，也就是大家都坐在后面的时候不想自己太突兀的坐在前面。

我想到本科学的谢识羽的《经济博弈论》中的一个模型：大规模有限理性群体复制动态博弈。于是尝试构建这样的模型来拟合这种行为。

三、理论模型

简单介绍一下这个模型，大规模有限理性群体复制动态博弈。

1、大规模：就是说博弈参与者是处于一个较大的群体之中的，而且个体的效用与总体状态有关。

2、随机配对：个体在一个群体中，与多个个体进行博弈，博弈对象的挑选是随机配对的，这一点是将宏观群体现象落实到微观决策行为的关键。

3、有限理性：参与者是有限理性的，不能再一次博弈中就达到最优状态，所以参与者会随着博弈结果不断调整自己的行为，或者这是一种学习过程。

4、复制：也就是参与者的动态学习、调整个人行为的过程。

5、动态博弈：是一个多阶段博弈，但是这个阶段并非是离散阶段，是连续的。

四、假设与模型构建

1、个体随机配对博弈的收益矩阵：

我们做这样的假设，群体中的两个博弈参与者是这样的：

（首先说明，下面说的两人的决策——坐前面或者坐后面并不是说教室中某些具体的位置，而是以一个相对宏观的视角来看，实在教室的偏前还是偏后）

（1）如果两个人都坐在前面，则两个人收益都是0.5，因为这样相对安全而且老师不会生气，而且可以多多少少听进去老师说的东西（假设有点用）；

（2）如果两个人一个在前面一个在后面，那么在前面的收益是0，在后面的收益是1，因为这样在前面的参与者感觉没有安全感，受到约束过多，而在后面的参与者心理上有安全感，进可攻（听课）退可守（玩手机）。

（3）如果两个人都坐在后面，则收益均为0，这是因为都在后面的话，参与者会担心会引起老师的反感甚至生气，老师会挑后排的同学站起来回答问题。

那么收益矩阵是这样的：

在静态博弈中最终的均衡是一前一后，也即（前，后）或（后，前），然而在动态过程中却是另一种考量。

2、期望收益的计算：

假设群体中某一时间选择策略：坐在后面的比例为x（x在0到100%之间），那么选择策略：坐在前面的比例为1-x；

（1）选择策略坐在前面的参与者的期望收益：

UF=0.5*(1-x)+0*x=0.5*(1-x)。

基于大群体内随机配对的假定，因为他有1-x的概率会碰到选择坐前面的博弈对手，这样他的收益为0.5；有x的概率碰到选择坐后面的博弈对手，这样他的收益为0。所以期望收益为UF=0.5*(1-x)+0*x。

（2）选择策略坐在后面的参与者的期望收益：

UB=1*(1-x)+0*x=1-x。

因为他有1-x的概率会碰到选择坐前面的博弈对手，这样他的收益为1；有x的概率碰到选择坐后面的博弈对手，这样他的收益为0。

（3）整个群体平均期望收益：

Uav=x* UB+(1-x)* UF=0.5*(1-x^2)

（4）选择坐在后面参与者的期望收益超过群体平均期望收益的幅度：

UB-Uav=1-x-0.5*(1-x^2)=0.5*(1-x)^2

3、动态微分方程

我们再来考察选择策略坐后面的参与者占比（x）随时间的动态变化，也就是:

我们根据此模型的理论，它与两个因素相关：

（1）与坐在后面的人所占比例x正相关。因为坐在后面的人占比越高，选择坐后面的人增加的速度越快；

（2）与选择坐在后面参与者的期望收益超过群体平均期望收益的幅度（UB-Uav）正相关。因为选择坐后面比平均水平获得收益越多，那么选择坐后面就越有吸引力，选择坐后面占比增加的越快。

那么我们令：

=x*( UB-Uav)=0.5*x*(1-x)^2

画出图像：

注：图中那条直线是做的0点处的切线。

4、均衡分析

根据上图，

有两个点同x轴相交，也就是说与x轴交点处，x不再随着时间变化，也即达到均衡。所以此过程有两个均衡点，也就是0和1然而只有一个——1处是稳定的。

（1）x=1处是一个稳定均衡点，因为即使有随机扰动使得x偏离了1，也即比1小一点点，那么

就会大于0，也就是说x会随着时间的推移增加，最后还是会回到1点。这一点就叫进化稳定策略（evolutionarily stable strategy，ESS）。

（2）x=0处是一个不稳定的均衡点。图中的直线是0处的切线，我们知道动态微分方程中一点斜率只有为负才算稳定的均衡点，0点处切线斜率为正，显然不是稳定的均衡。它的不稳定体现在，一旦有随机扰动偏离0点，那么

就会大于0，也就是说x会随着时间的推移增加，逐渐向1点靠近，最后还是在1点达到稳定均衡。

五、结论

所以根据以上分析，最后的结果是x=1是稳定均衡，也就是大家全都选择策略坐在后面，这就在一定程度上解释了教室里所发生的现象。而当老师强制大家坐在前面时，也许当时大家都过去了，到了下次上课，由于有些胆子大的“随机扰动项”尝试向后坐，导致群体偏离不稳定均衡0点，而后又发生了逐渐向后移的过程。

六、其他副产品

下面说三个在主体模型之外的我想到的一些现象：

1、谢林分隔模型（Schelling Segregation Model）。这种分隔现象也在教师中有所体现。大家基本是男生跟女生是扎堆坐的，也就是性别相同的坐在一起，而不是混着坐，即使混着坐集体的效用更高。

2、信息瀑流（Information Cascade）。从社会网络分析中学的一个术语。后面的人的行为并非出于自身效用最大化而是根据前面人的行为进行自己的决策。其实这只是一种微观视角，其实本质上还是在我上面的大规模有限理性群体复制动态博弈的参与者的一种决策形式。

3、信息在群体中的传播（dissemination of information）。曾经上课有这么一个小插曲，又一次我跟同学F去上课，当时大家的位置已经处于最后几排的位置，但是当我们去的时候大家都集中在除了最后一排的最后几排，也就是说最后一排除了我俩还有个别同学，于是我俩在那嘀咕：会不会是老师说这节课要专门提问最后一排的同学啊。结果我俩就往前挪了，结果最后一排的同学看我们走了，也往前挪了，虽然后面有同学陆续进教室，但是都不敢坐最后一排，因为不知听谁说老师这节课让最后一排的回答问题。这就涉及群体传播学和心理学的一些问题，我暂时不太明白，希望有感兴趣的一起探讨。

七、思考

也许大家认为这是发生在教室里的小屁孩那点破事不值得这么复杂的分析。其实这只是现实世界人类群体行为的一个缩影。个体的看似理性选择，最终却导致群体非理性的结果。这样的例子还用我来一一列举吗？

【阿昕学长的回答(1票)】:

如果我们都是纯理性人，那么人类早灭亡了，我们歌颂英雄，崇拜荣誉，本身就是在激励那些有利于整体而对个体非理性的行为。