分享

幸存者偏差

 aa11xx22 2020-11-14

幸存者偏差 免费编辑 添加义项名

B 添加义项
?
义项指多义词的不同概念,如李娜的义项:网球运动员、歌手等;非诚勿扰的义项:冯小刚执导电影、江苏卫视交友节目等。 查看详细规范>>
所属类别 :
心理学

幸存者偏差(Survivor bias),另译为 "生存者偏差" 或 "存活者偏差",是一种常见的逻辑谬误。指的是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。日常表达为 "沉默的数据"、"死人不会说话" 等。可以用对照试验和贝叶斯公式来消除幸存者偏差。

基本信息

  • 中文名称

    幸存者偏差

  • 外文名称

    Survivor bias

  • 含义

    只考察幸存者特征造成的偏差

  • 解决办法

    对照实验、贝叶斯公式等

折叠 编辑本段 简介

幸存者偏差意思是指,当取得资讯的渠道,仅来自于幸存者时(因为死人不会说话),此资讯可能会存在与实际情况不同的偏差。此规律也适用于金融和商业领域。存活下来的企业往往被视为 "传奇",它们的做法被争相效仿。而其实有些也许只是因为偶然原因幸存下来了而已。

在日常生活中,最明显的例子就是 "我亲戚吃这个药好了" 或者 "我一个朋友去找了这个医生" 等等。不管你的亲戚和朋友和你关系如何好,如何值得信任和尊重,在客观规律面前他们都是等同的。疾病和医药不会因为你的喜好而照顾或者偏袒你的亲朋。所谓 "兼听则明" 也是这个道理,抛掉对个案的迷信,全面系统的了解才能克服这个偏差。

折叠 编辑本段 解决办法

折叠 贝叶斯公式

二战期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。然而统计学家亚伯拉罕·瓦尔德(Abraham Wald)力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航,而这部分数据被忽略了。事实证明,瓦尔德是正确的。

我们可以用贝叶斯公式来分析一下瓦尔德和众人的分歧出在什么地方,而谁的假设更为合理。设 X = 飞机的击中部位,Y = 1, 0 表示飞机是否返航。设空战中飞机的击中部位 X 的分布为 P(X),而返航飞机的 X 分布为条件分布 P(X|Y=1)。于是有

众人认为幸存飞机的击中部位分布 P(X|Y=1) 反映了空战中击中部位的分布 P(X),因此哪里弹痕多就要在哪里加强防护。但瓦尔德认为炮弹不长眼睛,空战中的 P(X) 应该是接近于均匀分布的。因此 P(X|Y=1) 恰恰是正比于 P(Y=1|X),即击中该部位 X 以后的返航概率。所以幸存飞机哪里中弹多,表明相应部位不是要害部位,而应该在返航概率 P(Y=1|X) 较小,亦即 P(X|Y=1) 较小的地方加强防护--正是幸存飞机中弹痕少的部位。

以上的贝叶斯公式还可以纠正一些 "成功学" 谬误。例如 Y = 1 代表成功者,往往受媒体关注多,而公众可能缺少 Y = 0 的数据。成功学常常寻找成功者具有的某些共同特征 X,得出 P(X|Y=1) 较大。比如牛顿被苹果砸中,比尔盖茨辍学了等等。但是普通人具有特征 X 的概率 P(X) 可能也不小。二者的比值 P(X|Y=1) / P(X) 才等于具有了特征 X 以后,成功的概率能提高多少倍。又例如用 Y = 1 代表得一种病,比如肺癌。而 X 代表该病的某种诱因,比如吸烟。那么根据贝叶斯公式,只要在肺癌患者中统计一下吸烟者的比例 P(X|Y=1),和普通人中的吸烟者比例 P(X) 比较一下,就能知道吸烟增加患肺癌风险的倍数。

折叠 对照实验

另一种避免幸存者偏差的办法是同时考察 Y = 1 和 Y = 0 的数据,采用对照实验的方法,比较实验组分布 P(X|Y=1) 和对照组分布 P(X|Y=0) 之间有没有显著性差异。通常采用双盲试验的方法进行研究,消除诸如安慰剂效应、混淆变量等干扰因素,详细、全面、客观地记录数据。分析数据时,采用统计学中的假设检验方法,在一定的显著性水平下确立 X 和 Y 的关系。如果只有实验组而没有对照组,得出的结论就可能带有 "幸存者偏差"。对照实验与统计学假设检验相结合的研究方法已经成为生物学、医学、心理学、社会学等诸多学科的研究范式。

折叠 编辑本段 生活中的例子

折叠 袜子总会丢一只

因为两只袜子都丢了就不容易发现袜子丢了,所以往往注意到袜子丢了的时候都是只丢了一只袜子。

折叠 读书无用论

如今很多人在说,谁谁谁当初没好好上学如今照样挣大钱,而好多用功读书的人,毕业后反而不如那些没好好学习的人混得好。并且因为这样的例子有很多,所以很多人得出"上学没有用处","读书无用"的结论。

这些其实只是个例,因为基数太大,所以看起来有很多。2010年第六次全国人口普查的官方口径,可以算出来大专以上文化程度的人口仅占总人口的8.7%左右。可以看出学历低的人数远高于学历高的人数,所以即便低学历者成功率远低于高学历者,也照样会导致低学历者出现大批成功人士。

对于高学历者,普通人既会关注成功的人,也会关注那些没成功的人,并且高学历却落魄的人尤其受关注,容易被当做新闻报道;而对于低学历者,普通人往往只关注成功者,忽视了广大学历低又没成功的人。正是因为忽视了这些"沉默的数据",才产生"读书无用"这种错误结论。

折叠 商业与艺术对立

如今在影视、小说或ACG圈子中,很多人都持这样一种观点:冷门作品佳作多,好看,艺术高。热门作品商业化,不好看,艺术低(或没艺术),商业与艺术是对立的。

先不说艺术是否有高下之分,这里先假设有吧。其实这种人犯了一个错误,他们关注的冷门作品,通常只是大家口口相传的少数优秀冷门作品,忽视了广大不知名的冷门作品,而那些优秀冷门作品基本是在广大冷门作品中筛选出来的。热门作品则不同,不管好不好看,都会受到广泛关注。

以电影为例,根据IMDB数据库统计,如今的电影已经大约有40万部(feature,不包括短片,纪录片等),并且如今每年都有将近一万部电影上映。在这几十万部电影中,票房高的只是一小部分。也就是说,很多人在拿这一小部分热门电影和一大部分冷门电影比艺术,并且还不是比平均值,而是比数量。

再或者虽然是比平均值,但比较的是热门作品与大家口口相传的优秀冷门作品,这些口碑好的冷门作品其实只是广大冷门作品中很小的一部分(也不太可能有人把将近40万部电影全看过),至于那些口碑不好的冷门作品,因为自己没听说过也没看过就这么被筛选掉了,拿来比平均必然热门吃亏。由此得出冷门作品艺术高的结论明显是不科学的,就好比"读书无用论"一样。

认为"商业与艺术对立"的人大都以为观众傻,容易盲从。其实观众并不是傻子,最起码跟忽视"幸存者偏差"得出谬误的人水平差不多。热门作品通常会有其亮点,比如有的故事好看,有的各种大场面看得很爽,有的有明星或者名导,有的宣传好等等。电影播出之后也会有观众(或者明星、网红)免费作宣传:"XXX好看,大家快去看","XXX不好看,大家别看(或谨慎观看)"。观众口碑也会对销量产生影响,在官方宣传等因素差不多的情况下,其实热门电影的水平要高于冷门。即是说,商业和艺术不仅不对立,还呈正相关关系

举个例子,电影《教父》票房大约2.5亿美元,有人可能会说这票房不算高,XXX不好看也排在他前面,可是排在《教父》后面的电影有几十万部,教父已经是票房中的佼佼者了,票房比《教父》低还不好看的电影更多。并且《教父》还是1972年票房冠军,在考虑通货膨胀的排名中排第23位。如果商业和艺术是对立,那么《教父》岂不是1972年最差电影了?

为什么热门中不少烂片呢?因为每年有近万电影上映,也就是说:不是热门作品艺术低,而是艺术低的作品中总能出现几个热门的。

这些艺术性低却热门的作品被人不断拿出来黑热门,而那些广大艺术性低又冷门的"沉默数据"则被忽视了,导致很多人产生"商业和艺术对立"的错误观点。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多