分享

二战中的统计学故事与医学研究中的偏倚陷阱

 板桥胡同37号 2020-03-29
距离哥伦比亚大学仅一个街区,有一幢平平无奇的公寓大楼,二战期间在这里出入的人,看起来朴实而沉默,在纸醉金迷的曼哈顿中毫不起眼。

但这其实是美军一项机密计划——统计研究小组(The Statistical Research Group,SRG)的工作地点。这个小组吸纳了当时最顶级的一批统计学家,他们运用专业知识对战场数据分析支持,为各类军事问题提供决策方案。这群人中,有控制论创始人诺伯特·维纳(Norbert Wiener)、信息论创始人克劳德·艾尔伍德·香农(Claude Elwood Shannon)、决策理论和贝叶斯分析方法的先驱伦纳德·吉米·萨维奇(Leonard Jimmie Savage)、诺贝尔经济学奖得主米尔顿·弗里德曼(Milton Friedman)等。

从小就展现其数学天赋的亚伯拉罕·沃德(Abraham Wald),当时正在美国哥伦比亚大学统计学系当教授,在SRG成立早期,他就已经加入并在其中承担着核心作用。

亚伯拉罕·瓦尔德(Abraham Wald,1902-1950) 

1941年,第二次世界大战战况正酣,美军战机损失率居高不下。军方希望为这些战机加装装甲,但是装甲会使飞机变得更笨重,机动性就会减弱,还会消耗更多的燃油。好钢要用在刀刃上,如何找到战机最脆弱的地方避免防御过度,让军方备受困惑。于是他们找到了SRG,寻求提升战机生存能力的方法。

军方的要求非常直接,希望 Wald教授利用统计方面的专业知识,给出“飞机应该如何加强防护,才能降低被炮火击落的几率”的建议。

为了解决这个问题,军方带着他们认为可能有用的一些数据来到了SRG(下图1,表1)。

图1. 军方带回来安全返回的飞机受损的部分示意图

表1. Wald 教授整理的部分战机受损数据


这些数据来自于欧洲交战回来的美国战机。可以从机身上密密麻麻的弹孔看出战场的残酷和激烈程度,但这些弹孔并不是均匀地分布在飞机上的。Wald教授对美军轰炸机受损数据分析和研究后发现,机翼是整个飞机中最容易遭受攻击的位置,发动机则是最少被攻击的位置。

结果似乎很直观,军方很多人都认为,加装的装甲就应该用来保护最容易受到攻击的地方,也就是弹孔最多的地方!

但是Wald教授给出的结论却截然相反,他明确指出,“我们应该加强对发动机的保护,也就是弹孔最少的地方”。这个结论与人们的直观感受明显是相反的,但大家听完Wald 教授的解释,都恍然大悟:

  • 本次统计的样本,仅包含没有因敌火射击而坠毁并安全返航的轰炸机。

  • 假设所有中弹的弹着点会平均分布在机身各处,而能安全返航的轰炸机中弹数量较多的区域,是即使被击中也不易导致坠机的部位。

  • 机翼被击中很多次的轰炸机,大多数仍然能够安全返航。

  • 发动机弹孔较少的原因并非真的不易中弹,而是一旦中弹,其安全返航并生还的可能性就微乎其微。

军方最终采取了Wald教授提出的增加发动机防护的建议并付诸实践,在朝鲜和越南的战争的飞机,都在发动机加装了装甲。当然,后来证实该决策是完全正确的。

而这项研究在多年后被医学研究者列入设计中必须考虑的问题,称其为“幸存者偏差(survivorship bias)”。

“幸存者偏差”是选择偏差的一种,属于逻辑谬误。在医学研究中,若过度关注“幸存了某些经历”的人事物,忽略那些没有幸存的(可能因为无法观察到),就会造成错误的结论。这样的研究偏倚很常见,也是观察性研究中常会遇到的问题。

如何消除混杂因素带来的影响,使混杂因素与研究因素无关联?

作为《NEJM医学前沿》的姊妹平台,一嘉医课致力于以线上医学教育的方式提升临床医生理念技能和科研能力,近期多次和读者分享了由复旦大学公共卫生学院生物统计学教研室武振宇副教授主讲的观察性研究系列课程。

武教授从生物统计学角度,以《新英格兰医学杂志》数篇新冠疫情重磅观察性研究论文为例,分析了NEJM 这类顶级医学杂志所发表的几篇高质量观察性研究。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多