分享

数据里的奥秘

 啸海楼 2014-01-14

数据里的奥秘

—— 三个英国人与一段统计史

西闪 昨天 10:03

谷歌首席经济学家范里安(Hal R.Varian)说:“未来十年最性感的职业是统计学家。”这是一个非常保守的预言——要知道,没有统计学,就根本不会有像谷歌那样强大的搜索引擎(search engine)。相形之下,反乌托邦小说的鼻祖威尔斯(Herbert G.Wells)在1903年所做的预言又显得过于乐观了。他说:“在未来社会中,统计学思维将像阅读一样,成为人类必不可少的能力。”100多年过去,他所设想的前景尚未出现。

在我看来,现实卡在保守与激进之间。统计学的力量基本上仍由统治者所垄断,而统计学的思维掌握在权力精英和知识精英的手里,留给被统治者的则是统计学投下的巨大阴影,掺和着各种意识形态的杂质。

要想了解现实何以如此,我们必须回到威尔斯作出预言的那个时代去瞧一瞧。

如果说17世纪的统计学仅是一门政治算术,那么随着国家权力的日益壮大,18世纪的统计学已经兼具社会算术的特征。到了19世纪中后期,直至20世纪初,统计学以水银泻地之势,将计算的观念全面带入公众思维。奠基体质人类学的卡罗尔(Carolus Linnaeus)、提出天生犯罪人论的龙勃罗梭(Cesare Lombroso),他们虽是那一时期的杰出代表,尚不算决定意义的人物。真正厉害的角色是三个有着密切关联的英国人,他们分别是高尔顿(Francis Galton)、皮尔逊(Karl Pearson)以及费希尔(Ronald A.Fisher)。这三人共创了一门名叫“生物统计学”的学问,把统计学灌注到医学、公共卫生、农学、生态学、遗传学、犯罪学等领域,而这些研究领域,恰好涵盖着人类生活最基本的部分。

素有“测量狂人”之称的高尔顿是达尔文的表弟。他对待人类学的态度远比卡罗尔严谨,他研究犯罪学的思路在当时比龙勃罗梭更新潮。1877年,他发明了“图像统计学”,利用当时的照相技术,按照谋杀、欺诈和性犯罪的三分法,对大量的罪犯照片进行统计学分析,以期找出罪犯天生的面部类型。这套活泼的统计学方法帮助龙勃罗梭在今天享有“现代犯罪学之父”的声誉。

当高尔顿意识到纯粹的定量分析难以操作时,他又发明了一种计算“图像平均值”的方法:将同类罪犯的照片予以重叠复合,找出他们的共同点和差异度(variablility)。不到两年时间,他的这套方法就推广到了结核病人、男女性别比较、家族成员识别等多种对象上,得出了不少新颖的结论。他甚至将马其顿国王亚历山大与埃及女王克娄巴特拉的肖像进行复合,从中寻找人类审美心理上的共通点。

精力过人的高尔顿成立了生物统计实验室,还创建了生物统计基金会。基金会的主要职责之一,就是给1901年创刊的学术期刊Biometrika(《生物统计》)提供资金。在他的学生皮尔逊的主持下,这本刊物把统计学的影响带往世界各地,真可谓无远弗届。直到今天,这本刊物仍然代表着当代统计学的最高水平。

当时的Biometrika不仅探讨统计学最前沿的理论和实验,还在西方各国广泛吸纳义务的统计员。这些统计员或深入非洲腹地测量土著的胫骨,或钻进美洲雨林测量石鸡的冠羽,或偷掘古墓,给死人的头骨灌铅,测量脑容量。凭着一股对统计学的热忱,当时维也纳的一个年轻女子,就敢于单枪匹马闯荡阿尔巴尼亚,去测量边疆新兵的胸围。

统计学的魅力如此之大,不仅引来各地雪片般的统计数据,还为Biometrika带来十分丰厚的资金赞助。这让它成为当时最精美的出版物,全世界第一本印有全彩照片的学术期刊。例如1910年的一期,就是一个全裸的男性俾格米人(Pygmies)的彩照。此人侧卧在地,生殖器旁放着一把直尺。

大约1912年,在统计学家威廉·戈赛(William S.Gosset)的介绍下,剑桥大学的本科优等生费希尔首次在Biometrika上发表了论文。但是不久,费希尔和皮尔逊出现了观念分歧,他的名字几乎从那本刊物上消失。后来,费希尔拒绝了皮尔逊邀请,没有担任高尔顿生物统计实验室的首席统计师,而是去伦敦郊外的一个农场研究一种化肥的肥力问题。在那里,他用自创的一系列眼花缭乱的公式证明,该化肥的作用对收成的影响远不及变化的气候。今天看来,正是费希尔的这些数学公式,标志着统计学全面进入20世纪。

必须强调的是,我将高尔顿、皮尔逊和费希尔视为19世纪至20世纪初统计学发展的代表人物,并非仅仅因为他们在统计学上的贡献和影响,更不是因为他们之间明显的学术联系。我看重他们,是因为他们的学术旨趣,更易体现那一时期统计学最主要的任务——为达尔文的进化论(theory of evolution)提供辩护。

统计学与进化论的联盟关系,从统计学家交织的学术身份亦可知晓。高尔顿不必说了。皮尔逊不仅是生物统计实验室的主任,也是伦敦大学优生学系的主任。费希尔呢,他后来做了剑桥大学遗传学系的主任。如今,他被统计学家当成“一位几乎独自建立现代统计学的天才”,同时又被生物学家夸奖为“达尔文最伟大的继承者”。

就连我在文章开头提到的科幻作家威尔斯也不例外。在预言统计学远大前程的同时,他也在为进化论呼吁。他与人合写了一部名为《生命科学》的巨著,全面而通俗地阐述了达尔文主义。这真是一种奇妙的学术联系。

那么,统计学到底为进化论做了什么呢?

且容我娓娓道来。

(未完待续)

【编辑按】有关统计学的沿革与流变,西闪先生有多篇文章论述,有兴趣的读者可移步西闪先生个人主页

(责任编辑:余江波)

阅读(4.2万)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多