分享

留学心得:数据和社会科学的研究方法

 笑熬浆糊糊 2010-09-30
作者:涂子沛 | 来自:东西


按流行的分法,我们有三大学科:自然科学、社会科学和人文科学。在科学的谱系里,社会科学正好介于自然科学和人文科学之间。自然科学讲的是“精确”,丝毫不能含糊,卫星上天、轮船下海,差之毫厘,可能就谬之千里。人文科学则主要包括文学、艺术、哲学,它探讨的是人的信仰、情感和价值,无所谓精确不精确,有时候甚至模糊就是美,所以位于科学的最外围。社会科学研究的是社会现象,探讨的是人与社会的关系,如经济学、政治学、社会学,它也追求精确,但因为涉及到多变善变的人,我们“测不准”,所以社会科学又被称为“准”科学。

传统的观点,这门“准科学”的研究方法有三种:一是定性,二是定量,三是实验。定性的方法是依托文本,通过分析、综合、归纳、演绎、类比等逻辑思辨的方法对社会现象进行分析;定量则是指收集和社会现象有关的数据,通过数学模型、统计分析的手段进行研究。实验的方法较好理解,这里不谈。

虽然存在三种方法,但在很多中国人的眼里,如政治学、政策学这种学科还是和定量分析难以沾边的。

我就曾经是其中的一员。出国之前,我在各类国家机关辗转工作了十年。那时候的政治和政策,在我的眼里,主要就是基于逻辑思辨的理论分析,而不是基于数据的细节分析。为什么呢?我们的国家机关和领导,天天把冠冕堂皇的指导思想、方针政策挂在口头上、摆在材料里;一涉及到具体细节,都避重就轻,谈笑间化为无形,这给年轻人造成了一种错觉:认为政治就是宏大叙事。等年轻人变得老到,慢慢了解到越来越多见不得光的细节之后,恍然大悟,又很容易掉进政治政策即“权术权谋”的陷阱之中。

 这种机关工作的长期浸染,使我不由自主便认为政治政策无非就是台上的宏大叙事和底下的明枪暗箭。现在想起来,这正是专治政权的一个特点,台上写标语、喊口号;底下黒箱子、潜规则。领导在公开场合都喜欢大谈原则、回避细节,因为那是要留在桌面之下来操作或交易的。细节一放大,魔鬼就会现形。

 来到美国之后,发现这里大相径庭。听一听、看一看美国国会的辩论,你就会发现,争的无一不是细节,其实,世界各国,只要是民主政治,都是这么玩的。我就读的卡内基梅隆大学,是美国最早将定量分析技术大规模引进到社会科学领域的学术发源地之一,这里的政策分析,说白了,就是数据分析。观念的调整是最难的、也最痛苦,我用了整整两年多的时间。这两年多,一方面很想继续深造,另一方面又拒绝这种研究方法,一路跌跌撞撞,找不到方向,两年时间转瞬即逝,最后明白了自己错误的思想根源所在,已经毕业了,错过了攻读博士的最佳时机,我一直深以为憾。

 其实,近几十年以来,整个美国社会科学的主流,都已经是定量分析了。以政治学为例,据我所知,在美国,只有东西两冀极少数的学校,强调政治哲学的,走的还是定性分析的老路。

 定量分析的方法,不仅成为社会科学的主流,而且,路越走越宽。原因是多方面的。

 一方面,定性方法和实验方法的客观性常被诟病。社会科学的研究往往是为相关决策提供支持的,决策则关系到资源的分配、涉及到利益,所以学者的研究容易被利益集团驱使,染上铜臭,出现屁股指挥脑袋的结果;实验的方法也不完美,因为志愿者在进入实验室的时候,多少会产生“表演”的心理暗示,实验结果会被扭曲。

 另一方面,定量方法的客观性高是不争的事实,而且在近数十年来不断的得到丰富和发展。定量方法原来最大的困难在于数据收集,数据量小,数据的区分度低,得出的结论就会有不可避免的认知偏差,不精确。但现在信息技术一日千里的发展,这个问题得到越来越好的解决。此外,定量方法并不排斥定性方法的使用,很多情况下,定性方法是穿插其中的,但定性方法,却是“我”中无“你”,一般不使用以数据为核心的定量技术。

 2007年,雅虎的首席科学家Duncan Watts博士在《自然》(Nature)上发表了一篇文章"A twenty-first century science",他提出,得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度很高,强度还在不断增加,为社会科学的定量分析提供了极为丰富的数据。举个例子,政治新闻的跟贴、视频网站的下载记录、金融平台的交易记录等等都为政治从众行为的研究提供了大量的数据。因为能测得更准、变得更加精确,Watts博士认为,社会科学将脱下“准科学”的外衣,进入科学的殿堂,在二十一世纪全面兴起。

 对他的提法,我有深刻体会。我现在从事公共部门的数据仓库工作,经常要思考和面对海量数据。反映单个个体行为的数据似乎杂乱无章,但是,当数据累积到一定程度时,群体的行为特点就会在数据上呈现出一种秩序和稳定。以前数据量小的时候,这种“秩序和稳定”就没有量化的证据。

 总的来说,在美国学习和工作的这几年,我深刻地领略到数据的强大和美感。我相信,以数据为中心的定量分析方法将深刻地改变这个时代。数据,将会引发一种竞争,这种以数据的收集和使用为中心的竞争,不仅在学界,也将在国家与国家、企业与企业之间兴起。抓住了数据,就能抓住信息时代的脉博。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多