分享

实证研究是什么?怎么做?为什么你一定要做一次?

 北书房2014 2018-03-20

作者:刀熊

我在出国读博士以前虽然也做了参与了一点科研内容,但是真正让我对学术发生兴趣、真正开始理解学术研究还是在来美国接触了实证研究之后。

 

如果你是个社会科学研究者,我认为你一定要尝试自己设计一次实证研究,哪怕它不是你的主要研究目标。因为设计、执行自己创造出来的实证研究,实在是太有意思了。

 

打个比方,这种能够自己设计、执行、验证自己的研究的感觉,就好像艺术家从头到尾经历几年精心打磨出来一件艺术品,就像建筑设计师从无到有、从想象到现实看见自己脑中的图像矗立在大地上。

 

它实实在在的是你的创造,而创造一件东西过程中的快感和创造后的成就感恐怕是没有任何其他事情可以替代的。

 

什么是实证研究?

 

实证研究,empirical study, 是基于对事实、客观的现象、数据进行系统的验证,而得出问题结论的研究。实证研究的三大特征是以证据为依托、有数据、和可以验证和重复验证看一个研究是不是实证研究,最直接的办法是看它文章里有没有呈现data (数据)——这里的数据并不单指“定量”数据,而是既包括定量也包括定性的数据。所以实证研究从数据类型上分可以分为两种:


  • 定量型实证研究

  • 定性型实证研究


有人会以为只有定量的研究才是实证研究,这其实是误解。访谈的对话、实地观察的笔记、archival data(档案数据), 这些都是数据,只不过是定性的数据。

 

什么研究不是实证性研究呢?没有数据的,不依托现实中验证的证据的。比如理论构建的研究、文献综述型文章等。没有收集数据、呈现数据、经数据分析的研究不是实证研究,而是conceptual study(概念研究), 或者theoretical study (理论性研究)。

 

实证研究重要吗?

 

重要,特别重要。最大的原因是,这是目前为止社会科学领域最被广泛接受、最流行、最常见的研究类型。其次,功利一点的原因是,这也是社会科学领域学者们最容易发文章的类型(英文期刊)。或者,从趋势的角度看,在可预见的接下来几十年,实证研究的方法应该继续成为社会科学届最重要、最主流的研究方法。而国内这几年实证研究的兴起和快速发展更加印证了这一点。

 

实证研究怎么做?

 

简单来讲,实证研究最核心的工作是以下这三步:

 

第一步:你要确定一个研究问题


这个研究问题最好是你感兴趣的,要是非常具体的,要是可以检验的。比如, 以下都是可以作实证研究的题目:


  • 提升电费能够促进人们节约用电吗?

  • 每年年初制定计划的人会比不做计划的人工作效率更高吗?

  • 在医院工作的人,是比不在医院工作的人更容易生病还是更不容易生病?

  • 数学好的人语言能力会更差吗?

  • 随着年龄增加,人的同情心会逐渐增加吗?

  • 一个非营利组织的筹款数额与员工对工作满意度有相关性吗?

  • 明星片酬越高的电影票房越高吗?

  • 养狗的人比养猫的人更愿意跟其他人社交吗?

  • 学生自发上知乎的频率跟学习成绩成相关性吗?

 

以上是我随便举几个例子, 你会发现, 实证研究的主题经常是非常有趣,非常接地气的,跟我们生活息息相关的,所以我相信很多学者都是跟我一样,因为自己做了实证研究而对研究这件事本身发生了巨大的兴趣 。

 

而另一方面,当你自己做过实证性研究,你会发现你看待周围人和事物的方式或多少发生一些变化,你相当于给自己的思维加了一道升级的新设备,它会帮助你更有力的思考很多现实问题。你还会发现,其实我们生活中很多人们习以为常、或者习惯性接受了的观点,未必是经得起推敲的事实,因为它们从未经过系统验证。

 

我们中国悠久的历史和沿承的文化决定了我们很多知识是通过经验、习俗、或口耳相传来积累的,而不是经过系统的、以事实为依据的科学验证来积累的。那么这就意味着可能有不少的流行的观念、习惯、想法都还没有经过验证,都需要有数据去支持,都值得去展开质疑和进一步探讨。这也意味着,作为一个社会科学研究者,在国内做实证研究,其实还有大量“低垂的果实”没有被开采,大量的贡献等待着学者做出,正是被需要的好时候。

 

第二步:你要自己设计出验证题目的过程


这其实就是写proposal(计划书)的过程。你要在这一步里思考怎样才能够验证你的研究问题,而具体来说,也就是收集到什么样的数据能够帮你验证你的研究假设。

 

从这一步开始,你要做的工作就越来越有意思了,你开始通过你自己的能力去创造一个从未有过的过程。这里面需要你具备很多基础知识和思维能力,但是它诱人的地方在于,你设计的研究,会跟其他任何人设计的都不完全一样,那是你做的,你创造的,你把握的,一定带你着思维方式、教育背景、训练背景的独特烙印。这个研究可是真真正正、从里到外印着你名字的作品。

 

比如说,“在医院工作的人,是比不在医院工作的人更容易生病还是更不容易生病?”这个题目,是我有一次去医院的时候忽然想到的,虽然不是我自己的研究范围,但是我觉得是一个很有意思的话题。这里我好奇的并不主要是医院工作人员更容易被传染、或者免疫能力更强的问题,我当时在医院里的感受是,所有的工作人员每一天都会接触很多的病人、谈论很多的疾病名称、看到很多的病痛症状。他们谈论、思考、接触这些疾病和症状的频率,大概是我们普通人的好几十倍。我们平时也就是偶尔会谈论起某个人生病了,或是偶尔看到别人生病的症状。所以我特别好奇这种”谈论”和“接触”对人的心理暗示有没有影响,人会不会因为每天讨论的病情很多,就更容易得某种病呢?

 

要想真的用实证方法来验证这个问题,不同的学者的设计思路一定会不一样。比如,到底什么样的数据类型才能回答问题?定量还是定性的方法更有效?访谈还是问卷的方法更适合?如何测量“更容易生病”这个变量?选取多少个医院的工作人员才够?选哪里的医院?要不要选多家不同类型的医院?要不要把不同的工作人员(比如医生、护士、其他工作人员)区分开来研究?….这些方面都需要考虑,具体做起来每个学者也都会有不一样的设计。

 

更系统一点说,这一步要想把研究设计得精彩,意味着我们需要有以下几个方面的知识( 后续专栏文章会分别梳理的模块):


  • Sampling (抽样): 什么是样本? 有什么不同的抽样方法? 抽样背后的逻辑是什么?什么时候应该用什么样的抽样方法才合理? 定量研究和定性研究sampling方法有何不同?

  • Data collection (数据收集): 了解数据收集的不同方法,以及各种方法的具体步骤

    • 访谈(interview):结构化访谈,非结构化访谈,以及半结构化访谈(structured, unstructured, and semi-structuredinterview) 分别在什么情况下使用? 什么才是高质量的访谈? 如何做好面对面访谈?

    • 问卷(Survey): 什么情况下时候使用问卷? 应该使用哪种类型的问卷形式(网络问卷、电子邮件问卷、纸质版问卷等)? 哪个网上问卷编辑的网站能满足你的问题类型? 问卷里应该先问什么后问什么? 问卷应该多长? 应该什么时候发反馈率最高? 应该什么时候做follow up, 以及如何管理和跟踪参与者数据库? 

  • Measurement (测量): 如何问好你想知道的问题呢?你问了问题就一定能得到你想知道的东西吗?如何能准确测量你的变量呢?怎样保证较高的validity (效度)和reliability(信度)呢?是否应该选择和使用前人建好的问题呢?

 

实证研究很大的迷人之处在于,实证研究的设计,永远没有最好,只有更好。

 

真正做起来实证研究的时候,你会发现各种选项都有各有其优势和劣势,就像特点不同的兵器,你拿起哪一把都必须接受它的弱点,所以看起来好像不难的事情其实里面需要考虑和权衡的细节非常多,因为无论你选择哪种抽样方法、数据收集办法、测量的方式,你都真切的知道它们不会是完美的方式。然而 如何在不可能出现完美的情况下,做出尽量去无限接近完美的设计, 或者说如何在已知困难的事情面前想出巧妙的方法,这就是做研究的巨大魅力。

 

我总觉得这世界上可以自己决定的事不多,而亲手做实证研究时,你就像是坐在驾驶舱的位置,通过每一步自己亲手做出的设计去观察和了解这个世界。每一个步骤都可以一丝不苟,做的精良一点再精良一点。大概没有什么事是比看到自己亲手设计和创造的东西做出了好的效果更有成就感了。

 

第三步:数据收集上来之后,你要用统计学或其他合适的分析方法来验证结果了

 

这一步简单来说,就是“见证奇迹的时刻!”。 

 

我自己在所有做实证研究的所有步骤中,这一环最让我上瘾,也就是data analysis, 数据分析的时候。时而觉得坐在那里嗖嗖嗖的几个小时就没有了,异常兴奋,特别想知道分析出来的结果到底是什么样的。

 

我曾经跟我一个朋友描述过这么兴奋,就好像你本来凭空想象出来的一个想法,你自己琢磨出来一个印证过程,结果通过数据客观分析一看,居然你的想法真的被印证了!你说你是不是会觉得自己on top of the world呢?

 

或者,有的时候结果居然跟你假设的恰恰相反——这难道不是太好玩了吗?你认为养狗的人会比养猫的人更喜欢跟别人social,然而结果恰恰是养猫的人更爱社交,这到底是为什么?是你分析时用的工具不对,还是你有什么没有发现的东西呢?

 

分析数据的时候需要拥有“知道使用哪种工具”的能力——各种数据分析的方法都是我们工具箱里的不同工具,它们都有自己最擅长的领域,而面对你的数据,你的研究问题,你需要找到最适合自己的那一把工具,你还要知道你的数据满不满足能够使用这个工具的条件(也就是理解它们各自的”assumption”——假定)。这个能力,是要不断通过看教材、看别人实证文章、和自己做实证研究进行积累的。

 

我觉得在这一步骤,重要的并不是你要记住所有分析工具的具体使用步骤(这些都能在网上和教科书里轻松的查到),而是要知道到底在什么时候去拿起哪种工具。比如, 要了解以下这些工具在什么情况下使用:


  • Linear correlation and linear regression

  • Factor analysis

  • Structural equation modeling

  • MANOVA, MANCOVA, ANOVA

  • Partial least squares regression

  • Logistic regression

  • Probit, ordinal, nonlinear regression

  • Hierarchical linear and multilevel mixedmodels

  • Social network analysis: QAP, MRQAP ….

 

很多工具的学习也是通过使用该工具来实现的,没有哪个学者可以对所有分析工具了如指掌,但是做实证研究做的越多,你自然而然接触到的工具也就会越多。所以很多时候并不是准备的万无一失了才上战场,而是在战场上边向目标努力边利用机会学习。积累和学习一个工具本身就是做实证研究的一大乐事。

 

完整的做完一次实证研究通常需要多长时间?

 

一个高质量的实证研究从开始设计到论文最后成型往往至少需要两三年的时间,这还不考虑投稿期间的等待时间和revise and resubmit的时间。

 

从上面的过程你能看出无论从设计、数据收集还是后续的数据分析、论文撰写,每一个步骤都需要花费很多时间和精力,如果前面的设计或者数据收集做的不好,那么很多时间就白花了。

 

所以,李一诺不是说,“开始八篇论文才能发表一篇”。这是研究者应做的心理准备。也是研究者应该为自己骄傲的原因。

 

写实证文章时,结构安排上有套路可循吗?

 

有。简单来说,实证文章的结构须涵盖以下几个部分:

  • 交代研究问题

  • 探讨研究问题的重要性和综述文献

  • 提出假设1,假设2,假设3…

  • 介绍你的数据,收集过程,和变量的测量

  • 列出数据分析结果

  • 结论

 

仅此而已。

 

但这不重要。

 

真正重要的是要理解实证文章背后的行文逻辑:为什么要这样行文?为什么要有各个部分的内容,比如为什么一定要有研究假设、数据收集、数据结果?为什么要介绍变量的测量方法?为什么这一部分要放在那一部分在前面?为什么要写出研究的局限和后续研究展望?…..

 

本质上来讲,你要真正理解实证研究背后的信仰:不经过事实验证的都不能算作是真正的知识。

 

因为这种假设,实证研究里数据的角色特别重要,所以数据一定必须是客观的、真实的、准确的,不能有一点弄虚作假成分的

 

想起我导师教给我,所有放原始数据的文件夹都命名为”Raw data—don’t touch!!”——就怕原始数据因为各种原因出现了错误,导致最后分析结果功亏于溃,前功尽弃。

 

这种对客观数据的尊重、一丝不苟,也是对事实、客观世界、和真理的敬重。 

 

我们不是可以篡改知识真相的人,我们只是观察者,是去努力接近真实世界本质的人。我们更无资格去误导继来者。

 

最后,我不做实证研究不行吗?

 

行,当然行。不做实证研究依然可以非常厉害,我曾真诚地表达过我对理论研究者的敬意,因为不是谁都有能力做纯理论构建的。所以绝没有要所有人都去只做实证研究的意思。

 

但同时,我会鼓励和支持从没有做过实证研究的社会科学研究者至少亲手、完整地参与一次实证研究。这是因为:


  • 亲手做一次实证研究能帮你理解为什么实证研究现在这么主流、这么流行;

  • 你能更好的理解实证研究跟理论研究到底有哪些不同;

  • 你再学研究方法时,能够更好的理解为什么我们要去钻研如何访谈、如何设计问卷、如何抽样的那些细节;

  • 你以后读文献的时候会遇见很多实证性研究,自己做过实证研究之后看别人的文章会看得更明白、更快、也更能看出文章的好坏;

  • 你也许会从此爱上实证研究,而多了一条研究的主线,何乐而不为呢?

 

所以,不如从今天开始,亲手尝试做一次实证研究吧 :)


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多