让“跳跃”更有意义：断点回归设计(RDD)

昵称36830104 2016-09-25

展开全文

在一个高度依赖规则的世界里，有些规则的出现十分随意，这种随意性为我们提供了性质良好的实验（Angrist& Pischke，2009）。断点回归设计（RegressionDiscontinuity Design）是一种仅次于随机实验的能够有效利用现实约束条件分析变量之间因果关系的实证方法。Lee（2008）认为在随机实验不可得的情况下，断点回归能够避免参数估计的内生性问题，从而真实反映出变量之间的因果关系。

断点回归方法首先是由美国西北大学心理学家Campbell于1958年提出的；并与1960年，与 Thistlethwaite正式发表了第一篇关于断点回归的论文，提出断点回归是在非实验的情况下处理处置效应（Treatment Effects）的一种有效的方法，主要应用于心理学和教育学领域。1963年，Campbell and Stanley为断点回归提供了更加清晰化的概念，但由于当时还缺乏严密的统计证明，加之IV 方法在处理内生性的思路和范式上具有更广阔的适用范围，因此在随后的几十年间，RD 方法一直没有得到经济学者的重视。直到上世纪90 年代末，随着该方法的理论基础得到进一步发展，大量经济学文献才开始使用RD 方法对变量之间的因果关系进行识别。

断点回归可以分为两类，一类是模糊断点回归（Fuzzy RD），另一类是清晰断点回归(Sharp RD)。清晰断点回归可以看作是一种基于可观察变量进行的选择（selection-on-observablesstory），而模糊断点回归则常被视为一种工具变量的方法（instrumental-variables-type）。

清晰断点回归(Sharp RD)

当处理状态是协变量确定型、不连续函数时，可以使用清晰间断点回归法。对于清晰断点回归，个体在临界值的一边接受处理效应（treatment effect）的概率为0，而在临界值另一边的概率则为1。最早使用清晰断点回归方法的典型例子是：获得国家杰出奖学金的学生是不是会更愿意读研究生(Thistlewaithe and Campbell,1960; Campbell, 1969)。清晰断点回归通过比较PSAT分数刚好高于或低于国家杰出奖学金分数线的那些高中生的研究生入学率来回答这一问题。一般情况下，在PAST考试中得分越高的学生，其将来读研究生的概率也就越大。通过回归来拟合研究生院入学率和PSAT之间的关系，可以控制这一趋势，将分数线附近PSAT成绩和大学入学率之间的关系中出现的跳跃视为存在处理效应的证据。

Imben and Limieux(2008)认为断点回归的有效性依赖于我们对协变量的外推，或者至少在协变量有不连续的那个领域内外推，因此，条件期望函数的具体形式的设定很重要。给予具体函数形式得到的断点回归估计值的有效性依赖于多项式模型能否精确的描述条件期望函数。如果不能，那么看上去由于个体被处理而发生的跳跃可能只不过是条件期望函数的某个点的不连续，在设定期望函数之前我们并没有预计到这种不连续。为了使得这种错误降低到最低，断点回归在实际操作中只去考察在不连续点的领域中的数据，也就是考察区间[x0-△,x0 △],其中△为某个很小的正数。换言之，在x0左侧和右侧一个足够小领域内比较Y1i和Y0i的平均值之间的差别，就可估计出处理效应，而这种方法与条件期望函数的具体的形式无关。

断点回归估计方法可以分为参数估计和非参数方法的估计。大部分利用断点回归进行的经验研究中，仍然是参数型估计。参数估计方法内涵一个思想是：赋予靠近临界值的数据点更大的权重。随着不连续样本窗口的缩小，断点回归估计值会变得不精确，但是用来模型化函数f（xi）的多项式的阶数也会下降。当以X0为中心不断调整样本窗口大小时，控制变量会逐渐变少，但Di的处理效应会保持稳定。

非参数方法的应用越来越广泛。使用非参数方法对断点回归进行估计时，需要分别对x0左侧和右侧领域中的Yi的平均值做出精确估计，但这至少会遇到两个问题：如果在临界值很小的领域中进行估计，那么可用的数据就相对较少；在有界领域中对条件期望函数的估计是有偏的。针对这一问题，Hahn, Todd and van der Klaauw 在2001年提出了使用非参数的局部线性回归，感兴趣的读者可以进一步阅读。

清晰断点回归的一个经典例子是关于执政党地位对其再次当选的研究。在美国的议会政治中，执政党被再次高概率当选已经成为美国议会政治中最为引人注目的事实。Lee在其<Randomized Experiments from Non-randomSelection in U.S. House Elections>一文中试图回答的问题是：如果民主党在上次竞选中获胜，那么是否会在本次竞选中获得优势。这项研究可能遇到的问题是：议会会员是否会利用他们的官方身份所带来的权利和资源为他们自己的党派谋取利益。也就说，执政党的成功并不必然是反映真正的选举优势，而是在满足投票者或者换取选票方面更高明。为了寻求执政党地位所带来的因果效应，Lee将民主党候选人获胜看作是由Di=1（xi>=0）决定，xi是选举胜利者在边际上的得票份额（民主党和共和党的得票之差）。Di是xi的确定性函数，在xi之外并无其他变量干扰。Lee通过将民主党获胜的概率（Y轴）和在上一次选举中民主党与共和党得票份额之差（X轴）在坐标抽中绘出，发现民主党在0点处获胜的概率大幅提高，民主党得多数票，由于这一点跳跃，执政党大约可以将再次当选的概率提高40%。Lee的分析认为以往选举中的获胜率应该与上次选举中的获胜的断点没有关系，这一检验符合了Sharp RD 识别策略的假设。在给定的处理状态下，协变量应该是像在随机实验中一样被处理平衡。然而需要解决的一个问题是，在选举中存在私利的人可能会控制操纵处在临界值附近的xi，从而使得临界值两边的状况不可比，但Lee通过计算接近x0处的xi的比例来考察不连续点附近的xi的分布密度发现，这种情况不太可能出现。作者通过清晰断点回归设计，创造出“近似实验（near-experimental）”方法，验证了执政党的选举优势。

模糊断点回归（Fuzzy RD）

作为一种工具变量法的模糊断点回归是在给定某个协变量的情况下，处理状态的概率和期望值所发生的不连续变化。与清晰断点回归不同的是，处理状态不再是变量Xi的确定函数，而是一种概率函数。由于个体被处理的概率会有一个跳跃，不连续性成了针对处理状态的工具变量，不再和处理状态有确定性的联系。模糊断点回归设计提供了一个简单的工具变量估计策略。

模糊断点回归方法的第一个例子是关于助学金是否是高校争夺优质生源的有效工具的研究。Van der Klaauw(2002)的<Estimatingthe Effect of Financial Aid Offers on College Enrollment: ARegression-Discontinuity Approach>，文中关注的是助学金是否是高校争夺优质生源的有效工具？Van der Klaauw使用了Fuzz RD 设计估计了大学生资助学金对大学入学率的影响。学生的入学决策受到很多因素的影响，其中一些因素是学校管理者无法观测的。正是由于遗漏变量的存在，当我们评估助学金对入学率的影响时，助学金常常很难被看作是外生变量。为了寻求能够解决内生性问题的办法，作者对决策的规则进行了深入的分析。学校给予学生的资助金额受到很多客观和主观评价的影响，因此很难用一个简单的公式进行描述。尽管有一些评价因素在学校的数据库中能够找到，如学生的学术能力，民族、父母的收入等。但其他的一些信息如学生的学习目的、已修课程、笔记是否工整、推荐信等在数据库中则不能找到。然而，在很多学校，助学金的评判过程都是客观和公平的。例如，学校x通过SAT和GPA的成绩构建一个综合指数S，通过这个构建的指数将学生分为不同的等级。依据这一指数，将学生分为四个不同等级。三个切点分别为S1、S2、S3，S3其中最高的一个等级。不同等级的学生可以得到不同等级的助学金。尽管助学金的评定并不仅仅看S的等级，这使得不同的等级内部的助学金也会存在差异。在给定学生的指数是决定其能否得到助学金主要变量后，因此，学生得到的助学金是学生成绩的函数，并会在切点处出现跳跃。那些比切点处的综合指数大的得到助学金较大，而比切点处的综合指数小的得到助学金较小。由于学生得到助学金的多少是学生综合指数S的函数且存在间断点，这其实符合了模糊断点方法的设定原则。因此，作者利用模糊RD的方法，通过分析助学金在学生综合指数的切点处的变化，得出助学金是高校争夺优质生源的有效工具的结论。

另外一篇相对更早的使用模糊断点回归设计进行因果效应估计是Angrist & Lavy 在<Using Maimondides’ Rule to Estimate theEffect of Class Size on Scholastic Achievement>一文中完成的班级规模对学生成绩影响的准实验分析。在以色列，学校的班级规模方面，存在一个“迈蒙尼德”法则，认为班级规模不能超过40人。如果一个年级的学生不足40人，那么这些学生将被编入一个班级。而如果超过40人，如41人，那么这些学生将会被分为两个班，81名学生时将会被分为3个班。Angrist & Lavy 对所选的两个年级的学生的实际班级规模和用迈蒙尼德法则计算班级规模进行对比发现，迈蒙尼德法则并没有很好的预测班级规模，大部分是因为年级人数没有超过40人，也被分为了两个班；但总体来看，学生人数为40,80,120处发生的班级规模的剧降。作者认为可以运用模糊RD来进行研究设计。当不存在控制变量时，班级规模和考试成绩存在强烈的正相关。当把学校中具有残障或者贫困等不利背景的学生比例作为控制变量加入回归后，班级规模和学生成绩之间的相互关系不在显著。但作者利用模糊断点回归的方法（将利用“迈蒙尼德”法则计算的班级规模作为实际班级规模的工具变量）的估计得出班级规模对考试成绩具有显著影响，这与利用STAR实验的相关研究得出的结论一致。

参考文献：

Lee, David S. (2008): “Randomized experimentsfrom non-random selection in U.S. House elections”, Journal of Econometrics,142, 675-697.

Thistlethwaiite, D., and D. Campbell (1960): “Regression-DiscontinuityAnalysis: An Alternative to the Ex Post Facto Experiment,” Journal of EducationalPsychology, 51, 309–317.

Campbell, Donald Thomas (1969): “Reforms asExperiments”, American Psychologist, 24, 409-429.

Campbell, Donald Thomas, and Julian C. Stanley(1963): “Experimental and Quasi-experimental Designs for Research”. RandMcNally, Chicago.

Imbens, Guido, and Thomas Lemieux (2008): “RegressionDiscontinuity Designs: A Guide to Practice”, Journal of Econometrics, 142,615635

Hahn, Jinyong, Petra Todd, and Wilbur van derKlaauw (2001): “Identification and Estimation of Treatment Effects with aRegression-Discontinuity Design”, Econometrica, 69, 201-209.

Van der Klaauw, Wilbert (2002): “Estimating theEffect of Financial Aid Offers on College Enrollment: ARegression-Discontinuity Approach”, International Economic Review, 43.

Angrist, Joshua D., and Victor Lavy (1999): “UsingMaimonides Rule to Estimate the Effect of Class Size on Scholastic Achievement”,Quarterly Journal of Economics, 114, 533-575

Joshua D. Angrist and Jorn-SteffenPischke(2009):Mostly Harmless Econometrics: An Empiricists Companion. PrincetonUniversity Press

编辑：张亮亮刘伟峰

· · · · · ·

定量群学

ID：sociologynju

《定量群学》是由一群从事定量社会学研究的师生所运营的公众号。我们来自牛津大学、斯坦福大学、南京大学、复旦大学、清华大学、中山大学、东南大学和西安交通大学等高校。

宗旨：为社会学研究提供最新定量学术资讯；为定量分析学者提供人文交流的角落。

内容：重要期刊的定量社会学文献；定量分析软件使用方法；定量研究者的人文作品。