DID, 合成控制, 匹配, RDD四种方法比较, 适用范围...

HUSTKP 2020-08-23

展开全文

前些日，咱们引荐了“非线性DID, 双重变换模型CIC, 分位数DID”，受到社科学者欢迎。Probit, Logit DID, 以及双重变换模型changes in changes，还有分位数DID，quantile DID。这些都依托于传统线性DID，但又针对linear DID做了相应的调整，从而更好地解决现实中的实证问题。

今天，咱们引荐四种常用政策评估方法，以及他们各自适用范围和主要特征。还记得这个“政策效应评估的四种方法（Policy evaluation）”吗？

政策评估中常用方法除了DID 方法之外，还包括匹配、合成控制和断点回归等其他方法。已经有大量文献对政策评估的方法进行很好的论述，比如Doudchenko 和Imbens（2016）把DID、合成控制以及约束回归纳入统一的分析框架。Imbens 和Wooldridg（2009）、Khandker et al. （2010）和赵西亮（2017）系统介绍当前政策评估中常用的几种识别策略。限于文章篇幅，本节不打算详细介绍每一种方法，仅对几个常用的政策评估方法的思想原理、优缺点及其同DID模型的差异性在统一框架下进行描述。表5为四种政策评估方法主要差异。

匹配方法也是政策评估中常用的一种方法，其主要思想是，根据某种“距离”将在控制组个体与处理组进行匹配，并用成功匹配的控制组个体的观测结果近似表示处理组个体的反事实结果，通过比较两组的平均差异作为政策的平均处理效应。匹配方法实施前要求满足条件独立性和共同区间两个假设条件，所谓条件独立性指的是在控制协变量后，个体到底在处理组还是控制组，是独立于潜在结果；所谓共同区间假设条件指的是要求样本中要同时存在处理组和控制组。匹配方法主要包括精确匹配和倾向得分匹配。精确匹配根据可观测变量进行匹配，往往面临观测变量越多，匹配效果越差的“维数诅咒”问题。Rosenbaum 和 Rubin（1983）为了解决这一问题，将根据多维可观测变量进行匹配的方法变为一维倾向得分匹配方法，即根据控制组个体受干预的概率进行匹配，一定程度上降低了样本的自我选择问题，也正是这一点使得倾向得分匹配在政策评估中得到了广泛应用。匹配方法同DID 方法的联系之处在于，DID方法可以看成一种特殊的匹配方法，是对潜在结果增量的匹配，而不是直接对潜在结果进行匹配。该方法的主要缺陷在于不允许存在未观测的混杂因素，即无法解决内生性问题。一般可以将匹配方法同DID 模型结合，消除不随时间变化且未观测的混杂因素，以此减轻内生性问题（如案例1）。同时该方法要求控制组中要有足够的个体可以供处理组个体进行匹配。

Abadie 和Gardeazabal（2003）、Abadie et al.（2010）提出了合成控制方法，其主要思想是，尽管控制组个体和处理组个体的特征不相似，但是可以对这些控制组个体进行某种加权，构造出处理组个体的反事实状态。从差异性来说，该方法适用的场景类似DID 方法，都要求政策实施对处理组有影响，但是对控制组没有影响，不同的是其要求政策干预在某时刻只影响一个地区或国家，而其他地区或国家在所有时间内都没有受到该政策的影响，如上海自贸区试点或者中国4 万亿元刺激方案政策性问题，而且往往要求结果变量是加总变量，而非个人或单个企业的信息，如宏观经济变量。简单来说，DID 方法针对具有多个处理组个体和控制组个体，且处理组和控制组具有一定相似性，而合成控制方法适用于处理组个体较少的政策评估问题。另外，DID 方法可以通过差分解决不随时间变化且未观测到的混杂因素，但是无法克服由于存在随时间变化的混杂因素而导致内生性问题，而合成控制法却能很好地解决该问题。该模型的主要缺陷在于，合成控制法要求进行加总的权重必须保持在0 到1 之间，因此，如果处理组的特征远远大于或者小于控制组的特征，那么将找不到合适的权重构造处理组的反事实状态，也就无法利用控制组的特征向量的凸组合构建处理组的特征向量。当然可以通过放松假设，允许负权重存在，类似合成控制方法得到一个控制组，比如Hsiao et al.（2012）的回归合成方法。

Thistlethwaite 和Campbell（1960）最早提出了断点回归模型，该模型的主要思想在于，寻找一个参考变量，该变量的某临界值能够决定哪个个体能够成为政策干预对象即处理组，哪个个体不能成为政策干预对象即控制组，将控制组的结果变量作为处理组的反事实状态。断点回归可分为精确断点回归和模糊断点回归。精确断点回归假设干预分配完全由参考变量决定，而模糊断点回归则假设干预状态不是完全由参考变量决定，还与其他未观测到的因素有关。精确断点回归与其他几种政策评估的不同之处在于，其不满足共同区间假设，即当参考变量大于临界值时，所有个体都进入处理组，而当参考变量小于临界值时，所有个体都进入控制组。断点回归模型的主要缺点在于，若个体能够精确控制是否接受政策的参考变量，那么临界点附近的干预状态的分配就接近完全随机实验的结果，断点回归的估计将无效。此外，断点回归模型和完全随机实验一样，内部有效性较强，而外部有效性较弱，即只能估计断点处的平均因果效应，不能简单推广到其他位置。针对该问题，Angrist 和Rokkanen（2015）引入了类似于匹配方法的条件独立性假设，假设引入其他协变量后，参考变量和潜在结果之间是独立的，只要根据协变量而不是参考变量进行匹配，可以将因果效应外推到断点左右任意位置。

上述三种不同于DID 模型的常用方法也为政策评估的有效性提供了方法保证，都具有各自的优缺点和适用范围，因此在政策分析的实证过程中应该根据所处的场景判断使用合适的模型，避免由于模型设定错误导致政策评估结果偏差。

Source:

胡日东，林明裕，2018，双重差分方法的研究动态及其在公共政策评估中的应用，财经智库，03（03）：84-111 页