模型系列

子悠682 2019-04-26

展开全文

DID只是在估计一个项目、政策、干预或“处理”效应时的一种估计方法，此外还有断点回归设计（RDD）、倾向分配得分（PSM）和合成控制法。因此有必要先了解科学评估方法的基本逻辑。

从科学意义上讲，评估一项政策的实施效应的背后逻辑是：在给定其他条件相同的情况下，实施政策后的表现与假定没有实施政策后的表现间的差异。这句话说着容易做着难，因为其前提条件非常苛刻！比如我们想评估大学教育对工资的贡献程度，让某人在现实中读大学，然后记下其工作时的收入A，然后用时空穿梭机把他送回去，这次不让他上大学，记录其收入B，则A-B就是此人上大学的教育回报。

在政策评估方法论中，例子中的B就是A的完美的反事实对照组，即一旦其接受了政策干预，表现为A，如果没有接受政策干预，结果就是B。上面的例子是无法实现的，因为历史是单线程的，我们也没有时空穿梭机。因此我们无法获得一个政策实施后的反事实对照组。在现实中我们常常会犯一些错误：横向对比的错误、纵向对比的错误。

政策评估的科学方法，本质就是找到反事实参照组。反事实参照组需要满足两个基本条件：

保证呈现反事实的特征，即一旦实验组没有受到政策影响，其结果应该和反事实组是完全一致的
反事实参照组不能受到实验组的影响，即受到政策干预的人群不能把这种影响传递给其他人，理论上是允许实验组内互相影响的，但是如果这种影响外溢到参照组，就会导致政策效应估计出现偏误。

我们可以基于“时空穿梭机”的视角，采用其他方法构造一种近似的“穿越”。常见的构造方法有两种：

数据筛选
最佳例子是“同卵双胞胎”，给双胞胎同时服用，其中一方服用真实药物，另一方服用外形无差别的糖丸，这样双方都会认为自己服用了药物，心理干扰因素的作用对双方同时存在，其事后的差异就完全是药物作用了。
随机实验
随机干扰试验（RCT），这一方法的核心是“随机”，其采用的是统计学原理，例如对有就医需求并去医院（正面硬币）和有就医需求但没有去医院（反面硬币）的人群的健康差异，就是医疗对健康的实际改善程度。

以上两种构造反事实组的方法虽然能够满足科学评估的要求，但是应用性弱。

现实中政府的绝大数政策并不是根据评估的要求实施的，因此政策评估的数据是一种观测数据，即政策实施后收集的数据。由于政策评估方（咱们写论文的）没有直接参与到政策的涉及和实施过程，无法按照科学评估方法的要求来构造和生产数据。因此任何利用观测数据的政策评估就必须非常小心和科学论证。针对不同的数据结构和政策类型采用不同的评估方法，并反复检验该方法的实用性。

根据政策实施过程，可以将一国或部门的政策分为三类：第一种是“先行先试”的政策，第二种是“一刀切”政策，第三种是“一次性推开”的政策。严格的说，前两种政策是可以用科学评估方法对政策效应进行合理估计。因此后续的DID、RDD等针对前两种政策类型而言的。

参考资料：
1. 如何科学评估经济政策的效应？,范子英,财经智库,No.5,2018
2. 第八讲实验和自然实验,许文立