DID只是在估计一个项目、政策、干预或“处理”效应时的一种估计方法,此外还有断点回归设计(RDD)、倾向分配得分(PSM)和合成控制法。因此有必要先了解科学评估方法的基本逻辑。 从科学意义上讲,评估一项政策的实施效应的背后逻辑是:在给定其他条件相同的情况下,实施政策后的表现与假定没有实施政策后的表现间的差异。这句话说着容易做着难,因为其前提条件非常苛刻!比如我们想评估大学教育对工资的贡献程度,让某人在现实中读大学,然后记下其工作时的收入A,然后用时空穿梭机把他送回去,这次不让他上大学,记录其收入B,则A-B就是此人上大学的教育回报。 在政策评估方法论中,例子中的B就是A的完美的反事实对照组,即一旦其接受了政策干预,表现为A,如果没有接受政策干预,结果就是B。上面的例子是无法实现的,因为历史是单线程的,我们也没有时空穿梭机。因此我们无法获得一个政策实施后的反事实对照组。在现实中我们常常会犯一些错误:横向对比的错误、纵向对比的错误。 政策评估的科学方法,本质就是找到反事实参照组。反事实参照组需要满足两个基本条件:
我们可以基于“时空穿梭机”的视角,采用其他方法构造一种近似的“穿越”。常见的构造方法有两种:
以上两种构造反事实组的方法虽然能够满足科学评估的要求,但是应用性弱。 现实中政府的绝大数政策并不是根据评估的要求实施的,因此政策评估的数据是一种观测数据,即政策实施后收集的数据。由于政策评估方(咱们写论文的)没有直接参与到政策的涉及和实施过程,无法按照科学评估方法的要求来构造和生产数据。因此任何利用观测数据的政策评估就必须非常小心和科学论证。针对不同的数据结构和政策类型采用不同的评估方法,并反复检验该方法的实用性。 根据政策实施过程,可以将一国或部门的政策分为三类:第一种是“先行先试”的政策,第二种是“一刀切”政策,第三种是“一次性推开”的政策。严格的说,前两种政策是可以用科学评估方法对政策效应进行合理估计。因此后续的DID、RDD等针对前两种政策类型而言的。 参考资料: |
|