前天我们公众号推送了Shinsuke Tanaka(2015)发表在Journal of Health Economics上题为《Environmental regulations on air pollution in China and their impact on infant mortality》的论文。作者借助中国1998年的两控区政策(Two Control Zone Policy),在DID框架下进行了实证分析,并发现环境管制措施可以显著减少20%左右的婴儿死亡率。今天的推送专门整理出了我们对本文DID策略的讨论,供参考。 巴赫,哥德堡,第13个变奏 兰多夫斯卡(1879-1959) 教科书式的哥德堡变奏曲,教科书式的羽管键琴 如下面方程(1),这是个教科书式的DID。因变量Yjt是第j个城市在第t年的婴儿死亡率。等式右边控制了地区uj和时间kt,Postj是处理前处理后的dummy,Tj是是否是treatment group的dummy。这样,交互项前面的系数就是我们关心的效应。 上面DID成立的前提条件在于“共同趋势假设”,那么作者是如何一步一步让大家信服的呢? 1.画图。 在有超过2期数据的时候,画图是经常被采用的方法。 如图,可以发现treatment group和control group在1998年之前基本保持差不多的趋势,1998年之后treatment group的婴儿死亡率骤减。 2. 比较各年的交互项系数 作者计算了各年的交互项系数,发现1998年之后这个系数有个下降。类似上图,原本treatment group的婴儿死亡率更高,趋势平稳,但1998年之后就有了逆反的趋势。 (但1998年后的系数均不显著,90%的置信区间都盖住了0。也就是说,其实本文的证据不是特别“强”,只是把各年year dummy合在一起成Post dummy才变得显著。这或许可以解释加了时间趋势后就不显著了。) 3.加时间趋势 如式(2),作者加入了每个地区的时间趋势变量,控制可能存在的趋势差异。 但加入时间趋势后,主结果变得不显著了!如表3的第(4)列。作者的解释是:加入地区时间趋势变量后,自由度下降太多,标准误变大了1倍导致不显著,但系数接近不变说明系统性趋势差异的有无不能解释婴儿死亡率的不同或者说处理组和对照组不存在系统性的趋势差异。文章的结论并没有强大到星星一直能稳健存在,但现有证据还算有力。上述3个步骤差不多是DID的标准流程了。 4.检验每个协变量的DID效应 第4步倒是不多见,因此特意推文,供大家参考。 政策可能是内生的,比如如果女性劳动参与率更高的城市污染更高,那么两控区就更针对这些城市,这些城市的女性更注重孩子的质量(quantity-qualitytradeoff),所以婴儿死亡率低。这就混淆到了本文“两控区与婴儿死亡率负相关”的结论。 本文把方程(1)中xjt的每个协变量依次放到因变量位置,并检验交互项的显著性。
这个思路就在于,所有可观测的协变量如果被视为因变量的话,两控区政策对它们都没有效应。这可以增强我们对共同趋势成立的信心,因为一个政策的实施,都没有改变所有x的双差分值。可以想见,那些x的趋势跟政策真没什么关系。进一步的,既然两控区政策对所有可观测协变量的变化没有影响,那么可以推测,两控区政策对所有不可观测协变量的变化没有影响(有点像matching的思想)。当然,这不是一个严格的检验。类似的思路可以参考Altonji et al.(2005)的JPE。 我们认为,这个做法对于DID共同趋势假设的成立既不是充分条件也不是必要条件——如果用某个协变量x时交互项显著了,那也不能说就违背了共同趋势假设,因为某个政策的实施可能确实会让x发生变化,共同趋势假设是潜在值,即如果没有这个政策,原本控制组和处理组应该有共同的趋势;如果所有x作为因变量时交互项都不显著,也不能说DID就一定没问题了,但无疑会很大程度上增强可信度。 这给了我们在做DID时堵审稿人嘴很大启示。 【可能存在误导,欢迎讨论:machao@seu.edu.cn】 正是这位波兰女钢琴家的不懈努力,才使羽管键琴这种巴洛克时代的重要独奏乐器得以复活。 她的学生莱斯托特在回忆上世纪初第一次在老师那里听到了用羽管键琴演奏《哥德堡变奏曲》的情形:“那种声音我大吃一惊,我感觉好象是站在大自然最伟大的作品面前。” 参考文献 |
|