【香樟推文1068】DID、回归还是合成控制?其实它们有一个统一估计框架

对对子不错 2018-04-01

展开全文

推文信息

封面图片来源：百度。
原文信息：Doudchenko N, Imbens G W. Balancing, Regression, Difference-In-Differences and Synthetic Control Methods: A Synthesis[J]. Nber Working Papers, 2016.

一、文章的贡献

把DID、合成控制以及约束回归纳入一个统一的分析框架，同时作者还提出了一个新的估计方法。

二、背景介绍

估计因果效应，一般拥有的数据都是一个面板数据结构，总的个体N+1个，包含处理个体1个（方便阐述）和控制个体N个；总的时期T期，包含处理前时期T0期和处理后时期T1期。数据安排，类似于这样的，

其中,表示可观测的结果变量数据，是处理前控制个体的结果数据，是维的，

是处理后控制个体的结果变量数据，

维，

分别是处理后和处理前处理个体的结果变量数据，维度分别是

。是相应的潜在结果表述。

因果效应实际上依赖于

，不过前者可观测，后者不可观测。若先不考虑协变量，那么一般的因果推断方法都是根据矩阵中的其他部分来建
模

，即，

第一，若是控制个体较多，而处理前时期较少，即，数据呈现如下结构，

那么，最好是对

和

建模（即矩阵竖线右边的部分，一行作为一个变量而建模）而不是

和

（即矩阵横线下面的部分），然后假设

的关系和

的关系是一样的，这样就可以得到反事实结果

。

第二，若是控制个体较少，而处理前时期较多，即

，数据呈现如下结构，

那么最好是对

和

建模（即竖线右边的部分，一列作为一个变量而建模），一些时序方法估计方法就是这么做的。

第三，若是

，这就比较困难，此时就需要一些正则方法来限制控制个体进入模型。作者就根据这个思路，提出了一个新的方法。

三、统一的估计框架与作者的新方法

因果效应，本质上就是要估计下式，

但是

不可观测，所以对其如下建模，

通俗地说，就是用控制个体的结果变量的线性组合来模拟处理个体。关键就是截距项和斜率项如何选取。一般通过最小化如下平方和来得到相应的

，并将下式记作式（1）。

但该法只有在

时才有用，如果

则估计根本不可行，或者

时即便可行，估计精度也很差，实际上，我们经常碰到的是后面两种情况，因此要得到可靠的估计，需要施加一些其他的约束。

先来看五个这样的常用约束：

第一个无截距约束：

第二个和为1约束：

第三个非负约束：

第四个精确均衡约束：

第五个常数权重约束：

如果

，即便施加前面四个约束也不会得到

的唯一解。作者建议使用如下目标函数进行优化即可，

这就是作者提出的新方法。该式与式(1)的区别在于多了对权重系数的惩罚项，而且这个惩罚项是一个类似于lasso和岭回归的惩罚项的一个加权。至于调和参数

的选择，作者提供了一个类似于合成控制中后续推断的循环检验程序。要不要加其他约束，取决于手边的具体应用。

四、统一估计框架下的其他已有方法

作者提出的上述估计框架，在某些条件下，就可以转变为我们比较熟悉的估计方法，如：

（一）DID方法

就是最小化（1）式，但要施加上面第二个和为1的约束，第三个非负约束以及第五个常数权重约束。实际上，这几个约束一上去，不需要数据拟合，可以立马得到

，

这样的话，若处理前只有一个时期，很容易看到平均处理效果为，

一个典型的双重差分形式。

（二）合成控制

Abadie et al.(2010)的原始论文实际上施加了三个约束：第一个无截距约束，第二个和为1约束，第三个非负约束。不过他由于使用了其他特征变量

（处理个体）和

（控制个体），使得(1)式稍微有点变化，即他分两步循环优化，
第一步，对于给定的权重对角矩阵V，最小化下式，

第二步，权重对角矩阵从何而来？最小化下式即可，

（三）约束回归

就是最小化(1)式，但是没有其他约束，譬如截距不必为0，权重不必为正、其和不必为1等。

（四）最优子集选择

他就是从一堆控制个体中选择部分个体进入(1)式优化。数学上，可以写为，

这个模型的调和参数就k，就是选几个控制个体进入模型。实际上很多DID 就是非正式地选择了某个或某几个控制个体进入模型，不如上述方法规范。

Abstract

In a seminal paper Abadie et al (2010) develop the synthetic control procedure for estimating the effect of a treatment, in the presence of a single treated unit and a number of control units, with pre-treatment outcomes observed for all units. The method constructs a set of weights such that covariates and pre-treatment outcomes of the treated unit are approximately matched by a weighted average of control units. The weights are restricted to be nonnegative and sum to one, which allows the procedure to obtain the weights even when the number of lagged outcomes is modest relative to the number of control units, a setting that is not uncommon in applications. In the current paper we propose a more general class of synthetic control estimators that allows researchers to relax some of the restrictions in the ADH method. We allow the weights to be negative, do not necessarily restrict the sum of the weights, and allow for a permanent additive difference between the treated unit and the controls, similar to difference-in-difference procedures. The weights directly minimize the distance between the lagged outcomes for the treated and the control units, using regularization methods to deal with a potentially large number of possible control units.

宜打赏

亲爱的读者，如果您从阅读本文中得到启发，或者受益，请您为本文打赏，以感谢推文者的辛苦工作，鼓励她（他）下一期提供更精彩的推文（香樟打赏直接给每期的推文作者）。

声明

推文仅代表文章原作者观点及推文作者的评论观点，并不代表香樟经济学术圈公众号平台观点。

香樟经济学术圈征稿

香樟致力于提供学术研究公共品，对香樟最好的回馈就是向平台赐稿。联系邮箱cectuiwen@163.com.

香樟经济学术圈

本期小编：张美晨