【原】前沿, 合成双重差分法SDID方法介绍和示例, 附code和数据！

计量经济圈 2022-05-31 发布于浙江

展开全文

关于DID，参看：1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏！2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文！3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢？4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习，5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据，6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章，7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码！8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了！

关于SCM，参看：1.合成控制法创始人如何用SCM做实证呢？这些规定动作一个都不能少！2.关于合成控制法SCM的33篇精选Articles专辑！小组惊动了阿里巴巴！3.再谈合成控制法SCM, 帮你寻找因果推断控制组，4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响!5.合成控制法与HCW方法, 谁能够走得更远？6.广义合成控制法gsynth, Stata运行程序release，7.广义合成控制法gsynth, 基于交互固定效应的因果推断，8.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，9.合成控制法什么鬼? 因果推断的前沿方法指南，10.用回归控制法HCW(附程序和数据)评估各国经济刺激计划的影响, 真是一个好主意！11.计量院士为你讲解回归控制法HCW的操作, 并配上自己写的一篇范文！12.HCW面板数据政策评估方法, panel数据构造对照组，13.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习！14.中文刊上用断点回归RDD和合成控制法SCM的实证文章有哪些？不看至少需要收藏一下！15.用合成控制法, 机器学习和面板数据模型开展政策评估的论文！16.分享一篇使用合成控制法SCM进行实证研究的文章的代码

正文

关于下方文字内容，作者：1.alphabeta群友，计量社群；2.钟秉睿，中央财经大学财政税务学院，通信邮箱：zunity@163.com

作者之前的文章，1.Athey&Imbens: 随机实验的计量经济学，2.机器学习和经济学, 技术革命正在改变经济社会和学术研究

作为经济学实证研究的重要工具，双重差分法（Difference-in-Difference，DID）的前沿创新一直以来都备受关注。本文旨在通过代码和数据介绍一种由 Arkhangelsky等人（2021） 提出的方法，它将经典双重差分法和合成控制法的思想有效结合，产生一种新方法——合成双重差分法（Synthetic Difference-in-Difference，SCM），详情参看：合成双重差分法DID的视频和Slides。

在估计外部冲击或政策变化的影响时，研究者常用合成控制法（SCM）与双重差分法（DID）去评估该冲击或政策变化的影响。在实证中，若处理组拥有大量个体且数据满足平行趋势假设时，通常使用DID方法；若处理组仅含有一个个体（或非常少个体），无法满足平行趋势假定时，则可以使用SCM方法。正如我们前面已经说过的那样，DID与SCM两种方法实际上非常相关，都是在寻找一个最优的参照组或者说控制组，然后求出政策处理效应。

既然如此，Arkhangelsky等（2021）干脆将这两种方法结合起来，充分利用他们各自的优点估计政策处理效应，从而形成了一种新的合成双重差分法（SDID）。考虑到政策实施的分布在地区与时间上并不是随机出现的，SDID不仅通过个体权重（unit-specific weights）找到与处理组相近的控制组个体，还通过时间权重（time-specific weights）找到与政策后处理期（post-treatment）相似的政策前处理期（pre-treatment），并分别赋予他们更大的个体权重和时间权重。

SDID实现了合成双重差分估计方法，以及 Arkhangelsky 等（2021）所述的一系列推断和绘图程序。合成双重差分基于面板（按时间分组）数据，其中某些个体受到政策处理，其余个体未受政策处理。SDID程序通过计算处理个体和合成控制个体之间的双重差异得到处理效应，其中合成控制个体作为未处理个体（个体权重）和政策前处理期（时间权重）的最佳加权函数。

一、方法概述

1.文献摘要

Arkhangelsky等人在一篇2021年发表于AER的文章中提出了一个关于合成控制（SC）方法的新视角——将其视为一个具有时间固定效应和样本个体权重的加权最小二乘回归估计量。在这个视角下，作者提出了一个具有双向（个体和时间）固定效应以及个体和时间权重的一般性估计策略，它可以被解释为标准双重差分（DID）估计量的个体和时间加权版本。

与SC和DID估计量相比，合成DID估计量具有一些优良的特性，其中最重要的是双重稳健性：在给定正确、清晰设定的固定效应模型时，SDID估计量在各种加权方案下都是稳健的；当基础固定效应模型设定错误，而真正的数据生成过程涉及一个更一般的低级别数据结构（如潜在的因素模型）时，SDID在适当设定SC的惩罚权重时是稳健的。

此外，作者还给出了可以支撑基于加权回归的标准推断的结果，文中进一步将个体和时间加权的因素模型纳入一般性的讨论中。

总之，文章提出的方法把新的SDID估计量和原来的SC估计量放在同一个加权回归框架中，将SC方法与回归方法联系起来，为适应时间不变量和时间变化的协变量提供了替代方法，也使从双向固定效应模型到因子模型的一般化成为可能。

图1 上述文章的AER发表版本

接下来，我们主要展示SDID方法的基本逻辑和实际应用，故对数学推导、基本原理等不做赘述，感兴趣的学者可以自行浏览原文。

2.方法介绍

本文对SC方法提供了一个不同的视角，并提出了一个具有改进偏倚特性的新估计量。首先，本文表明，SC估计量可以被看作是一个具有个体特定权重的加权最小二乘回归估计量，其中回归模型包括时间固定效应。

本文建议将个体固定效应添加到标准SC的回归表示中，以增加灵活性，并添加时间权重，以确保加权的时期更接近于本文正在估算反事实的时期。本文表明，这导致了一个双重加权的，或局部的，标准差分（DID）估计量，称由此产生的估计量为合成双重差分（SDID）估计量。

本文回归设置的一个有趣之处是，它可以自然地推广到有多个处理个体和多个处理期的情况。在这种情况下，本文可以选择控制个体的个体权重，以平衡处理前期间接受处理个体的平均数，并选择处理前期间的时间权重，以平衡控制个体的平均处理后结果。回归设置也可以很容易地容纳因个体和时间而异的协变量，将它们纳入回归函数中。在标准的DID设置中无法容纳的个体特定但时间不变的协变量，在这里可以通过调整个体权重来容纳，以便权重也能平衡这些个体特定的协变量，同样，对于所有个体共同的时间变化的协变量也是如此。

二、软件实现

SDID方法提出后，来自University of Chile的Damian Clarke和 Daniel Pailañir迅速地编写了相应的stata程序包，命令为SDID，具体语法如下：

SDID depvar groupvar timevar treatment, vce(vcetype) [options]

SDID命令完全实现了Arkhangelsky 等（2021 年）描述的方法过程。SDID命令需要一个因变量、一个处理组（例如州、国家）的指示变量、一个时间变量和一个二元处理指示变量作为参数。基于个体和时间的面板必须高度平衡，并且不包含关键变量的缺失值，因为最佳权重是根据政策处理前期间的全覆盖计算的。

Arkhangelsky 等 (2021)的大部分内容侧重于一刀切的案例，但其附录 A列出了政策交错实施情况下的估计程序，其中处理组个体可以在不同时间受到政策处理，而控制组个体从未受到政策处理。SDID 在一刀切和多期政策点的情况下对政策处理效应进行无缝估计。在后一种情况下，不是计算单个个体和特定时间的权重向量，而是针对每个政策实施期计算最佳的个体和特定时间的权重向量。在政策交错实施情况下报告的处理组的平均处理效应 (ATT) 是 Arkhangelsky 等 (2021)描述的加权估计值。

SDID中的推断基于自助法（bootstrap法）、刀切法（jackknife）或安慰剂检验程序。每个过程都在groupvar层面聚类，并遵循 Arkhangelsky 等（2021 年）提出的精确算法。具体来说，自助法推断遵循算法 2，刀切法推断遵循算法 3，安慰剂推断遵循算法 4。每个推断过程的适用性取决于精确的数据结构。例如，bootstrap 和jackknife 程序不适用于单个处理组个体，而安慰剂推断需要控制组个体比处理组个体多 1 个。在政策交错执行的情况下，在整个处理组的平均处理效应上开展重新抽样推断，这为总体处理效应的估计提供了一个有效的标准误(在Arkhangelsky等(2021)列出的大样本条件下)。在非常大的数据库中，自助法过程的计算成本可能很高，在这种情况下，刀切法将提供一种(在计算上)更可行的推断过程。

SDID还允许以多种方式在模型中包含协变量，若需要，还可以提供图形输出，记录最佳权重，以及合成双重差分框架下的匹配处理和综合控制趋势。与协变量和图形选项相关的详细信息将在下面详细描述。

可选项：

vce（vcetype）vcetype可以是bootstrap, jackknife, 或 placebo

covariates（varlist，[type]）允许在计算合成反事实时包含协变量。可选项是“optimized”（默认设置）或“projected”（在某些情况下更可取）

seed(#) 将随机数种子设置为#

reps(#) bootstrap和placebo推断的重复次数

graph 如果指定了此选项，将以下图形式绘出：

g1_opt（图形选项）修改单位特定权重图的外观。这些选项将调整基础散点图，因此应与双向散点图一致。

g2_opt（图形选项）修改结果趋势图外观的选项。这些选项将调整基础折线图，因此应与双向折线图一致。

graph_export(string, type) 图表将分别保存为各单位特定权重和结果趋势的权重YYYY和趋势YYYY，其中YYYY指每个处理期。将为每个处理期生成两个图表。如果指定了此选项，则必须指定类型，该类型引用有效的STATA图表类型（例如“.eps”、“.pdf”等）。（可选）可以指定存根，在这种情况下，它应当写在在导出的图形名称之前。

unstandardized 如果包括控制措施，并且指定了“优化”方法，则在找到最佳权重之前，控制措施将标准化为Z分数。当控制变量具有非常高的离散度时，这避免了优化问题。如果指定了非标准化，则只需以其原始单位输入控件。应小心使用此选项。

1.一刀切政策的情况：

该政策只在加州的1989年及之后年份发生，因此加州1989年后自然成为处理组，而其他州自然成为控制组。

 webuse set www.damianclarke.net/stata/ 

. webuse prop99_example.dta, clear

使用 SDID 进行估计，导出权重和趋势图：

.sdid packspercapita state year treated, vce(placebo) seed(1213) graph g1_opt(xtitle("")) g2_opt(ylabel(0(50)150, axis(2)))

权重图

趋势图

2.政策交错执行的情况：

基于议会性别配额、议会中的女性和孕产妇死亡率的政策交错实行的示例（Bhalotra 等，2020）。

例如，阿尔及利亚2012年后进入处理组，吉布提2002年后进入处理组，约旦2003年后进入处理组。

.webuse set www.damianclarke.net/stata/ 

. webuse quota_example.dta, clear

在没有协变量的情况下执行SDID估计，使用自助法标准误。

. sdid womparl country year quota, vce(bootstrap) seed(1213)

如果指定协变量，处理和控制组个体将根据合成双重差分过程中的协变量进行调整。可以指定类型，这表明协变量调整将如何发生。如果类型被指定为“优化”（默认），这将遵循 Arkhangelsky 等(2021)中描述的方法，SDID将应用于回归调整后所有个体的残差。然而，有时会出现问题（请参阅 Kranz，2021 年），并且如果协变量具有高离散度，则对优化也很敏感。因此，实施了一种替代类型（“投影”），包括基于仅在未处理组中估计的参数进行回归调整。这种类型遵循 Kranz, 2021 (xsynth in R) 提出的程序，并且在某些情况更为稳定（有时速度更快）。

以投影方式使用协变量执行SDID估计。

. drop if lngdp==.

.sdid womparl country year quota, vce(bootstrap) seed(1213) covariates(lngdp, projected)

三、实例

Arkhangelsky等人（2021）在文章中提供了一个实证案例，使用Abadie等人于2010年发表的（参见，合成控制法创始人如何用SCM做实证呢？这些规定动作一个都不能少），利用合成控制法的知名论文Synthetic control methods for comparative case studies: Estimating the effect of California’s tobacco control program的数据集进行了采用SDID估计的复现，以表明SDID方法的有效性。

Abadie（2010）基于美国加州“99号提案”通过、实施烟草管控的背景，研究控烟措施的有效性。其特殊之处在于，整个研究中只有一个处理组（加州），应用标准DID时平行趋势检验难以通过，研究者最终采用了合成控制法以跨越这一阻碍。

首先，文章给出了在SDID和SC方法下的各州均方根误差，其中加州以蓝色显示：

图1 均方根误差的对比

可以发现，就预测精度而言，SDID方法明显优于SC和DID方法，SC优于DID方法：在图2中，几乎所有RMSE对都位于45度线以上，表明几乎所有状态下，基于SDID估计值的平均RMSE都低于基于SC估计值的平均RMSE。与SC的状态均方根误差相比，SDID的状态均方根误差的中值改善了15%（与DID相比，相应改善了50%）。

我们可以通过比较提前一步预测的轨迹Lˆit与真实的轨迹Yit来进一步了解不同方法的行为。我们看到，当一个状态不能很好地适应其他状态的凸包（例如犹他州）时，SC难以解决该问题，然而，当一个州的时间模式与平均时间模式不匹配时（例如，在阿拉巴马州），DID表现不佳。我们发现，SDID在后者适用的州（如加利福尼亚州）表现优于SC，而在后者不适用的州（如犹他州）表现仍然稳健。

进一步地，本文给出了仿真结果（Simulation Results）如下图（使用x轴所示年份之前的所有年份作为训练数据，预测选定州的人均吸烟率。真正的年人均吸烟量是黑色的。SDID估计值为红色。SC估算值为蓝色。DID估算值为蓝绿色。）：

图2 各州的仿真结果

如上结果直观地说明了SDID的优越性：既可以保证处理效应的准确识别，也可以使样本满足平行趋势假设。

而STATA程序包的作者也给出了复现Arkhangelsky等人（2021）研究的示例，参见www.damianclarke.net/stata/中的prop99_example.dta。具体命令如下（需安装sdid命令）

webuse set www.damianclarke.net/stata/

webuse prop99_example.dta, clear

sdid packspercapita state year treated, vce(placebo) seed(1213) graph g1_opt(xtitle("")) g2_opt(ylabel(0(50)150, axis(2)))

得到下图：

**合成双重差分法Synthetic difference in difference
**一刀切政策的情况。该政策只在加州的1989年及之后年份发生，因此加州1989年后自然成为处理组，而其他州自然成为控制组。
webuse set www.damianclarke.net/stata/
webuse prop99_example.dta, clear
**使用 SDID 进行估计，导出权重和趋势图：
sdid packspercapita state year treated, vce(placebo) seed(1213) graph g1_opt(xtitle("")) g2_opt(ylabel(0(50)150, axis(2)))
**政策交错执行的情况。基于议会性别配额、议会中的女性和孕产妇死亡率的政策交错实行的示例（Bhalotra 等，2020）。
webuse set www.damianclarke.net/stata/
webuse quota_example.dta, clear
**在没有协变量的情况下执行SDID估计，使用自助法标准误。
sdid womparl country year quota, vce(bootstrap) seed(1213)
**以投影方式使用协变量执行SDID估计。drop if lngdp==.
sdid womparl country year quota, vce(bootstrap) seed(1213) covariates(lngdp, projected)