合成控制法（Synthetic Controls）：可行性、数据要求与方法论

湖经松哥 2022-02-10

展开全文

图片来源：

百度图片（作者Abadie, Alberto）

原文信息：

Abadie, Alberto. 2021. 'Using Synthetic Controls: Feasibility, Data Requirements, and Methodological Aspects.' Journal of Economic Literature, 59 (2): 391-425.

摘要

合成控制方法，可能由于其可解释性和透明性，已被广泛应用于经济学和社会科学的实证研究中。本文旨在为采用合成控制方法的研究人员提供实际指导。文章首先对合成控制估计进行了概述和介绍。主要讨论了合成控制框架作为一种研究设计的优势，并描述了提供可靠估计以及可能失败的情形。文章最后讨论了最近的扩展、相关方法和未来研究的途径。

合成控制法：概述

Athey & Imbens(2017)将合成控制方法称作“过去15年中政策评估文献中最重要的创新”（The synthetic control approach…is arguably the most important innovation in the policy evaluation literature in the last 15 years.）。合成控制方法已经被广泛应用于研究各类政策问题。在学术界之外，合成控制也被各类机构广泛采用。

合成控制方法最初是由Abadie & Gardeazabal(2003)以及Abadie, Diamond & Hainmueller(2010)提出的，旨在估计政策干预的效果。

合成控制方法是基于这样的想法：当观察单位是少量的总体实体时，未受影响的个体的组合往往比任何单独的未受影响的个体提供了更合适的比较。合成控制方法通过数据驱动将选择比较个体的流程正式化。这也为比较案例研究的定量推理模式打开了大门。

对于个体j∈1，...，J+1，个体1接受处理，个体2至J+1是潜在的控制组个体，“控制组库”（donor pool）。对于时间t∈1, ..., T，处理发生前时期：t=1, ..., T_0，处理发生后时期：t=T_0+1, ..., T。估计目标：处理发生后被处理个体的处理效应。当t>T_0时，如式（1）所示：

其中，τ1t代表处理效应，YI1t和YN1t分别代表处理组个体接受处理、假如未经处理的潜在结果。

挑战来源于估计YN1t。需要说明，式（1）允许处理效应随时间变化。

“合成控制”即控制组个体的一种加权平均。如式（2）所示：

此时，处理效应如式（3）所示：

对于权重的选择，分为不同控制组个体的权重选择，以及不同变量间的权重选择。控制组个体间的权重选择方面，Abadie & Gardeazabal(2003)以及Abadie, Diamond & Hainmueller(2010)建议，所选择的权重应使得合成控制组与处理组在事前结果变量的预测值最为接近。也就是说，给定一组非负常数v1, ... , v k，构造合成控制组，

使式（4）最小化：

不同变量间的权重选择方面，可以参照Abadie & Gardeazabal(2003)以及Abadie, Diamond & Hainmueller(2010)建议，选择V，使得W(V)最小化该合成控制对YN1t的平均预测误差（MSPE）：

合成控制法：优势

1.无外推（No Extrapolation）。

因为合成控制权重是非负的，并且权重之和和为1，不存在外推的情况。而回归的权重可能在[0,1]区间之外，即允许进行外推。

2.拟合的透明性（Transparency of the Fit）。

线性回归使用外推法来保证与被处理个体的特征完全吻合，即使未处理个体与被处理个体的特征完全不一样。相比之下，合成控制使被处理个体与提供反事实的未处理个体凸组合之间的实际差异透明化。

3.防止规范搜索（Safeguard against Specification Searches）。

与回归法不同，但与经典的匹配法类似，合成控制法在构造合成控制组时，不需要在研究设计阶段获得处理后的结果。这意味着所有关于设计决策的数据分析，如控制组库中的个体特征或X1和X0中的预测因子，都可以在不知道它们如何影响研究结论的情况下进行。此外，合成控制权重可以在干预发生后、结果出现之前，或在实际干预发生之前计算并预先登记或公布，起到类似于随机控制试验中的预先分析计划的作用，防止规范搜索和p-hacking。

4.反事实的透明性（Transparency of the Counterfactual）。

合成控制使每个比较个体对反事实的贡献变得明确。此外，由于合成控制系数是适当的（proper）权重，并且是稀疏的，它们允许对反事实的性质进行简单和明确的解释。

5.稀疏性（Sparsity）。

从表2和表3的结果可以看出，合成控制权重是稀疏的，即大部分个体权重为0，只有少部分个体起到了作用，但回归的权重却不同。稀疏性对于解释和评价估计的反事实起着重要作用。

对于合成控制法的优势，本文作者总结如下：“在我看来，合成控制方法的最大魅力之一在于反事实估计的可解释性，这源于合成控制估计的加权平均性质和权重的稀疏性。”

合成控制法：环境要求

1.效应的大小和结果的波动性。

如果干预的影响过小，则无法与其他冲击加以区分，特别是当结果变量具有高度的波动性时。包含大量随机噪声的结果变量会增加过度拟合的风险。此时，在应用合成控制之前，最好是通过过滤来消除处理组个体和控制组库中个体的波动。波动带来的挑战只来自于由个体特定因素产生的那部分波动，由同时影响其他个体的共同因素所产生的波动性可以通过选择一个适当的合成控制组来解决。

2.控制组的可用性。

比较案例研究的本质意味着，如果没有合适的比较组，基于这些方法的推论将是错误的。为了获得可用于控制组库的个体，在研究期间，需要有个体未接受与处理组个体相似的干预措施。同时，需要从控制组库中排除任何可能遭受巨大的特异性冲击的个体。

3.无预期。

如果存在预期性的迹象，最好将数据集当中的干预措施回溯到任何预期效果之前的时期，这样就可以估计出干预措施的全部效果。即使干预前的一些时期被错误地记录为干预后的时期，在数据中回溯干预时期也不会造成有偏的估计。原因是，合成控制估计并不限制干预效果的时间变化。因此，几乎不受干预措施影响的时期可能显示出小的或零效果，而随后的时期可能产生大的估计效果。这与使用面板数据模型的许多做法不同，在许多情况下，干预的效果被限制为在干预后的各个时期不变。

4.无干扰。

在研究设计中，可以通过将那些结果可能受到干预措施影响的个体从控制组库中剔除，来强制执行无干扰的假设。请注意，这种做法与第2点“控制组的可用性”之间存在着潜在的矛盾。一方面，最好是选择那些与干预个体在环境上相似的个体（受到相同的区域经济冲击等，但未受到待研究的特定冲击）进入控制组库。另一方面，如果溢出效应很大并影响到地理上相近的个体，这些个体可能会对反事实结果提供有偏的估计。

5.凸面体条件（Convex Hull Condition）。

如果受干预影响的个体在某一特定变量上是“极端的”，可能无法被合成控制组所拟合。此时，一个可能的方法是将结果转化为时间上的差分，或者增长率，或者用相对于干预前平均值的差异来衡量。

6.时间范围。

一些干预措施的效果可能需要时间才能显现出来，或者需要足够大的规模才能在数据中被定量检测出来。

05 合成控制法：数据要求

1.预测因素和结果变量的加总数据。

有时，当加总数据不存在时，可以采用更微观层面数据的加总。

2.充分的干预前信息。

合成控制估计的可信度在很大程度上取决于它能否稳定地拟合干预前受影响个体结果变量的轨迹。因此，在设计合成控制研究时，有关受影响个体和控制组库中个体在干预前的信息是至关重要的。但也要避免时期过长带来的结构性变化。

3.充分的干预后信息。

广泛的干预后信息可以更全面地了解干预的效果，在时间上或是在各种感兴趣的结果变量上。

合成控制法：稳健性和诊断性检验

1.回溯（Backdating）。

回溯是解决干预发生前对结果变量的预期效应的一种方式。在没有预期效应的情况下，同样的想法可以应用于评估具体经验应用中合成控制的可信度，即时间维度上的“安慰剂检验”。

2.稳健性检验。

在合成控制方面，研究设计可能影响结果的两个重要途径是：(i)控制组库中个体的选择，以及(ii)结果变量的预测因素的选择。作为稳健性检验的一个例子，Abadie, Diamond & Hainmueller(2015)将合成控制组中的每个样本逐一单独剔除，结果都是稳健的。如果将一个个体排除在控制组名单之外对结果有很大的影响，而干预前的拟合程度却没有明显的变化，这就需要考察估计值的变化是由其他干预措施的影响造成的，还是由被排除的未受处理的个体的结果受到特别大的特异性冲击造成的。

07 合成控制法：拓展及相关方法

近年来，关于合成控制方法和相关方法的文献大大增加，对于有意应用这些方法的研究人员来说，越来越难以弄清哪里有什么方法。在本节，对于该领域最近的贡献提供了一个简要的指南。其中包括：1.多处理个体（Multiple Treated Units）；2.误差修正（Bias Correction）；3.基于回归的方法和外推（Regression-Based Methods and Extrapolation）；4.矩完成/估计方法（Matrix Completion/Estimation Methods）；5.推断（Inference）；6.其他（Other Contributions）。

结论

合成控制为估计政策干预和其他相关事件的影响提供了许多实际优势。然而，就像任何其他统计程序（特别是那些旨在估计因果效应的程序）一样，结果的可信度关键取决于在应用该方法时的努力程度，以及是否满足背景和数据要求。

关于基于抽样的推断、外部有效性、对模型限制的敏感性、对多种干预措施的估计以及对事件或干预措施影响的渠道的识别等方面的结果，在合成控制文献中很少或没有。

合成控制为估计政策干预和其他相关事件的影响提供了许多实际优势。然而，就像任何其他统计程序（尤其是那些旨在估计因果效应的程序）一样，结果的可信度关键取决于在应用该方法时的努力程度，以及在当下的经验应用中是否满足背景和数据要求。本文强调了这样一个概念：不考虑背景或数据性质的合成控制的机械应用是充满风险的。为此，文章讨论了合成控制估计的方法学基础，及其提供恰当的因果效应估计的条件。文章还描述了在这些条件不成立的情况下如何调整。最后，文章讨论了最近的一些扩展，这些扩展扩大了该方法的适用性、稳健性和灵活性。

相关研究的领域比比皆是，既有方法论的，也有经验研究的。关于基于抽样的推断、外部有效性、对模型限制的敏感性、对多种干预措施的估计以及对事件或干预措施影响渠道的识别等方面，在合成控制文献中很少或没有。最近，人们对合成控制的使用产生了浓厚的兴趣，即在干预措施只能适用于一个或少数个体的情况下设计实验性干预措施。此外，关于合成控制的稳健且有效的计算的成果很少，需要对这种方法在计算方面进行更多的研究。在经验研究方面，经济学家关心的许多事件和政策干预都发生在总体层面，影响到整个总体，如学区、城市、地区或国家。合成控制正是为此而设计，在经济学中具有很多潜在的应用。

本推文由中国经济转型讨论班（CETW）供稿。

Abstract

Probably because of their interpretability and transparent nature, synthetic controls have become widely applied in empirical research in economics and the social sciences. This article aims to provide practical guidance to researchers employing synthetic control methods. The article starts with an overview and an introduction to synthetic control estimation. The main sections discuss the advantages of the synthetic control framework as a research design, and describe the settings where synthetic controls provide reliable estimates and those where they may fail. The article closes with a discussion of recent extensions, related methods, and avenues for future research.

声明：推文仅代表文章原作者观点，以及推文作者的评论观点，并不代表香樟经济学术圈公众号平台的观点。