【经典回顾】交错双重差分：处理效应异质性与估计方法选择

湖经松哥 2022-10-03 发布于湖北

展开全文

图片来源：中国知网

原文来源：刘冲，沙学康，张妍.“交错双重差分:处理效应异质性与估计方法选择”.《数量经济技术经济研究》2022年第9期，p177-204。[网络首发 2022-08-08].

https:///10.13653/j.cnki.jqte.20220805.001.

作者简介

刘冲，北京大学经济学院长聘副教授

沙学康，北京大学经济学院

张妍，北京大学光华管理学院

研究背景

双重差分法是社会科学中进行因果推断和政策评估时最广泛采用的研究手段。我国的很多政策都具有“先行先试”的特点，国内经济学领域采用交错DID的研究设计也因此十分普遍。然而近年来不断涌现的理论文献发现，交错DID有一个潜在问题是存在处理效应异质性（Heterogeneous Treatment Effects），即同一处理对于不同个体产生的效果存在差异，这种差异可能表现在接受处理后的时长或者不同时点接受处理的组别两个维度。在此背景下，采用传统双向固定效应模型估计量（Two-Way Fixed Effect Estimator，以下简称TWFE），无论是静态还是动态估计，都存在潜在偏误。

针对交错DID存在的处理效应异质性问题，本文系统梳理和总结了理论文献中的三类解决方案。通过对三类“异质性—稳健”估计量在应用场景、前提假设和统计量的性质等方面详细阐释和对比，本文结合部分应用文献的使用现状，给出了具体的操作建议。本文还特别指出了三类方法的优势和局限，以期引发更广泛的讨论，避免研究方法的误用。本文希望达到两个目的：一是引发应用研究者对交错DID“异质性-稳健估计量”如何科学使用的探讨；二是让研究者和读者都能够拨开数据和方法的“迷雾”，更好地洞察真实的因果关系，进而提高国内经济学经验研究的可信性和规范性。

主要发现

1. 处理效应异质性问题带来的偏误。在处理效应异质性存在的情况下，利用TWFE无论是静态还是动态估计结果，都存在潜在偏误。一方面，在静态情形下，如Goodman-Bacon（2021）所指出的，即使“平行性趋势”假设满足，TWFE会存在“坏的控制组”的问题，即由于处理时点的差异，较早接受处理的样本会成为较晚处理样本的控制组，从而可能带来估计偏误。另一方面，在动态情形下，TWFE不仅存在“坏的控制组”问题，其每一期的估计系数还会受到跨期交叉污染而变得难以解释，甚至还会面临平行性趋势检验失效的风险（Sun和Abraham，2021）。

2. 三类异质性-稳健估计量。为了解决处理效应异质性带来的潜在偏误，理论界提出了一系列“异质性-稳健”估计量，主要表现为三种解决思路。第一种思路是计算组别-时期平均处理效应（Cohort-Specific Average Treatment Effects on the Treated，CATT），再在组别、时期两个维度进行合理地加权加总。这种方法避免“坏的控制组”进入估计，从而直接避免偏误。第二种思路是使用插补估计量（Imputation Estimator）构造反事实结果估计。其直觉是：首先，利用从未接受处理的样本或尚未接受处理的样本估计出每个处理组个体其每个时期的反事实结果。基于反事实计算个体的处理效应，再进一步加总得到平均处理效应。这类做法需要在给定模型设定的前提下，构造合理的反事实，同样避免了使用“坏的控制组”问题。第三种思路是Cengiz等（2019）采用的堆叠回归估计量（Stacked Regression Estimator）。直觉上看，这种方法为每一个处理组的观测都匹配了从未接受处理或尚未接受处理的观测，进而形成一个数据集，随后将这些数据集堆叠在一起，通过进一步加入组别-个体、组别-时间固定效应进行线性回归。与前两类方法相似，从本质上讲这种做法也是通过避免使用较早接受处理组作为控制组来解决处理效应异质性问题。

3. 三类解决方案的应用建议。针对每种方法核心假设及适用场景的差异，研究者需要结合数据和政策特征选取合理的方法，具体建议如下。（1）在使用“组别-时期平均处理效应”系列方法时，需要格外注意以下方面：第一，当样本量不充足时，这类方法的估计效率将会受到较大影响，要审慎解读估计结果，同时建议汇报这类方法在估计时使用到的样本量；第二，当政策存在退出情形时，Sun和Abraham （2021）、Callaway和Sant’Anna（2021）提出的方法将不再适用，建议采用de Chaisemartin和 D’Haultfœuille（2020a, 2022a）提出的估计量。第三，当样本中不存在“从未接受处理的个体”时，建议谨慎采用Sun和Abraham （2021）的方法。（2）在使用“插补估计量”的相关解决方案时，除了要注意模型设定准确这一假设前提外，还需要考虑：当数据结构较为简单（例如只有简单的政策退出情形，不存在反复进入退出）且不存在对结果产生严重干扰的随时间变化的混杂因素时，使用Borusyak等（2021）或Liu等（2022）提出的FEct方法均可；当存在较为复杂的政策进入退出情形或存在不可观测的随时间变化的混杂因素的干扰，建议采用Liu等（2022）提出的IFEct方法或MC方法。（3）使用堆叠回归估计时，由于该估计量统计性质并未得到证明且使用中会出现数据重复问题，建议研究者谨慎采用堆叠回归估计量进行交错DID估计，可将其作为一种稳健性检验的方式。

4. 异质性-稳健估计量结果对比。本文的数值模拟结果显示，由于处理效应异质性的存在，TWFE的估计会存在潜在偏误；“计算组别-时期平均处理效应（CATT）加权平均”的三种方法的估计效果普遍较好，彼此也十分接近；插补估计量在某些情况下更有效率，但这种有效性基于的假设并不总是成立；堆叠估计量甚至有可能会出现偏误，研究者应当谨慎使用这一方法。对于平行趋势的检验，除了部分方法沿用传统的事件研究图之外，本文还展示了文献中新提出的“等效检验”“组别-时期事件研究图”的检验结果。

给应用研究者的建议

针对交错DID方法应用，本文结合了多篇综述文章（Baker等2022；Liu等2022；Roth等，2022）和应用性工作（如Guriev等，2021；Cantoni和Pons，2021；Kim，2022），除了三类方法的具体建议外，本文还给应用研究者一份更为全面的操作建议：

1. 研究者在进行实证分析之前尽量提供样本中个体接受处理时间的分布图。交错DID引发偏误的关键原因就在于样本接受政策处理的时点存在差异，进而导致“坏的控制组”进入估计中。在开展研究前绘制处理时间分布图有利于直观地判断样本中较早接受处理组、较晚接受处理组和从未接受处理组的分布情况，从而初步判断异质性的严重程度。

2. 研究者应首先使用双向固定效应模型进行估计。TWFE可以作为一个比较基准，用以判断是否存在潜在的处理效应异质性问题及其严重性。建议研究者不仅用TWFE估计平均处理效应，还应采用事件研究法绘制系数图像，获得动态效应的基准估计。

3. 研究者应结合适用场景，使用多种估计量进行实证分析和稳健性检验。在做研究方法选择时，研究者应结合政策和观测数据的特点重点关注以下几个维度：（1）试点政策是不是全面铺开，即数据中是否存在“从未接受处理组”；（2）是否存在政策“退出情形”；（3）“处理状态发生转换”的样本数量是否过少；（4）是否是高频面板数据；（5）是否存在不可观测的随时间变化的混杂因素等等。当然，必须强调的是，由于各种方法的前提假设不尽相同，研究者在稳健性检验中不必过分追求过多使用新方法，而要根据数据和政策的特点来决定。

4. 研究者应根据不同估计量的特点，谨慎解释回归结果。由于包括de Chaisemartin和 D’Haultfœuille（2020a，2022a）在内的多个估计量在估计时会丢失较多样本，因此在应用中，我们可能会发现不同方法在点估计以及置信区间上存在较大差异。此时，我们建议研究者不仅仅要关心估计系数的符号和显著性与TWFE的差异，还要关注估计系数大小的差别，并谨慎解读回归结果。

5. 研究者在使用新的估计方法时要格外关注平行趋势检验的问题。首先，研究者应注意并非所有异质性-稳健估计量都只采用绘制事件研究图的方式进行平行趋势检验，如Borusyak等（2021）采用了F检验。其次，若使用绘制事件研究图的方式检验平行趋势则应注意基期选择，Freyaldenhoven等（2021）建议选择政策发生的前一期作为基期。再次，研究者使用绘制事件研究图的方式检验平行趋势时应谨慎应对时间窗口的选择问题，Baker等（2022）就建议尽量避免对时间窗口进行归并处理。最后，研究者也可以参照Roth等（2022）的建议，在原有的事件研究法基础上增加效力分析和敏感性分析，从而提升平行趋势检验的稳健性。

Abstract

双重差分法是社会科学中进行因果推断和政策评估时最广泛采用的研究手段。然而,近年来不断涌现的前沿文献发现,对于交错双重差分的情形,因存在处理效应异质性,如果采用传统双向固定效应模型可能会造成严重的估计偏误。为此,理论计量领域诞生了多种异质性—稳健的估计方法,但这也给应用者在实践中带来困惑,即如何结合应用场景选取合适的估计方法,以及如何理解和验证对应的前提假设等。本文详细阐释了处理效应异质性导致双向固定效应估计量出现潜在偏误问题的根源,总结了三类异质性—稳健估计方法的经济学直觉,详尽对比了这些方法的核心假设、应用场景和估计量性质,并通过模拟数据检验了估计效果,同时对验证“平行性趋势”假设进行了深入讨论。最后,针对国内当前的使用现状,本文结合应用案例和现有综述文章,为应用研究者提供了操作建议。

声明：推文仅代表文章原作者观点，以及推文作者的评论观点，并不代表香樟经济学术圈公众号平台的观点。

香樟经济学术圈征稿

“分享”是一种学者的人文情怀，香樟经济学术圈欢迎广大订阅读者（“香粉”）向公众平台投稿，也诚邀您加入香樟推文team。生活处处皆经济，经济处处现生活。如果你或者身边的朋友看了有趣的学术论文，或者撰写了经济政策评论，愿意和大家分享，欢迎投稿（经济金融类），投稿邮箱：cectuiwen@163.com。如果高校、研究机构、媒体或者学者，愿意与平台合作，也请您通过邮箱联系我们。投稿前请在搜狗的微信搜索里搜索已有图文，避免重复。