文章目录
1. 引言事件研究模型(Event Study)是一种强大的计量经济学工具,用于估计动态处理效应 ◇ 劳动经济学中最早使用事件研究模型的论文之一(Jacobson、LaLonde 和 Sullivan,1993),试图估计失业后的收入损失: ![]() x轴:以事件来衡量,零时事件被称为“Treatment”——改变未来的情况/政策 y轴:每个时期相对于基准期的比较收入 ◇ 该图还揭示了事件发生之前的模式 理想情况下,事件发生之前的线是无趋势的,趋势表明事件可能是预期好的,或者有其他因素正在发挥作用 裁员前的盈利恶化的潜在原因: ① 行业产出的需求下降———影响事件发生之前的收入——最终导致失业 ② 失业的发生被提前预知——导致员工灰心丧气,减少劳动力供应——导致事件发生前的趋势 经济学中的事件研究模型始于金融应用 最早的例子是Dolley (1933a, b),他研究了股票分割对交易活动、股息支付率和市场回报的影响 近年来使用事件研究方法的论文数量急剧增加,并在 2012 年左右出现拐点 通常,事件研究模型是在简化形式的“治疗效果”背景下进行估计的 在本文中,作者讨论了事件研究模型中的决策范围,目标是提高研究人员、教师和消费者对这些模型的理解 2. 事件研究模型的两个关键要素2.1. 估计方程事件研究模型的传统方法: ![]() · :事件发生在样本日历日期 t 的 j 期前 · :事件发生后的系数捕捉了事件处理的动态效果;事件发生之前的系数提供了安慰剂测试 · :确定估计事件研究项的终点 · :个体与事件的双向固定效应,控制在个体或时间水平上变化的混杂遗漏变量 · :其他潜在影响的因素 有时事件会发生在与数据不同的聚合层面上 ① 使用聚类标准误,在这种方法中可以实现个体层面的协变量的控制 ② 对数据进行加权汇总,并在汇总级别运行模型 2.2. 数据结构在事件研究使用的面板数据中,可能有一个事件(基本模型)或多个在特定日期发生的事件(更复杂的模型) 两个关键问题决定的不同的数据结构 ① 是否存在“从未被处理过”的单位? ② 不同单位的处理日期是否存在(很大)差异? ![]() · N/A:无法将事件的影响与日历时间内发生的其他混杂因素分开,因此无法识别处理效果 · DiD-type:从未处理过的单位有助于识别跨日历时间的反事实结果的变化 事件研究规范是标准双向固定效应DID的概括: 处理效果为处理组的随时间的变化与未处理组的随时间的变化之间的差异 · Timing-based:所有单元皆被处理但时间各不相同(例如不同地区在不同时间的相同政策冲击) (1)事件的发生是随机的,较早或较晚接受处理的单位可以相互作为对照 (2)在该数据结构中,研究人员会忽略日历时间固定效应和单位固定效应 EX:Chetty等(2014)追踪了工作过渡到养老金固定缴款份额更高的工作的丹麦工人 它们的可信度来自三个因素: ① 先验预期,即事件发生前的结果提供了合理的反事实 ② 原始数据中明显平坦的处理前趋势 ③ 事件发生时的明显跃变 · Hybrid:它包括“处理单元和控制单元的比较”和“事件时间”两种识别来源 Ex:Jacobson、LaLonde 和 Sullivan (1993) 汇集了在不同日期失业的工人以及从未失业的工人的数据 一种非正式的比较,目前仍没有较为正式的方法: Hybrid 与 Timing-based可以进行比较,以了解不同的变化源是否产生相似的估计 在进行事件研究时,向读者明确数据结构、展示样本中不同事件时间的观测值分布非常重要 ![]() 如果使用的是Hybrid/Timing-base,则应让读者了解样本中事件日期的变化 ![]() ![]() 2.3. 参数限制事件时间、日历时间和事件日期通过 j = t − Ei 链接,可能产生多种共线性 我们需要对这些参数进行以下3类限制 ① 面板固定效应参数的标准限制 ② 有助于定义我们想要的反事实的限制 ③ 解决多重共线性问题所需的潜在额外限制 系数 γ 估计了处理后 j 个周期的处理效应,这种效应需要参考特定的反事实来定义 ① 选标准化假设:处理前是处理后的对照组 选择特定的预处理事件时间,并将相应的系数标准化为零 () ② 标准化假设:未处理组可以作为处理组的对照组 包含所有事件时间虚拟变量,剔除单位固定效应() 不同数据结构中的限制 DiD ① 剔除截距 ② 剔除一个单位固定效应 ③ 将事件时间系数(“参考周期”系数)归一化为零 Timing-based 基于需要估计一个或多个额外参数,因此需要一个或多个额外的限制 不同事件时间的单位类型增加时,需要识别的参数数量不变,但额外的非共线观测增加,所需参数限制的数量减少 ① 随着最小间隙的增长,信息减少(需要更多的参数限制) ② 在3个事件的数据结构中,当内部事件时间刚好偏离范围的中点(1个时间段)时,信息跃变到”最大“ ③ 更多的单位类型通常会有所帮助 ![]() 根据第3个事件日期,计算所得的X矩阵的秩与模型中的参数数量之差为所需的额外参数限制的数量 实现额外的必需参数限制 ① 避免软件对共线变量的自动剔除,仔细检查回归输出 ② 将尾部的几个处理变量分组合并 使用该方法需要确保不存在不受控制的潜在趋势、以及处理效应本身无趋势 ③ 更温和的方法可以将参数限制集中在事前系数 用cnsreg在Stata中实现参数限制 实现参数限制的一种方法是删除相关变量 作者介绍了一种替代方法”cnsreg“,优点是可以确保Stata不会drop意外的共线项 #以线性约束的形式定义参数限制(将事件时间-1、-2设为参考期) 模型是否需要额外的限制并不总是显而易见,我们应记住: ① 这些不仅仅是形式——处理效应系数直接取决于所施加的限制 ② 这些限制至少部分是不可检验的 ③ 我们希望这些限制尽可能没有争议并且“显然是正确的” ④ 由于某些事件研究数据结构的“多重共线性”性质,主要兴趣估计可能对这些额外的限制出乎意料地敏感 ⑤ 杂散干扰可能会以意想不到的方式在模型中传播 ⑥ 有时需要采用超出最低必要限度的额外限制 事件研究应当清楚的报告: ① 每组虚拟变量(时间、单位类型或单位)的类别数量,事件研究系数的数量,包括可能的总数和实际估计规范中的数量 ② 我们直接,或通过删除项对估计施加的约束 ③ 对数据结构中变异性的直接评估(计算X矩阵中相关比例的秩) 3. 事件研究规范的选择本节概述了估计事件研究模型时要做出的一些主要规范选择,并讨论了所涉及的权衡 3.1. 事件前参考期的选择常见的选择是使用“处理前1期”作为归一化()——较为盲目 更好的做法:对合理的事件前窗口做出判断 ① 平衡“足够接近成为适当的反事实基线”和“更多的数据允许更精确”的考虑 ② 所有的事件虚拟变量都可以被包含在内 ③ 将系数限制为在前期窗口内平均为零 时间前窗口期的选择没有硬性规定 ① 只选择事件前1期:可能会带来额外的统计噪声 ② 随着时间前窗口期的扩展:不适合反事实估计的时间段可能会被包含在内 上述两者的权衡亦可以用来判断参考期的选择 将多个事件时间归一化为0对事件研究图有2个影响 ① 整个系数模式向上或向下移动,同时保持相同的形状 ② 标准误会明显更小(单个时间段作为参考的模式存在由噪声驱动的额外不确定性,这往往会使标准误差更大) ![]() 左边的图使用了更常见的事件研究归一化,即-1项的系数等于零 右图使用了推荐的事件研究限制,即参考期内的平均系数为零 我们需要评估系数的总体趋势,而不是检查逐点系数及其与零的差异! 事件前趋势会因参考期的不同而发生改变 我们需要检查事件前的总体趋势。这些系数有明显的稳步下降趋势 更广泛的参考周期归一化,避免了这些数据的损失 ![]() 事件前发生的下降趋势有时被称为“Ashenfelter’s dip,”(Ashenfelter,1978) 这种趋势可能是由与事件捆绑的某些流程所驱动 因而具有趋势的时期并不是理想的参考基期,它实际上是处理期的一部分 EX:在 Jacobson、LaLonde 和 Sullivan (1993)的研究中 中,“裁员前 5 年或以上”作为参考期 在TIming-based数据中,两端使用“end-caps”的警示: Timing-based 数据结构中,没有控制组,附加了更多约束 仅来自一类数据,估计结果受噪声扭曲的影响更大 添加事件前趋势为0的约数条件是作者推荐的 ![]() 3.2. 不止于处理效应的估计作者建议分别报告每组样本的实际和反事实平均结果,以求更接近原始数据 该汇报允许读者评估单位类型在处理状态不变期间是否经历平行趋势 DiD 数据: 左图:估计的(蓝色)和真实的(绿色)处理效应; 右图:处理组(蓝色)和对照组(红色)的原始平均值;反事实未处理预测(橙色) 反事实未处理预测=处理组原始平均值-估计的处理效应() ![]() Timing-based 数据: 两个处理组,一个处理时间为8,一个处理时间为12 ![]() 3.3. 控制组的选择:选择与再加权从未被处理过的控制组可能不是处理组的良好对照 Ex:处理组与对照组的未来收入潜力有机质性的不同,从未被解雇的人可能无法为接受处理的人提供良好的反事实结果 这个对照组可能会使裁员的影响看起来比实际情况更严重 ① 一部分控制组样本可能因不具备代表性或经受过特殊的冲击而被删除 Ex:若处理组都属于大中型城市,小型城市的控制组被建议剔除 ② 对于事件前时段,可以检查对照组和处理组之间的平行趋势 ③ 可以使用协变量来观察处理组和控制组在多个维度上的相似度 ④ 研究人员可以在进行估计之前使用重新加权或匹配程序 (1) 对对照组进行重新加权,有助于其协变量对处理组更好的匹配 Ex:估计跨县一阶段以获得倾向得分(成为处理县的概率),重新衡量对照县权重(Goodman-Bacon 和 Cunningham,2019) (2) 基于可观察的协变量,为每个处理组个体选择一个或多个从未处理过的“匹配项” 为“匹配项”分配伪事件时间所涉及的权衡仍无系统研究 (3) 对于Hybrid数据,可以选择剔除未经处理的数据,转而使用Timing-based策略 优点:“处理时间随机”的假设比“控制组可以告诉我们跨时间的反事实变化”的假设更令人信服 缺点:数据量的减少可能会降低统计能力,增加参数限制的需求 汇报结果对于“never-treated”的单位的处理方法的敏感性是很有意义的 3.4. 事件窗口的选择除非数据窗口受限于数据可用性,研究人员需要决定事件窗口 更长的窗口期可以①让我们看到动态处理效应更长期的变化,②更长的窗口有助于估计复杂模式下的事件前系数 主要的竞争性考虑: 我们理想的认为所有是由同一组数据估计的 Ex:事件发生在 1980-1986 期间;结果(收入)数据在 1974-1986 期间观察; 的系仅能由1980和1981年的样本进行估计 存在问题: ① 若早期处理组与晚期处理组之间存在系统性差异,会对系数的解释形成挑战 ② 由于可用于识别远期系数的样本量过少,会造成统计效能的损失 向读者展示事件的时间分布,平衡识别系数的样本,十分必要 解决方法: ① 通过数据设置直接解决:10年的时间窗口期两侧至少具有20年的数据,每个都可以有一组完全平衡的样本 ② 在数据不允许的情况下,提供稳健性检验(如更宽的事件窗口期) 3.5. 对端点特别注意j ≤ −m 或 j ≥ n的事件窗口外观测值需要被认真处理 ① 创建并包含尽可能多的事件虚拟变量,直接估计每个 这种方法需要数据具有在日历时间上平衡的处理和未处理单位 ② 传统事件研究方程中,创建“end-cap”变量。 “pre” 端点和其之前的数据被赋予一个公共虚拟变量 (“post”端点之后的数据类似) Schmidheiny 和 Siegloch(2023)推荐并称这种方法为“binning” 若存在趋势性反事实和趋势性处理效应,“post-end-cap”的加入需要慎重考虑 ③ 删除事件日期在我们感兴趣的主要窗口之外的观察结果 被剔除的数据可能会削弱统计算力 对于Timing-based 数据,日历时间中的平衡和事件时间中平衡不可同时拥有 极端将根据特殊样本进行估计,作者认为此种方法存在风险 ④ 讲这些观测点汇集,并作为事件未发生时的参考 同一组参考中不应同时包含“post-end-cap”和“pre-end-cap”作为参考 同一组参考中不应同时包含“”和“pre-end-cap”作为参考 Ex: Figure1 权衡: 在图像汇报中,端点有时看起来与图表的其余部分略有偏移 在图表中包含此类端点可以更全面地了解模型,帮助诊断规范或数据问题 需要明确决定如何处理端点并告知读者 绘制端点系数,并在图中(无论是否使用不同的符号)注释这些系数与其他事件研究系数的差别 3.6. 汇集事件时间以获得统计功效众多的待估计关键系数需要大量数据支撑,许多研究中中,估计系数的置信区间都相当宽 可以将两个或多个相邻事件时间虚拟变量汇集在一起,代替单期事件时间虚拟变量包含在模型中 优点:平衡了灵活性与统计能力 风险:合并可能会掩盖实证结果的特征 如果进行汇集,最好同时汇报非汇集的模型估计结果作为稳健性检验 汇集事件时间的方法: ① 合并相邻系数等同 或 ② 将事件研究系数限制在点之间的样条函数上 (对点进行某种平均,但允许灵活的函数形式) 风险:如果应用的模型不够灵活,则存在错误描述处理效应模式的风险 应当允许预处理阶段和处理后阶段的样条线条终端/跳跃 4. 事件研究的趋势问题趋势可能会以两种不同的方式给事件研究带来问题 ① 处理组和对照组可能遵循不同的发展趋势——混淆估计的处理效应 Ex:Figure1 中趋势在事件发生前已经很明显 ② 处理效应可能随时间变化 虽然事件研究模型的目的本就是考虑动态处理效应,但在某些估计规范下会产生问题 4.1. 以事件前系数诊断趋势适用于DiD和Hybrid数据,通常是通过检查事件前系数图来非正式地完成 ① 对于Timing-based 数据: 由于事件时间、日历时间和单位固定效应的多重共线性,难以识别线性趋势(Borusyak、Jaravel 和 Spiess,2022) 建议将一个额外的预处理系数标准化为零,以观察其他预处理系数的的视觉或统计上的非线性 Schmidheiny 和 Siegloch (2023) 认为,使用end-cap可以识别Timing-based数据中的事件时间系数,恢复检查事件前趋势的能力 ② 预处理周期太少,则可能很难区分实际的预趋势和统计噪声 对于“少”没有硬性规定(3个或更少),也取决于这些预处理系数的变异性和明显趋势 一个简单方法:添加更多的预处理周期 Dobkin 等(2018) 采用了一种更加结构化的方法:在显示事件研究系数的图形上绘制参数模型的线性预趋势 使用前趋势作为诊断工具存在一些潜在问题 ① 将轻微的趋势看做为“0”会导致测试前偏差(Roth,2022) 即使是无法通过视觉或统计检测到的轻微前趋势,也可能对估计的处理效应产生有意义的影响 如果我们对趋势的存在足够确定,不论其是否明显,我们都应始终控制该趋势 他还对趋势控制方法进行了更复杂的扩展,使研究人员能够在对趋势函数形式的较弱假设下进行研究 ② 基础模型指定错误,预先趋势可能会出现偏差 当早期处理组比中后期处理组具有更大的处理效应,这种处理效应的差异可能导致估计的事件前系数出现(虚假的)明显趋势 De Chaisemartin 和 D’Haultfœuille (2022) 提出了一种处理前趋势估计器,对于具有不同处理效应的不同单位类型具有稳健性 4.2. 控制特定单位趋势通过包含与单位(例如州)虚拟变量交互的连续时间变量来控制特定于单位的趋势 控制特定单位的趋势,旨在消除可能使估计结果产生偏差的具有趋势的遗漏变量影响 使用特定单位趋势与使用处理前趋势的权衡: ① 控制单位趋势改变了反事实思维实验 相对于参考期的结果,扣除了参考期与现期之间反事实的潜在线性趋势 ② 由于反事实现在控制了这些趋势,前期趋势应该看起来很平坦,失去预趋势提供的基本证伪测试 添加单位趋势控制可能造成“变量太多”和“多重共线性”的问题 意味着有必要(至少)再添加一个附加参数限制(软件自动删除变量是不谨慎的) 常见的选择是施加两个事件系数相等 这一限制的实施可能会使估计发生变化 DiD 数据: 添加一个交互项,由于共线性的存在,需要补充一个新的约束 的估计结果会因附加限制的不同而不同 ![]() Timing-based 数据: 添加一个交互项,允许较晚被处理的单位具有不同的线性时间趋势 将在公式(1)中的RHS变量上进行回归: 是j的二次函数,是t的反二次函数,基于单位类型水平移动 控制单位线性趋势可以在和中引入二次关系 即使参数限制是“真的”,来自模型误差的噪声也会加载到限制上,产生错误反事实 模型1、3和4中的参数限制均与真实模型一致,结果取决于真正的处理效应形状 ![]() 在处理Timing-based数据的线性趋势控制时,要格外谨慎 ![]() 当有趋势和趋势控制时,更接近“原始数据” 在数据生成过程中,处理组于对照组有不同的预先存在的时间趋势,处理效应亦随时间增长 (1)DiD ① 没有趋势控制的模型:事件前系数可以用于判定趋势问题的存在,该趋势导致处理效应估计有偏 ② 施加了“前趋势平坦”的约束:有助于事件前系数的估计,但对处理效应的估计依旧糟糕 对的单纯控制,并不能解决趋势带来的问题 ③ 首选规范:添加特定单位的趋势变量,以及“前趋势平坦”的约束 ![]() (2) Timing-based ① 不控制任何趋势,识别限制的形式是事件前合并终点,以及非合并的事件前平均系数为0的标准化 ② 控制特定单位趋势,在①的基础上增加了“事件前系数为0趋势”的约束 ③ 在②的基础上添加另外两个事件前系数约束 ![]() 特定单位趋势的计算问题 “部分剔除”特定单位(或特定单位类型)的截距和趋势: ① 仅使用单位的观测样本,对公式(1)中的每个变量在上回归,提取残差 ② 将残差代入事件研究模型,不需要对时间趋势再做任何调整;需要注意施加与①中相同的参数约束 局限性是它控制“总体趋势”而不是“前趋势” 可以修改为仅部分排除前趋势:在①中仅根据事件前一段时间内的数据来估计 使用该模型在整个时间段内进行预测(和残差)(Goodman-Bacon ,2021b) 超越线性的单位趋势 ① 更高阶多项式的趋势,允许更大的灵活性,有助于避免将长期趋势解释为处理效应 但这是一种数据匮乏的方法,需要添加额外的参数限制 存在过度控制的风险,产生有偏估计,或效应基于数据中的特质而失去普适性 ② 控制在单位水平上定义的协变量,与时间上的线性或高阶多项式趋势相互作用 作者也并不了解评估这些替代性方法的价值与风险的指导方针 4.3. 趋势与处理前趋势处理效应也可能存在趋势性,估计模型需要同时符合事件前趋势和处理效应趋势 当我们的参数限制包含事件后 end-cap 则可能会出现 估计有偏的情况 end-cap 迫使期内的所有效应都相同 (DiD是一种极端情况) Wolfers (2006)提出了一种改进事件后时期事件研究规范的变体 DiD与Event Study模型的基本比较 “后”ES系数的平均值减去“前”ES系数平均值,应该对应于DiD估计 如果ES系数和DiD估计值存在显著差异,这可能会对潜在问题提出警告,值得进一步调查 当处理效应是时变的,双向固定效应DiD中的2x2加权平均值估计并不是理想结果 Borusyak等(2022)、De Chaisemartin和D’Hautfouille(2020)分别提出了可以恢复处理效应的替代估计量 处理效应趋势会干扰控制单位趋势的DiD估计 由于单位趋势本身会捕捉到处理后的单位在后期呈上升趋势,则导致在DiD模型中对处理效应的下偏估计 当Event Study 与DiD的结果相差甚远,ES系数是有效的,而DiD系数对一些ES项给出了不合理的零权重 ![]() 防止单位趋势与处理效应趋势的相互干扰 ① 仅控制处理前趋势 (Section 4.2) ② 对事件研究项建模(Ex:包含所有所有处理后事件时间项,避免end-cup约束,确保仅根据事件前数据来估计趋势系数) 4.4. 控制趋势的建议① 除非确认处理效应的趋势效应不在估计范围内,不要让事件后参数限制影响估计趋势 ② 如果额外参数限制之一是两个事件系数相等的形式,尽可能使系数相隔更远 ③ 满足上述考虑的一项限制(至少对于 DiD 和混合数据结构而言)是: 将“参考期”事件研究系数的趋势限制为零 优点:多个系数进行平均,减少其中任意一个或两个系数的噪声影响 尊重标准化限制中体现的参考期的概念 提供了自然的反事实解释:“与参考期的水平和趋势相比,从控制组跨日历时间的变化来看,预期结果是什么 ④ 对于Timing-based数据中的趋势控制要格外谨慎 添加线性趋势控制(以及所需的附加参数限制)可以将二次趋势引入我们估计的事件研究系数中 ⑤ 可选的简化趋势调整:关注单位类型趋势,而不是特定单位的趋势 5. 事件研究模型的统计推断除了无偏的估计,我们还需要能够进行统计推断来检验有关世界真实状况的假设 5.1. 聚类稳健的推断当前的做法似乎是计算聚类稳健的标准误 事件研究中的关键右侧变量具有一定程度的自相关性 模型误差项在单位内随着时间的推移也呈正自相关性 潜在担忧:聚类稳健方法只有在集群数量“足够大”时才能提供准确的标准误 无硬性规定标准,一些民间经验认为42、50个是合理的集群(但也可能在一些研究设定中过多/过少) 当集群过少时,传统的聚类稳健方法被拒绝 当集群大小不对称,或处理组过少时,集群过少的问题会加剧 进行排列测试,跨单位随机重新分配伪事件日期,并重新估计模型 多次重复此过程,以构建“没有实际处理的处理效应估计量”的分布 将主要估计值与这些分布进行比较,判断结果是否受集群特殊驱动 5.2. 空间相关性问题聚类稳健的基本前提要求集群彼此独立 ① 事件日期的空间相关性削弱了这一前提 对于政治进程的结果或受经济环境影响的事件,邻近单位(例如,邻近国家)的事件日期可能比相距较远的单位更接近 目前大多数文献忽略了这一问题,一些潜在的方向可以解决这个问题(Conley,1999 ) 关于如何跨时空测量“距离”的指导很少 ② 允许集群内的观测值存在任意相关性,允许邻近时间段内的观测值在日历时间中存在衰减的相关性 该方法允许观测值间存在更大的依赖性,但空间自相关问题可能使集群过少的的问题更严重 ③ 短期的预防措施是检查数据以了解事件日期中空间相关性的可能性 目前并没有空间自相关性的硬性标准,研究人员将来可能应该开始更多地关注空间相关性 6. 拓展与挑战6.1. 强度可变的事件① 我们可能希望事件的规模与冲击的大小成比例 可以通过将事件虚拟变量预先乘以事件的大小(是“香烟税上涨了多少百分比”)的方式处理 ② 最近的一些论文以”驱动策略“为中心的进行事件研究 消费者在地区迁移时改变购买模式(Bronnenberg、Dubé 和 Gentzkow 2012) 医生(Molitor 2018)或患者(Finkelstein、Gentzkow 和 Williams 2016)从一个地区迁移到另一个具有不同医疗模式的地区 事件强度的变化是由目的地和出发地的区域实践模式的差异决定的 6.2. 每个单位有多个事件每个单位可能会被反复裁员/反复提高周最低工资 ① 允许事件在同一单位的不同时段内发生 这种方法中,估计系数被解释为”部分效应“,保持了后续事件(包括被当前事件影响的事件)的潜在影响不变 这与包含了”当前事件对未来事件的影响“的”总体效应“有所不同 Krolikowski(2018)提出部分效应估计的加权平均值,以及“仅第一个事件”模型来探讨这个问题 ② 调整事件的定义,以便每个单元只有一个事件 种方法可以基于“最大的事件”或“第一个大事件”来实施(Ex:只考虑重点的第一次裁员) 将后续事件(及其动态影像)捆绑到处理效应中,依然使系数的解释存在问题 若结合使用”从未被处理的组“作为对照,照组可能以未观察到的方式存在差异(更强的技能或劳动力市场依赖) 有偏的估计会影响结果的外部有效性和推广性 一个事件的影响是否取决于其他事件的历史 Ex:第二次的裁员比第一次影响更大(脆弱性的增加)或更小(地板效应) 原则上,可以修改基本模型,以根据先前事件的历史直接估计处理效应的敏感性,但我们还没有看到这种实现 6.3. 异质性的处理效应处理事件发生后的时间,处理效应还系统地取决于单位类型、时间或环境 ① 可以根据认为影响处理效应的协变量包含一组交互项(Ex:分别包含一组男性和女性的事件虚拟变量) 遵循添加交互项的一般最佳实践:若协变量随时间变化,则添加对其的直接控制 交互项可能会吸收数据中的大量变化,应对交互项实施参数简化:允许协变量在事件发生的不同时期产生不同的斜率 ② 在事件时间不同时,对处理效应取决于事件发生时间的可能性进行建模 Ex:较早采取政策的美国各州可能是从该政策中受益最多的州; 较晚受事件冲击的人可能会产生较小甚至相反的效果 a. 将实际事件日期视为可观察变量,根据其估计处理效应;b. 使用”早起处理“或”晚期处理“的虚拟变量 ③ 总体效应将是不同单位类型异质效应的加权平均值(Sun和Abraham,2021) 辅助回归可以计算隐含权重,并且还提出了一种替代估计方法,可以恢复目标平均处理效应(Sun和Abraham,2021) 使用尚未处理的单位和平行趋势假设来恢复对每种处理单位类型的处理效应的估计,然后可以将其平均 (De Chaisemartin 和 D’Haultfœuille (2022)) 6.4. 当“时间”不是“日历时间”这种情况可能会出现在队列研究中: 时间变量是“出生年份”而不是日历时间:Duflo(2001)根据地区和出生年份研究了印度尼西亚人儿童时期接受学校教育的生命历程影响 带来了年龄-队列-时间的多重共线性的挑战 我们感兴趣的结果以非线性方式在很大程度上取决于年龄;数据的收集时期(如经济衰退期)也可能带来重要的日历时间效应 作者建议包括所有的3组年龄、队列、和时间虚拟变量 ① 有可能由于共线原因(年龄=队列+时间),研究人员只包含其中两种虚拟变量 ② 一种主要的替代方案是:包含一组双向交互的虚拟变量(年龄×队列,队列×时间,时间×年龄)作为稳健性检验 进行总体估计时,我们希望确保每个队列的加权与其人口成比例 数据可能不会自然的反应这些权重,尤其当我们匹配不同大小的数据集时 需要在提高统计功效(根据样本中的数据进行加权)和提高代表性(根据队列规模进行加权)之间进行选择 7. 结论(1)事件研究模型使用过程中的决策,可能会增加产生偏差的风险 (2)尽管如此,决策不可避免,不存在自动做出必要判断的条件 (3)应当通过明确所做的规范决策(以及这些决策的原因)来提高透明度,讨论替代决策稳健性,同时尽可能提供估计代码和用于复制的数据 |
|