分享

捕获因果关系(3)

 新用户68639482 2020-04-07

摘要:个体之间的差异不仅体现在那些通常被称为“处理前异质性”(pretreatment heterogeneity)的背景特征上,还体现在个体对特定处理、事件或干预的反应中。处理与处理倾向(treatment and the propensity of treatment)之间的交互作用是社会科学中关于选入处理组和因果推断问题的一个主要研究兴趣。尽管“处理效应异质性”(treatment-effect heterogeneity)的重要性在因果推断的文献中已经得到了广泛的认可,但社会科学定量实证研究(empirical quantitative social science research)还没有将其完全纳入。本文(1)描述了异质性处理效应研究的主要估计策略;(2)讨论了近期关注因果效应异质性的研究,关注点在教育带来的效应,以及我们由此得到的启示;(3)利用上大学对公民参与的影响对该方法进行了说明。本文的主要目的是鼓励研究人员用对检验处理前异质性一样的严格程度对处理效应异质性进行例行检验。

捕获因果关系(1)


捕获因果关系(2)


直接点击蓝色标题查看上期推送

实证演示

在这一部分,我们会展示上述的方法,使用高等教育社会回报的例子。教育的社会回报,特别是总体中的非优势群体的教育社会回报,一直都是推广教育机会均等公共政策的核心理由。如果不能算是决定因素,教育也可以说是社会参与的一个主要相关因素(Brand 2010)。一些研究识别了与评估教育对社会参与的因果效应相联系的内生性问题,但是很少有研究识别潜在的处理效应异质性。Brand(2010)是一个例外,他强调了使用SM方法得到的在获得大学教育倾向值上,大学对社会参与的异质性处理效应。我们通过比较一系列评估处理效应异质性的方法来扩展Brand(2010)的研究。

数据描述

我们使用1979年全国青年纵向调查(National Longitudinal Survey of Youth,NLSY)数据来评估上大学对社会参与的异质性因果效应。NLSY是一个具有全国代表性的样本,有12686个在1979年为14-22岁之间的受访者。这些个体一直到1994年每年都会被追访,最近他们两年被追访一次。我们使用1979-2006年的数据。我们将样本限定为在基期1979年的年龄为14-17岁(n=5582),截止到2006年至少上完了十二年级(n=4827),2006年的教育获取和社会参与指标不缺失(n=3452)。这些限制是为了保证我们所使用的所有指标是在大学之前的,特别是能力方面的指标,也是为了比较大学毕业生和至少完成了高中教育的个体。由于数据磨损和无应答(attrition and nonresponse)导致的缺失数据,更多的是有着非优势家庭背景和更低教育程度的。附录A描述了大学前协变量和大学后社会参与指标。大学前指标将经济学和社会学关于教育和职业成就的研究纳入进来,他们的衡量是直接的。详细的可参见Brand(2010)。上大学可能性会随着性别、人种和种族、家庭背景、学术成就,朋友的计划和父母在预期方向的鼓励等发生变化。我们使用两个对立的2006年的社会参与指标,这两个指标是只在2006年被收集。两个指标是,询问受访者他们是否在过去的12个月内参与了无报酬的志愿工作(1)市民的、社区的或者青年团体(2)慈善组织或社会福利团体。大约13%的大学毕业生和5%的非大学毕业生志愿参加了市民的、社区的或者青年团体,9%的大学毕业生和4%的非大学毕业生志愿参加了慈善组织或社会福利团体。

处理效应分析

同质效应估计

我们首先使用logit回归模型,在给定一系列可观测协变量的情况下,估计每个个体大学完成情况的倾向得分。表11.1给出了logit模型估计结果,支持了关于大学教育的决定因素的文献结果。表11.2给出了在同质性效应假定的情况下,使用logit回归模型估计的大学完成情况对两个社会参与指标产生的平均效应。第一个模型代表了双变量关联(bivariate association);第二个模型控制了倾向得分估计值。二元变量模型表明,与非大学毕业生相比,大学毕业生有3.4倍的可能性去参加市民的、社区的或者青年团体,2.4倍的可能性去参加慈善组织或社会福利团体,结果具有高度统计显著性。控制上大学的倾向得分估计值后,我们发现这连个数字变为2.1和1.4。上大学的倾向得分对两种形式的志愿活动都有显著正向影响。在调整了倾向得分的模型中,点估计值减少了,上大学对参与慈善组织或社会福利团体的影响不再具有统计显著性。

同质性效应假定的模型在社会科学实证研究中普遍存在。然而,当处理效应异质性存在时,根据总体构成的不同,平均效应也有会很大差异。接下来,我们评估上大学对社会参与是否存在异质性处理效应。

之间的差分

表11.3给出了使用加权回归和倾向得分匹配法(最近邻匹配和核匹配)估计的。加权回归估计值表明,相比于非大学毕业生,大学毕业生有2倍的可能性参加市民的、社区的或者青年团体,1.3倍的可能性参与慈善组织或社会福利团体,尽管后者并不显著。但是,的值要相对更大:2.8和2,且两者都统计显著。

最近邻匹配和核匹配方法得到的估计值相似,两者都表明,那些有着未上大学个体特征的上大学个体,上大学对社会志愿活动参与的影响更大。匹配法是基于大学毕业生和非大学毕业生之间参加志愿活动可能性预测值的简单差分。我们粗略的将这些估计值转化为优势比(odds ratios),来与加权logit回归估计值进行对比。对于来说,两个值分别是1.8和0.9,后者并不显著。仍然超过,两个值分别是2.8和1.5。

倾向得分分布的统计建模

之间的差分表明了依据选入处理组可能性的子总体效应差异。接下来我们讨论是否在倾向得分分布上的处理效应存在系统性差异。对于SM模型,我们首先生成倾向得分分层,使得在每个倾向得分间隔内,平均得分和协变量平均值在大学毕业生和非大学毕业生之间没有显著差异。(Becker and Ichino 2002)。附录B给出了我们在构建了这些分层后得到的有用的描述性统计数据,和在每个倾向得分分层内典型个体的特征。父母是高中辍学者,有四个兄弟姐妹,低能力水平的个体,被登记在非大学毕业生的预备追踪内,具有不打算上大学的朋友的个体是层1(stratum 1)的特征。作为对比,父母上了大学,有两个兄弟姐妹,高能力水平的个体,被登记在大学毕业生的预备追踪内,具有打算上大学的朋友和鼓励上大学父母的个体是层7(stratum 7)的特征。尽管这比整体平均值信息多,但我们注明了,在同一个分层内所有的协变量彼此之间是正相关的。

表11.4给出了在倾向得分分层(1级水平,level 1)上大学对社会参与影响的logit回归估计值,以及使用方差加权最小二乘法估计的效应趋势(2级水平,level 2)。2级水平上的两类志愿活动指标的斜率都表明上大学的影响会随着上大学倾向的增加而降低。对于市民的、社区的或者青年团体,2级水平上的斜率表明一单位的倾向得分等级变化会带来0.26单位上大学效应的减少。也就是说,相比于层1的非大学毕业生,1级水平的估计值变动范围是,层1大学毕业生有7.6倍的可能性参加市民的、社区的或者青年团体,而层7的值相同。类似的,对于参与慈善组织或社会福利团体来说,2级水平的斜率表明一单位的倾向得分等级变化会带来0.20单位上大学效应的减少,变动范围为层1的3.1到层7的0.6。附录B给出了根据倾向得分值和大学完成情况分出的各层,以及处理效应模式的进一步证据。根据上大学倾向得分进行的分层在大学毕业生之间是平均分配的,非大学毕业生的志愿活动存在一个社会经济学梯度(socioeconomic gradient),尤其是对于市民的、社区的或者青年团体来说,在完成大学学业的非优势个体中产生了较大的可观测处理效应。

图11.1描绘了表11.4的结果,图中的点代表1级水平斜率的估计值,线代表2级水平的斜率。我们画出了不同层的志愿活动的平均差分,而不是logit回归系数,这是为了与下述平滑差分结果作对比。该图描绘了上大学对两种形式的社会参与的处理效应都随着上大学倾向值的增加而减少。图11.1还表明处理效应是潜在非线性的。为了研究这种可能性,我们换成非参数方法。

为了用匹配平滑法估计异质性处理效应,我们利用倾向得分估计值把处理组和控制组个体进行匹配,并计算了其结果之间的差分,将匹配好的处理组和实验组单位之间的差分,以倾向得分为x轴作图,拟合出一条平滑曲线。对于平滑差分法来说,我们在倾向得分上对两个独立的非参数回归模型结果变量进行拟合,一个是处理组的,一个是控制组的。MS法和SD法得到的结果类似,为了节省空间,我们仅列出了SD方法的结果。我们使用局部多项式回归作为平滑工具(等级1,宽度0.2)。组回归结果之间的差分提供了异质性处理效应的一个估计值。

图11.2为相应的结果曲线。与图11.1的不同是,x轴不再是分散的倾向值分层,而是连续的倾向值。SD法提供了一个全面的非参数处理效应异质性,而不是强行给出处理效应异质性的方程形式。对于市民志愿活动组,在给定SM法得到的线性趋势的情况下,我们发现差分在中高倾向值部分比较平缓,在高倾向值部分的差分大于我们预期。对于慈善志愿活动组,处理效应的线性性质并不是一个合理的形式,中高倾向值部分比较平缓,然后倾向值分布的上端(upper end)出现一个显著的下降。因此,我们发现了在上大学倾向值上潜在的处理效应差异,这在我们检查加权回归、倾向得分匹配法和SM法结果时是被忽略的。

工具变量

正如我们前面所说的,当存在处理效应异质性时,工具变量估计应该被理解为LATE。根据Carniero et al.(2011)的研究,我们打算考虑使用来自NLSY的个人地理编码数据作为两个工具变量,一个是14岁时当地大学的可获取性,一个是17岁时当地的失业人数。因为我们的分析是关于上大学对社会参与的影响而不是收入,我们首先质疑排他性限制是否成立。也就是说,我们能不能合理的假设,在社区内有一所大学会只通过其对个人教育获取的影响来对社会参与产生影响。在给定当地大学可获取性的情况下,我们可能会假定,更多受过教育的当地群众,会带来更高水平的社会参与,这反过来也可能会带来与个人教育水平无关的更高的社会参与(Putnam 2000)。使用当地的失业人数作为工具变量时也会有类似的问题。Brand and Burgard(2008)表示,裁员对社会参与有显著的负向影响,相应地,高水平的失业可能会影响与教育获取无关的社会参与水平。

但是,由于我们衡量2006年的大学完成情况时,受访者年龄40出头,我们对于排他性限制的顾虑可以缓和一下,尤其是使用17岁时当地失业人数作为工具变量时。我们这样衡量大学效应是由于我们感兴趣的是,上大学对社会参与的影响,不管是上完高中马上上大学还是之后再上大学。但是,在工具变量有效时,某些个体完成大学的时间和在社区居住的时间之间的分离,会导致比排他性限制更紧迫的问题,弱工具变量问题。将上大学对当地失业人数和大学可获取性回归时,第一阶段的F统计量分别是3.04和1.02。上大学与工具变量之间的相关关系低于0.05。如Bound(2005)指出的,工具变量与内生解释变量之间的弱相关性很普遍。弱工具变量问题加剧了其他工具变量假设导致的偏误,包括排他性限制、独立性假设和单调性假设。

关于这一点,我们决定不再使用工具变量分析。尽管没有把工具变量法结果与其他结果比较很遗憾,但我们提供了一个警示说明,尽管工具变量是因果分析的一个有用工具,但找到一个好工具变量很难。

结论

本文中,我们描述了学习处理效应异质性的重要性以及操作方法,我们的关注点在于处理与处理倾向之间的交互作用。我们没有说这是社会意义(social significance)上唯一的交互作用,特定的核心协变量之间的交互作用可能对某些特定研究更为重要。但是,对于有关因果关系和选择(causality and selection)的处理效应差异问题来说,倾向得分是重要的。倾向得分对于通过降维(dimensionality)来说明处理前异质性的研究来说是有帮助的(Rosenbaum and Rubin 1983, 1984),类似地,倾向得分对于处理效应异质性的研究来说也是一种权宜之计。

处理效应异质性有助于理解稀缺社会资源如何在一个非平等社会中进行分配、社会和行为研究设计以及社会政策。有了一个关注处理前异质性的研究设计,我们就可以对处理效应估计值的内部有效性(internal validity)进行评估,也就是我们在何种程度上成功地得到被研究总体的因果效应。但是,如果有了一个关注处理效应异质性的研究设计,我们还可以评估处理效应估计值的外部有效性(external validity),即在另一个语境下的研究结果的预测价值。也就是说,当个体对处理的反应存在差异时,处理效应会依据总体构成的不同而存在巨大差异,我们必须要针对特定的子总体(subpopulation)给出特定的处理效应估计值解读。如果一项处理的花费较高且执行困难,就会导致该处理只能被施加给那些有可能从其中获得最大利益的实验对象,而这样一来,增加处理组实验对象可能会导致平均有效性(average effectiveness)降低。相反地,如果机智的个体得到一项花费较高的处理但不一定能够从中获益时,提高处理的可获取性可能会增加处理接受者(treatment recipients)的平均处理效应。如果政策制定者了解处理效应异质性的模式(pattern),他们就可以针对个体更有效的分配不同形式的实验处理,以平衡相互矛盾的目标,例如针对一个给定总体的减少成本、最大化平均收益和减少收益差异的目标。

我们讨论并展示了一系列用于学习处理效应异质性的方法。在我们给出的关于上大学对社会参与影响的例子中,我们发现,使用加权回归和倾向得分匹配得到的非处理组(untreated,TUT)的处理效应要大于处理组(treated,TT)的处理效应。点估计的估计值更小,且使用匹配得到的一些处理效应在统计上不显著,这一差异是在意料之中的,因为匹配法估计值是将实验单位与更少的控制组单位比较,因此有可能会得到更小的偏差(bias)但会损失一些有效性(efficiency)。接下来,我们使用分层法(stratification-multilevel)和平滑差分法(smoothing-differencing)根据倾向得分分布检验了处理效应。分层法分析使得TT与TUT之间的差异变大,这说明上大学对于个体志愿活动参加情况的影响在那些上大学可能性更低的个体中更大。但是,对使用该方法得到的七个平衡倾向值分层(balanced propensity strata)进行估计,我们得到了比只分析TT与TUT更好的分层估计值(graded estimates)。使用分层法,我们发现上大学对于个体志愿活动参加情况的影响的异质性在统计上显著,这表明,随着上大学的倾向值增加,上大学带来的效应降低。该分析同时也揭露了处理效应的潜在非线性的性质,我们使用平滑差分法进行的分析证实了其对线性趋势的偏离。最后,我们考虑了用于估计局部平均处理效应的工具变量,与特定子总体相匹配的处理效应,这些子总体因为工具变量的存在而使实验处理发生了改变。与前述方法相比,该分析不依赖于可忽略性假设(ignorability assumption),但是有效的工具变量很难获取,在我们的演示中,我们的工具变量是弱工具变量,所以是没有用的。

Halaby(2004)的注释写道“…因果推断不能被减少至适用于数据的一个公式。因为根据观测数据得到的因果推断从本质上说就是不确定的,它给予实验设计大量的基本技巧(basic techniques)”(p541)。我们所描述的用于评估处理效应异质性的分析方法,会依据不同的假设而存在不同的优缺点。但是,这些方法也是识别具有不同接受处理处理可能性的子总体的不同方式,正因如此,对基本技巧的分析会得到关于处理效应异质性更为深刻的见解。由于处理效应异质性在社会科学研究中仍然出现较少,其实证评估非常少见,希望我们前述的内容可以促进处理效应异质性研究在实践中的分析技巧的使用。

(完)

编辑:林毅

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多