分享

无需检查协变量平衡性的CEM匹配, 到底有多神气和与众不同

 对对子不错 2018-10-15

推荐阅读:

1.实证研究中用到的135篇文章, 社科学者toolkit

2.计量经济圈经济社会等数据库合集, 社科研究

3.1998-2016年中国地级市年均PM2.5数据


完整版do file请到因果推断研究小组提取(文末阅读原文),而计量社群相对稍晚一些上传。Contributor: @老A 群友

Coarsened Exact Matching(CEM)是是通过控制观测数据中混杂因素对政策结果影响的一种非参数方法,主要目的依然是使处理组与控制组的协变量的分布尽可能保持平衡,从而增强两组数据之间的可比性。CEM是一种单调性不平衡边界( MIB )匹配方法——这意味着参与组和对照组之间的最大不平衡可以由用户事先选择,而不是通过那些费力的事后检查和重复重新评估的过程来发现,并且调整一个变量上的不平衡不会影响任何其他变量的不平衡。


CEM通过预先的用户选择来限制模型依赖程度和平均处理效应估计误差,它能够将数据限制在共同支持范围内,符合一致性原则,对测量误差的敏感度较低,能够很好地用多重插补方法处理缺失值数据,可以完全自动化地进行这系列操作,即使是对于非常大的数据集,其计算处理速度也很快。在用CEM预处理数据之后,我们然后可以使用简单均值差异比较法,或者任何其他打算用于处理原始数据的匹配方法或统计模型。CEM还能够做多分类处理效应,在实验设计中创建随机分区,并评估极端的反事实。


CEM是一种“monotonoic imbalance reducing匹配方法”,而传统的PSM和马氏匹配等是一种“equal percent bias匹配方法”。关于这两者有什么区别,各位圈友可以读一读文后列出的相关文献,或者到因果推断研究小组讨论。计量方法也不是我们想象的那么简单,乱用、勿用各种方法是很多中文学术期刊普遍的现象,这是一个非常严重的问题,因此提高审稿人的计量水平很迫切


CEM匹配与PSM匹配等传统匹配方法相比有什么突出优势:


1.不需以两组数据的共同区域为基础进行匹配(common empirical support),满足一致性原则。例如,PSM在匹配前需进行两组人群特征分数的重叠性检验并确定共同区域,进而根据特征分数进行匹配,而CEM直接根据原始数据的经验分布进行匹配,满足一致性原则。


2. 能最大限度地保留原有样本,进而在政策效果评估时反映真实情况。例如,PSM匹配后处理组和对照组的数量必须相等,而CEM匹配后两组数量可以不相等,并在匹配过程中会产生权重变量(Weight),以此来平衡每层中处理组和对照组的数量,因此能最大限度地保留原有样本,进而在政策效果评估时反映真实情况。


3. 减少对模型的依赖。例如,PSM需利用Logistic等回归模型拟合特征分数后进行匹配,而CEM是直接根据每个变量的理论分布进行匹配,因此减少了对模型的依赖。


做CEM匹配的步骤如下:


首先根据每个协变量进行分层;


其次运用精确匹配的算法根据样本的经验分布将每层中的研究对象进行精确匹配,保证每层中至少有一个处理组和一个对照组的研究对象,否则将该研究对象删除;


最后保留匹配成功的研究对象,用匹配后的数据库政策变量对结果变量的的影响。


在匹配前后需分别检验两组数据的不平衡性(multivariate imbalance measure),即L1,L1的取值范围是[0,1]。若L1=0则说明两组数据完全平衡,若L1=1 则说明两组数据完全不平衡,越接近1则说明不平衡程度越大。若匹配后L1较匹配前的L1有所下降则说明匹配效果较好


CEM匹配后两组数据的样本量可能会不相等,因此CEM匹配过程中会产生权重变量(Weight),以此来平衡每层中参与组和控制组的人数。


现在我们通过一些示例来看看CEM具体的操作和结果解读:


1.直接对处理组与对照组的结果变量均值进行比较,得到的均值差异为886,这作为将来与CEM匹配后所得到的处理效应进行比较的基准。


2.计算不平衡指数L1,这个指数的数值0.5主要是用来与”通过CEM匹配后“所得到的L1指数进行比较。下面还有各个协变量的L1指数和位于不同分位数上的均值,从中至少可以看出re74的分布是相当不平衡的。


3.通过CEM进行匹配后,我们可以得到一些匹配相关的信息和不平衡指数L1。与之前未经过匹配的L1指数相比,经过CEM匹配后确实改善了平衡性,从0.5下降到0.46。这里面的分层coarsen过程,都是通过CEM计算机制自动完成的。


4.现在,我们人为地设置教育的cutoff点,并通过这些点来进行分层。与上面通过自动化完成的CEM相比,有时候对于一些ordinal变量进行设置cutoff点,反倒是改善了匹配效果和协变量的不平衡性程度,L1指数进一步下降到0.43了。


5.当CEM匹配对数据进行预处理滞后,我们需要加上cem_weights(权重,因为各层里面的处理组与控制组不一定是平衡的)来获得政策处理效应。我们之前是有低估处理效应的可能性,仔细一看,现在的处理效应是高出之前未经过匹配时的处理效应100点。注:回归的时候根据因变量数据类型来选择相关模型,比如logit, probit, ologit, Poisson等,这个里面使用的是regess。这些都可以放在广义线性回归模型估计:所有线性回归的大仓库讨论。


6.如果通过cem匹配后仍然有不平衡性,我们可以再通过控制那些影响整体平衡性的变量来获得处理效应,比如本例中控制了re74和re75。从回归结果来看,控制了相关的不平衡变量所得到的处理效应与没有控制相关变量所获得的差不多。注:回归的时候根据因变量数据类型来选择模型,比如logit, probit, ologit, Poisson等。



7.通过k2k匹配可以保证每层里的处理组与控制组有相同数量的观测值,从而不需要weight(使用k2k的前提是数据量要足够大一些)。我们发现,k2k匹配后协变量的平衡性得到改善,此时的处理效应与没有使用k2k匹配时的情况相比要低很多,两者的值分别是989和886。



8.除了自身可以直接获得处理效应,CEM还可以用来改进其他传统的匹配方法,比如PSM、距离匹配和'遗传匹配'。下面就是在用CEM处理数据并保留匹配了的数据后再使用近邻匹配法所得到的处理效应。通过与下面的结果进行对比发现,CEM匹配确实能够改进近邻匹配(看显著性)。


下面是没有经过CEM匹配,而直接使用近邻匹配所得到的处理效应。


9. CEM还可以处理存在缺失值情况下的处理效应推断。如果想要进一步深入研究,请参阅下面这些文章和作者的主页或者到因果推断研究小组交流:

https://gking./cem

文献

'Causal Inference Without Balance Checking: Coarsened Exact Matching' (Political Analysis, 2012) 

'Multivariate Matching Methods That are Monotonic Imbalance Bounding' (JASA, 2011), 

'CEM: Coarsened Exact Matching in Stata” (Stata Journal, 2009, with Matthew Blackwell), “CEM: Software for Coarsened Exact Matching.” (Journal of Statistical Software, 2009), 

'A Theory of Statistical Inference for Matching Methods in Causal Research” (2017).  

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多