分享

关于 Confounder 的那些事

 对对子不错 2017-12-18

随着计量经济学的迅猛发展,一些计量 “新词” 也日益频繁地出现于文献中。不了解这些新词,难免影响文献阅读。


比如,在处理效应(treatment effects)的文献中,“confounder ”或 “confounding variable” 一词越来越常见,可译为 “混淆变量” 或 “混淆因素”。


但究竟什么是混淆变量呢?它与遗漏变量又有何区别?以一元回归模型为例:

 


其中,扰动项  很可能包含 “遗漏变量”(omitted variable),即除了解释变量  以外,影响被解释变量  的其他因素。遗漏变量几乎普遍存在,因为通常我们无法观测到影响  的所有因素(即使是大数据一般也会有遗漏变量!)。


然而,即使存在遗漏变量,只要遗漏变量  与解释变量  不相关,则使用 OLS 依然能得到一致估计(consistent estimation)。此时,遗漏变量就不是混淆因素,即不是 confounder。


由此可知,confounder 可以定义为与解释变量存在相关性的遗漏变量。在这种情况下,由于混淆变量一定与解释变量相关(根据定义),故 OLS 估计量不再一致。这种偏差一般称为 “遗漏变量偏差”(omitted variable bias)。直观来看,由于 confounder 的存在,混淆了解释变量  对于被解释变量  的因果作用,故称其为 “混淆变量”,参见下图。

 


事实上, 如果将 “遗漏变量偏差”(omitted variable bias) 称为 “混淆变量偏差” (confounder bias)可能更贴切,因为遗漏变量不一定导致偏差,而混淆变量(如果不进行控制或处理),则必然导致偏差。


进一步,如果不存在混淆因素,则称为 “unconfounded”(无混淆的)或 “no confounding”。


比如,在处理效应模型中,如果在给定一系列协变量  之后,处理变量(treatment variable)与潜在结果(potential outcomes)相互独立,则称为 “无混淆性”(unconfoundedness)。换言之,在控制了协变量  之后,就不再存在可能干扰因果关系的其他混淆因素;故名。


号外


不少人咨询陈强老师何时再讲授 高级计量现场班,刚刚与经管之家论坛确定了开班时间与地点(北京,2018年4月27日-5月2日,六天班)。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多