搜索

分享

QQ空间 QQ好友新浪微博微信

关于 Confounder 的那些事

对对子不错 2017-12-18

展开全文

随着计量经济学的迅猛发展，一些计量 “新词” 也日益频繁地出现于文献中。不了解这些新词，难免影响文献阅读。

比如，在处理效应（treatment effects）的文献中，“confounder ”或 “confounding variable” 一词越来越常见，可译为 “混淆变量” 或 “混淆因素”。

但究竟什么是混淆变量呢？它与遗漏变量又有何区别？以一元回归模型为例：

其中，扰动项很可能包含 “遗漏变量”（omitted variable），即除了解释变量以外，影响被解释变量的其他因素。遗漏变量几乎普遍存在，因为通常我们无法观测到影响的所有因素（即使是大数据一般也会有遗漏变量！）。

然而，即使存在遗漏变量，只要遗漏变量与解释变量不相关，则使用 OLS 依然能得到一致估计（consistent estimation）。此时，遗漏变量就不是混淆因素，即不是 confounder。

由此可知，confounder 可以定义为与解释变量存在相关性的遗漏变量。在这种情况下，由于混淆变量一定与解释变量相关（根据定义），故 OLS 估计量不再一致。这种偏差一般称为 “遗漏变量偏差”（omitted variable bias）。直观来看，由于 confounder 的存在，混淆了解释变量对于被解释变量的因果作用，故称其为 “混淆变量”，参见下图。

事实上，如果将 “遗漏变量偏差”（omitted variable bias）称为 “混淆变量偏差” （confounder bias）可能更贴切，因为遗漏变量不一定导致偏差，而混淆变量（如果不进行控制或处理），则必然导致偏差。

进一步，如果不存在混淆因素，则称为 “unconfounded”（无混淆的）或 “no confounding”。

比如，在处理效应模型中，如果在给定一系列协变量之后，处理变量（treatment variable）与潜在结果（potential outcomes）相互独立，则称为 “无混淆性”（unconfoundedness）。换言之，在控制了协变量之后，就不再存在可能干扰因果关系的其他混淆因素；故名。

号外

不少人咨询陈强老师何时再讲授 高级计量现场班，刚刚与经管之家论坛确定了开班时间与地点（北京，2018年4月27日-5月2日，六天班）。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：对对子不错 > 《其他统计方法学习》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

对对子不错

关注对话

TA的最新馆藏

从夏奥到冬奥：新研究揭示中国空气治理成就
【win、安卓、插件】三版本IDM已注册中文版，万能下载神器
从暂元里取出子元素 | Stata编程
高培勇：高质量发展必须告别“惯性思维”丨专论
文本大数据分析在经济学和金融学中的应用, 最全文献综述
Stata: psestimate-倾向得分匹配(PSM)中匹配变量的筛选

喜欢该文的人也喜欢更多

热门阅读换一换