分享

不用IV, 基于异方差解决内生性问题方法的使用建议, 附上程序和示例!

 计量经济圈 2020-06-26

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于因果推断,各位可以参看以下文章:关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题

之前,我们引荐了①找不到IV, RD和DID该怎么办? 这有一种备选方法,②不用IV(工具变量), 基于异方差识别方法解决内生性, 赐一篇文献,为各位构建IV找到了更为便利的途径。后面,我们进一步引荐当内生变量为二值虚拟变量时,如何利用异方差构建合理的IV识别X对Y的因果效应,见:不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!

今天,我们引荐一下关于使用异方差解决内生性问题方法的使用建议,即Advice on using heteroskedasticity-based identification
正文

关于下方文字内容,作者赵丛雨,中国石油大学(北京)经济管理学院通信邮箱cyzhao1998@163.com

作者之前的文章:逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式!
Lewbel提供了一个基于异方差的估计方法,适用于含有内生变量且无法使用外生工具或者其他信息的线性回归方程。这个估计可以通过Baum和Schaffer开发的命令ivreg2h实现估算。本篇论文主要是给想要使用此估计代码的研究人员一些建议指导。

1.简介

包含内生变量的线性回归模型通常使用外部信息如外生的外部工具或参数分布假设来识别。一些研究通过利用异方差的性质,在没有外生工具的情况下来得出识别结果,包括Rigobon(2003)、Klein和Vella(2010)、Lewbel(1997、2018)和Prono(2014)。其中Lewbel(2012)展示了在没有外生工具的情况下,如何利用异方差构造变量工具。其他构造变量工具以得出识别结果的研究有Lewbel(1997)和Erickson and Whited(2002)。有关此类识别方法的一般性讨论请参见Lewbel。
在本文中,我们为希望应用Lewbel(2012)估计方法的研究人员提供建议和指导。这篇文章包括完全同时的系统、半参数的系统以及违反关键识别假设时的情况。然而,本文关注的重点是大多数使用单一内生回归模型的估计量的实证研究,这是本文的重点。Baum和Schaffer(2012)运用ivreg2h实现单线性方程估计,该命令可从统计软件组件(SSC)中获得。
请注意,可获得的外生工具变量会比Lewbel(2012)构造的工具变量更好,因为构造有效的工具变量的难度更大。然而,如果不可以获得外生的工具变量和外生变量有效性测试,那么构造的工具变量可能有用。

4. 实现估计量并进行检测

我们使用Lewbel(2012)方法来构建工具变量。这种方法既可以在外生工具变量不可得的时候采用,也可以随其他外生变量一起用,以提高工具变量估计量的效率。构造的工具变量和外部工具变量也可用于获得过度识别,从而允许应用Sargan-Hansen试验(正交条件或过度识别限制),这在外部工具变量精确识别的情况下是不可能的。这样就可以同时测试外部工具变量和构造工具变量的有效性。
使用ivreg2h中估计量需要基于先前的xtivreg2(Schaffer 2005)和ivreg2(Baum、Schaffer和Stillman 2003、2007)命令。从本质上讲,ivreg2h生成基于异方差的构造工具,然后像前面的命令一样实现工具变量估计。除了纯横截面或时间序列数据外,ivreg2h还可以在面板数据中使用并采取固定效应模型;详见下面描述的fe选项。由于ivreg2h是ivreg2的变体,因此该命令的所有功能和选项基本上都可以在ivreg2h中使用。所以可以使用help ivreg2来获取可用选项的完整详细信息。
robust和gmm2s选项是基于调用可测量广义矩估计方法。这将计算Hansen J统计量作为过度识别检验的测试。默认的Sargan选项假定误差项是正态分布的,更多细节见Baum、Schaffer和Stillman(2003、2007)。注意,gmm2s选项取代了前面文章中描述的gmm选项。
ivreg2h命令还提供了四个选项:gen、gen(string[, replace])、fe和z()。如果给定gen选项,则生成的(构造的)工具就会储存起来,其名称以原始变量名为后缀,后缀为g。
如果想对生成的工具变量的命名进行控制,可以使用gen(string[, replace])选项。字符串允许指定存根或前缀,从而更好地控制生成的工具的命名,也将以g作为后缀。replace选项是可以用于删除具有相同名称的早期工具。面板数据中可以使用fe选项来进行固定效应控制,如xtivreg2所示。z()选项应用于使用某些包含的外部变量来生成工具变量。
可以调用ivreg2h命令来适应以下两种情况:a)模型中不存在工具变量但是也可以被识别;b)模型中如果工具变量,就会由于没有排除的工具变量或排除的工具变量少于传统识别所需的工具变量,而导致模型无法识别。
在a种情况下,生成后的构造工具变量达到了足够量的外部工具变量,ivreg2h提供了三组估计:传统的工具变量估计、仅使用生成工具变量的估计以及同时使用生成工具变量和排除工具变量的估计。在这种情况下,ivreg2h会自动生成排除工具变量有效性的Hayashi C测试,相当于ivreg2中的orthox()选项提供的测试,详见Baum、Schaffer和Stillman(2003,18–19)。第三次估计的结果(包括生成的和排除的工具变量)存储在返回列表中。三组估计分别被储存在StdIV、GenInst和GenExtInst中。
在b种情况下,如果没有构造的工具,方程将被低估,仅有一组或两组估计值产生。如果排除性工具变量不存在,那么仅能获得使用生成的工具变量的估计值。如果存在被排除的工具变量,但无法根据约定的条件进行识别,那么仅可获得生成的工具变量以及由生成的和被排除的工具生成的估计值。与ivreg2或ivregrest不同,ivreg2h以下选项:
因为在用生成的回归函数进行增广后,辨识的阶条件将得到满足。生成的估计值存储在ereturn列表中,并储存在GenInst和GenExtInst中。
上面提到的Pagan和Hall(1983)测试可以从Baum、Schaffer和Stillman(2003)的ivreg2包中使用ivhettest命令获得。默认的测试不假定误差项服从正态分布。
4.1 存储的结果
在估计表输出中,显示的结果j, jdf和jp是指Hansen j统计值、自由度和p值。如果假设误差是独立同分布的并且在标准输出中显示Sargan检验,那么Sargan统计量、自由度和p值将显示在j, jdf和jpval中,因为此时Hansen和Sargan统计量是一致的。最新估计的结果存储在ereturn列表中。

5. 使用示例

在Lewbel(2012)例子中,回归函数仅用于和结果相匹配。
以下是面板数据和异方差和自相关标准误差的示例:

6. 附加评论

这一小节解答了一些有关估计量的问题:
1) 估计量的有效性可以检验吗?
答:可以解释一部分,前面几小节的检测结果就是示例。
2) 如果Y1或Y2是离散的呢?
答:这种情况下估计量仍然是有效的,Lewbel(2018)给出了一组足以证明估计量有效性的条件。然而如果假设A1中的因子结构Y1或Y2是离散的,那么很难证明估计量的应用是正确的,不过我们仍然可以应用前面章节中讨论的测试来提供一些证据来合理化估计量。
3) 系数估计值接近于普通最小二乘法的估计值意味着什么?
答:在有工具变量应用的估计量中,在任何工具变量估计量的应用中,工具变量的系数估计值接近于普通最小二乘法的估计值,很可能是偶然的原因,或者工具变量和内生变量高度相关。构造的工具变量也是如此。
4) 估计量可以与多个内生回归变量一起使用吗?
在含有内生变量的回归方程中,估计量是有效的,估计量与多个内生变量均有效,但在有效性所需的确切条件尚未显示。
5) 构造好的工具变量可以作为附加工具吗?
不可以。ε1误差与所构造的工具无关,但可能不满足零条件均值假设。这就意味着除非存在额外的强假设,否则不可以使用构造工具的平方项或构造工具与外部变量的交互项作为额外工具。
6) 构造的工具可以用来估计局部平均处理效应吗
答:不可以,除非满足很强的假设。这个方法并没有构造满足局部处理效应估计假设的工具。它只构造了传统意义上的工具在传统结构模型意义上构造工具,其中线性模型系数是固定常数。这意味着如果内生回归是一种处理方法,那么所构建的工具只有在处理效应中是同质的。
7) 如果还存在其他的工具?
答:这是最好的情况,因为这些外部工具可以在估计量的第二步(如前所述)中与构造的工具一起使用。构造的工具的最佳用途之一是为模型测试和稳健性检查提供过度识别的信息。例如可以将前几节中讨论的过度识别测试应用于基于构造和外部工具的估计。如果拒绝了有效性,那么或者是因为模型被错误指定,或者至少有一个工具是无效的。如果没有拒绝有效性,则模型仍然有可能是错误或者工具无效,但是人们至少会增加信心,认为外部工具和构造的工具都是有效的。更非正式的是,人们可以简单地比较基于构造工具和基于外部工具的估计系数。如果它们在数值上相似,那么这就增加了对模型稳健性的信心,因为基于非常不同的识别假设的两个估计量产生了相似的结果。通常不会仅使用构造的工具的识别,而是与获得识别的其他方法一起使用,两者都是估计结果的稳健性和提高估计效率的方法。

7.结论

自从提出基于异方差的估计量后,这一方法在谷歌中已经被引用了超过500次。但是和所有基于结构和功能形式的识别方法一样,需要谨慎地解释结果。这篇文章就是帮助学者确保估计量是正确使用的。

0.看完顶级期刊文章后, 整理了内生性处理小册子1.“内生性” 到底是什么鬼? New Yorker告诉你2.Heckman两步法的内生性问题(IV-Heckman)3.IV和GMM相关估计步骤,内生性、异方差性等检验方法4.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题5.毛咕噜论文中一些有趣的工具变量!6.非线性面板模型中内生性解决方案7.内生性处理的秘密武器-工具变量估计8.内生性处理方法与进展9.内生性问题和倾向得分匹配10.你的内生性解决方式out, ERM独领风骚11.工具变量IV必读文章20篇, 因果识别就靠他了12.面板数据是怎样处理内生性的13.计量分析中的内生性问题综述14.工具变量IV与内生性处理的解读15.一份改变实证研究的内生性处理思维导图;16.Top期刊里不同来源内生性处理方法17.面板数据中heckman方法和程序(xtheckman)18.控制函数法CF, 处理内生性的广义方法19.二值选择模型内生性检验方法20.2SRI还是2SPS, 内生性问题的二阶段CF法实现21.内生变量的交互项如何寻工具变量22.工具变量精辟解释, 保证你一辈子都忘不了

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章