计量经济学的方法通常仅针对某一问题而设计。比如,若有内生性问题,则使用工具变量法;如有样本选择问题(偶然断尾),则使用 Heckman 的两步法或最大似然估计。但在实证研究的实践中,常会发生“并发症”,比如数据中既有内生性,也存在样本选择问题。 在现有的计量或统计软件中,一般不便处理上述“并发症”问题。为此,Stata 15 贴心地推出了 “扩展回归模型”(Extended Regression Models,简记 ERM),可以轻松地处理此类并发症问题。 Stata 举了一个假想的例子(https://www./new-in-stata/extended-regression-models)。 假设你要研究 “每日走路步数”(steps)对体重(bmi)的影响。为此招募了一些志愿者,记录了每人的特征(比如身高、体重、性别、教育水平等),并为每人配上计步器(pedometer),要求在六周后寄回。 然而,由于无法精确控制这些志愿者在实际生活中的走路步数,故无法进行随机分组。进一步,steps 很可能会与某些不可观测的个体特征相关(比如,走路多者通常有较健康的其他生活习惯),故 steps 为内生变量,一般应使用工具变量法来解决内生性。 另一方面,有些人可能并不归还计步器,导致部分数据缺失。如果归还计步器者与不归还者存在系统差别(比如,有些人担心自己走路太少而不好意思寄回计步器),则可能导致 “样本选择偏差”(sample selection bias),一般应使用 Heckman 两步法或相应的最大似然估计。 总之,在此例中,不仅有内生变量(steps),还存在样本选择问题。在现有的计量或统计软件中,一般无法方便地处理这种 “内生性” 与 “样本选择偏差” 的并发症。而 Stata 15 的新模块 “Extended Regression Models” 正是为此而设计,其基本思路是将模型写为多方程的系统(类似于 SUR 或联立方程模型),然后进行最大似然估计。比如,针对此例,可以输入以下命令: . eregress bmi sex steps , endog(steps = sex distance) select(selected = sex steps education) 其中,“eregress” 表示 “扩展回归”(extended regression)。变量 sex, distance 与 education 分别表示性别、上班距离与教育水平。选择项 endog() 表示内生变量的方程(即第一阶段回归),以sex, distance为工具变量。选择项 select() 表示选择方程,以 sex, steps, 与 education为选择变量(在此假想的例子中,假设缺失的数据为部分被解释变量 bmi)。 所得回归结果如下。 在回归结果表格的第一部分,以 “bmi” 开头,表示这一栏目估计了以 bmi 为被解释变量的主方程(main equation)。第二部分以 “selected” 开头(即是否归还计步器),表示这一栏目汇报选择方程(selection equation)的估计结果。第三部分以 “steps” 开头,汇报以 steps 为被解释变量的第一阶段回归结果。 在此虚构的例子,由于数据的生成过程是已知的,故可将 Extended Regression 的估计结果与真实参数进行比对。Stata 公司所进行 Monte Carlo 模拟显示,估计结果与真实参数非常接近,故是一种可靠的方法。另一方面,在此 “并发症” 的例子中,如果仅考虑内生性,或只解决样本选择偏差,则所得估计结果将很不同。 对于命令 eregress,除了上述 endog() 与 select() 两个选择项外,还可以加入选择项 extreat() 或 entreat(),分别表示加入外生的处理变量(treatment variable)或内生的处理变量,详见 help eregress。 另外,由于 eregress 仅处理线性模型(extended linear model),Stata 15 还提供了几个处理非线性扩展模型的命令: eprobit (扩展的 Probit 模型) eoprobit (扩展的排序 Probit 模型) eintreg (扩展的区间回归模型,interval regression as a generalization of Tobit) 更多关于 “Extended Regression” 的介绍,可参见帮助文件(比如,help eregress),以及新增的 Stata手册 [ERM] Extended Regression。 备注:本公众号不提供 Stata 15。如需正版 Stata 15,可咨询 Stata 中国代理商友万科技(www.uone-tech.cn)。 参考文献 陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。 |
|