分享

cluster一次还不够? “神秘”的cluster2命令帮到你!

 张春强2022 2017-05-05

接下来,就和小编一起学习这个命令吧!!

在固定效应模型(Fixed Effect)回归中,为了控制潜在的异方差和序列相关(Intragroup Correlation)问题,通常做法是对所有回归系数的标准误都在公司层面上进行cluster处理,Stata命令如下:

·xtreg (Dependent Variable) (Independent Variable), fe vce(cluster company_id)

·xtreg (Dependent Variable) (Independent Variable), fe cluster(company_id)

例子

我们就以Stata官网http://www./features/overview/linear-fixed-and-random-effects-models/上面板数据(National Longitudinal Survey)为例

·webuse nlswork

·xtset

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe vce(cluster idcode)

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe cluster(idcode)

xtset首先声明数据为面板数据,其中c.age#c.age, c.ttl_exp#c.ttl_exp以及c.tenure#c.tenure分别是变量age、total work experience以及tenure的平方项。

的确,cluster的使用在公司层面(idcode)的确解决了组间相关的问题,但是,如果面板数据还存在序列自相关该怎么办呢?我们可否继续在idcode后面加入时间变量year,顺便解决一下时间序列自相关性问题呢?

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe vce(cluster idcode year)

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe cluster(idcode year)

Stata运行报错,并解释cluster后面只可以纠正一个变量的相关性问题。那么,如果需要控制组间以及组内相关性问题,即该怎样同时控制idcode以及year序列相关性呢?答案是:神秘的cluster2命令帮到你!

 

cluster2 Dependent Variable Independent Variables, fcluster(Cluster Variable one) tcluster(Cluster Variable two)


·cluster2 ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fcluster(idcode) tcluster(year)

如果在Stata命令区输入findit cluster2或者help cluster2我们会看到:

怎么办?连cluster2的安装包都找不到,ssc install cluster2更是无法实现!

事实上,“神秘”的cluster2命令出自Mitchell A. Petersen在2008年发表在Review of Financial Studies杂志的《Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches》,若要使用cluster2命令,必须先到Petersen的Kellogg网站(http://www.kellogg./faculty/petersen/htm/papers/se/se_programming.htm)下载cluster2.ado并将文件包放置Stata安装的系统文件夹

下,具体步骤如下:

01

下载cluster2.ado文档

02

 在Stata命令框输入sysdir或者adopath找到Stata在计算机中安装的位置

将cluster2.ado复制到对应文档位置,并重新启动Stata

03

重新打开数据,设置好面板数据格式,运行cluster2命令即可

·webuse nlswork

·xtset

·cluster2 ln_w grade age, fcluster(idcode) tcluster(year)


由此可见,cluster2命令在回归中负责同时调整计算两个维度的标准误,即一次性解决组间组内两种序列相关问题,两个维度通常可设置为公司变量及年份变量(flcuster(company identifier) and tcluster(time identifier)),除了cluster2.ado文件,Petersen还在自己的网站发布了logit2.ado、probit2.ado以及tobit2.ado文件可免费下载,用于相应Logit、Probit和Tobit模型的组间组内序列相关调整。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多