cluster一次还不够？ “神秘”的cluster2命令帮到你！

张春强2022 2017-05-05

展开全文

接下来，就和小编一起学习这个命令吧！！

在固定效应模型(Fixed Effect)回归中，为了控制潜在的异方差和序列相关(Intragroup Correlation)问题，通常做法是对所有回归系数的标准误都在公司层面上进行cluster处理，Stata命令如下：

·xtreg (Dependent Variable) (Independent Variable), fe vce(cluster company_id)

·xtreg (Dependent Variable) (Independent Variable), fe cluster(company_id)

例子

我们就以Stata官网http://www./features/overview/linear-fixed-and-random-effects-models/上面板数据(National Longitudinal Survey)为例

·webuse nlswork

·xtset

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe vce(cluster idcode)

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe cluster(idcode)

xtset首先声明数据为面板数据，其中c.age#c.age, c.ttl_exp#c.ttl_exp以及c.tenure#c.tenure分别是变量age、total work experience以及tenure的平方项。

的确，cluster的使用在公司层面(idcode)的确解决了组间相关的问题，但是，如果面板数据还存在序列自相关该怎么办呢？我们可否继续在idcode后面加入时间变量year，顺便解决一下时间序列自相关性问题呢？

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe vce(cluster idcode year)

·xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fe cluster(idcode year)

Stata运行报错，并解释cluster后面只可以纠正一个变量的相关性问题。那么，如果需要控制组间以及组内相关性问题，即该怎样同时控制idcode以及year序列相关性呢？答案是：神秘的cluster2命令帮到你!

cluster2 Dependent Variable Independent Variables, fcluster(Cluster Variable one) tcluster(Cluster Variable two)

·cluster2 ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure 2.race not_smsa south, fcluster(idcode) tcluster(year)

如果在Stata命令区输入findit cluster2或者help cluster2我们会看到：

怎么办？连cluster2的安装包都找不到，ssc install cluster2更是无法实现！

事实上，“神秘”的cluster2命令出自Mitchell A. Petersen在2008年发表在Review of Financial Studies杂志的《Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches》，若要使用cluster2命令，必须先到Petersen的Kellogg网站（http://www.kellogg./faculty/petersen/htm/papers/se/se_programming.htm）下载cluster2.ado并将文件包放置Stata安装的系统文件夹

下，具体步骤如下：

下载cluster2.ado文档

在Stata命令框输入sysdir或者adopath找到Stata在计算机中安装的位置

将cluster2.ado复制到对应文档位置，并重新启动Stata

重新打开数据，设置好面板数据格式，运行cluster2命令即可

·webuse nlswork

·xtset

·cluster2 ln_w grade age, fcluster(idcode) tcluster(year)

由此可见，cluster2命令在回归中负责同时调整计算两个维度的标准误，即一次性解决组间组内两种序列相关问题，两个维度通常可设置为公司变量及年份变量（flcuster(company identifier) and tcluster(time identifier)），除了cluster2.ado文件，Petersen还在自己的网站发布了logit2.ado、probit2.ado以及tobit2.ado文件可免费下载，用于相应Logit、Probit和Tobit模型的组间组内序列相关调整。