分享

Stata 多元线性回归模型建立及检验

 蓬山此去无多路 2021-10-19

——关于这篇笔记,有的人嘴上说着不想写,下笔实际上很快乐。

第一步 导入excel文件

clear #清除所有变量cd D:\stata_data #数据保存的地址import excel sample.xlsx, firstrow #导入数据,文件名为sample.xlsx,把第一行作为变量名tsset t#建立时间序列 若不存在时间变量可忽略

此处以x1,x2,x3,x3作为自变量,y作为因变量,t为时间变量。

若需建立对数模型,则可利用generate生成新变量。

generate logy = log10(y)#生成变量名为logy的新变量

第二步 多变量线性回归

regress y x1 x2 x3#对模型进行最小二乘法估计

运行结果

回归方程:

第三步 多重共线性检验

estat vif#方差扩大因子法检验

当VIF≥10,则认为自变量之间有严重的多重共线性。

运行结果

若模型出现多重共线性,可以剔除一些不重要的解释变量,或增大样本量。

第四步 异方差检验

imtest,white#White检验

如果输出的P-Value显著小于0.05,则拒绝原假设,认为存在异方差性。

运行结果

若模型出现异方差性,则不能用普通的最小二乘法进行估计,需要对原模型进行变换,使之满足同方差性假设,然后进行模型参数估计。通常可以采用加权最小二乘法(weighted least square,WLS)或BOX-COX变换法。

第五步 序列相关性检验

首先保证所用的数据必须为时间序列数据。

如果原数据不是时间序列数据,则需要自行定义一个:

gen n=_n #生成一个时间序列的标志变量n
 tsset n #将这个数据集定义为依据时间序列标志变量n定义的时间序列数据

接下来介绍三种检验方法

(一)残差图检验

predict e,r#生成残差值escatter eLe#生成残差散点图

运行结果

(二)DW检验(一阶自相关问题的常用检验法)

estat dwatson#DW检验

经验上,DW值在1.8-2.2之间时接受原假设,说明模型不存在一阶自相关,若DW值接近0或4,则拒绝原假设,认为存在一阶自相关。若落在模糊区域,则无法判断。

运行结果

(三)BG检验

estat bgodfrey#BG检验(默认检验一阶自相关)

若输出的P-Value显著小于0.05,则拒绝原假设,认为存在序列相关。

运行结果

若模型出现自相关,可以考虑用利用Cochrane-Orcutt迭代法进行修正。

后记:一个人往往会在他逃离命运的路上遇见命运,就如同此刻明明不想写论文,但是为了查资料不小心点进来的你一样,嘻嘻。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多