——关于这篇笔记,有的人嘴上说着不想写,下笔实际上很快乐。第一步 导入excel文件clear #清除所有变量cd D:\stata_data #数据保存的地址import excel sample.xlsx, firstrow #导入数据,文件名为sample.xlsx,把第一行作为变量名tsset t#建立时间序列 若不存在时间变量可忽略 此处以x1,x2,x3,x3作为自变量,y作为因变量,t为时间变量。 若需建立对数模型,则可利用generate生成新变量。 generate logy = log10(y)#生成变量名为logy的新变量 第二步 多变量线性回归regress y x1 x2 x3#对模型进行最小二乘法估计 运行结果 回归方程: 第三步 多重共线性检验estat vif#方差扩大因子法检验 当VIF≥10,则认为自变量之间有严重的多重共线性。 运行结果 若模型出现多重共线性,可以剔除一些不重要的解释变量,或增大样本量。 第四步 异方差检验imtest,white#White检验 如果输出的P-Value显著小于0.05,则拒绝原假设,认为存在异方差性。 运行结果 若模型出现异方差性,则不能用普通的最小二乘法进行估计,需要对原模型进行变换,使之满足同方差性假设,然后进行模型参数估计。通常可以采用加权最小二乘法(weighted least square,WLS)或BOX-COX变换法。 第五步 序列相关性检验首先保证所用的数据必须为时间序列数据。 如果原数据不是时间序列数据,则需要自行定义一个: gen n=_n #生成一个时间序列的标志变量n tsset n #将这个数据集定义为依据时间序列标志变量n定义的时间序列数据 接下来介绍三种检验方法 (一)残差图检验predict e,r#生成残差值escatter eLe#生成残差散点图 运行结果 (二)DW检验(一阶自相关问题的常用检验法)estat dwatson#DW检验 经验上,DW值在1.8-2.2之间时接受原假设,说明模型不存在一阶自相关,若DW值接近0或4,则拒绝原假设,认为存在一阶自相关。若落在模糊区域,则无法判断。 运行结果 (三)BG检验estat bgodfrey#BG检验(默认检验一阶自相关) 若输出的P-Value显著小于0.05,则拒绝原假设,认为存在序列相关。 运行结果 若模型出现自相关,可以考虑用利用Cochrane-Orcutt迭代法进行修正。 后记:一个人往往会在他逃离命运的路上遇见命运,就如同此刻明明不想写论文,但是为了查资料不小心点进来的你一样,嘻嘻。 |
|