分享

练习Stata:自相关性数据不适合线性回归

 数据小兵 2022-01-21


我在「统计问答」星球里发起了【读书笔记】栏目,目前在读的图书有《MedCalc统计分析方法及应用》《计量经济学及Stata应用》《应用STATA做统计分析》和孙振球版《医学统计学》。

Stata我是新接触,我选择了《应用STATA做统计分析》这一本来补充基础知识,基础不牢,大厦会倒,这很重要。


======

今天练习的主题是:线性回归残差自相关。

我曾在SPSS视频课程中发过一个线性回归案例,收集到10年共120个月的女装销售数据,当时我采用跟服装营销有关的5个变量进行回归和销售的预测。


只看回归方程的话,模型还不错,如果仔细考虑的话,它就不对了。服饰品销售自身就有很强的季节性变化,而且数据本身就是时间序列数据,如果说该数据有较强的自相关性,那么线性回归还适合吗?

回归之残差要求独立性,显然应该考虑这个问题。

Stata在线性回归方面优势非常明显,我现在先对因变量“女装销售”绘制自相关图,观察一下目标变量的自相关性。

ac 女装

自相关图如下:


比较明显的一个拖尾形态,而且可以看到有季节性变化,1阶、12阶、24阶、36阶自相关系数较高。12阶在0.6以上,这刚好也符合现实含义,服装市场存在淡旺季的季节性变化。自相关性不容忽视。

接下来,我直接拟合一个5个自变量X1~X5的多元回归,咱们来看回归残差的自相关性表现。

regress 女装 邮件量 手册页数 电话量 广告费 客服数量predict yres,residual

残差自相关图如下:


回归残差的自相关图,仍然表现出拖尾状态,而且仍然继续可以观察到以年为单位的季节性变化,12阶自相关系数0.5以上,因此综合来看,该组数据拟合线性回归是不合适的。可以考虑时间序列预测,甚至在时间序列基础上附加自变量影响。

本文完
文/图=数据小兵

读书笔记:

Stata:方差分析/误差线图
Stata:交叉表与卡方检验
Stata:绘制统计图形
Stata:字符串转换为数值型变量
Stata的正版官方报价是多少?

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多