本文共计1800字(多图),建议阅读时间2分钟目录
多元线性回归分析的三步,都大致跟一元线性回归分析差不多,相似部分就略过。 到这篇文章为止,「Excel统计分析之线性回归」系列就完成了。总共三篇文章。 现在发送关键词消息【回归分析】到「数据分析师修炼手册」公众号,就可提取本文示例Excel文档了。 建模三步骤多元线性回归分析案例: 多元线性回归分析案例数据 建立模型函数法多元线性回归模型为: 其中ε随机误差。 多元线性回归方程的矩阵形式: 公式示意 对上面等式求极值,也就是说所有自变量X求偏导=0,得到n元一次方程组。 Excel中的MDETERM函数就是用来求解多元一次方程组的,求解可得到所有X变量的斜率,通过待定系数法,得到截距。 公式就不贴了,大家自己看Excel吧。不明白的还可以私信来问。我看到了会解答的。 另外,通过LINEST函数做多元线性回归,可以更加方便便捷。——这里强烈推荐。 附LINEST用法(来自微软官网的LINEST 函数介绍): LINEST 函数 返回的回归统计值数组 但这也是有点难以看懂的吧。我把输出结果用色块区分了下,应该更好读了。 使用LINEST函数的多元线性回归模型 中间有一些阴影框的区域就是使用LINEST函数的区域,只用在最左上角输入函数公式 回归工具用法跟前面一篇文章讲一元线性回归分析的一模一样,只不过X值区域选择范围更大了而已。 回归分析工具界面 输出结果如下 回归分析工具 输出结果 规划求解同样地,还可以通过规划求解的方式获得模型参数。 得到的参数值,也都是跟上述所有方法得到的一模一样。不再赘述了。 分析模型——模型显著性检验&优化在多元线性回归分析中,显著性检验包含两个方面: 整体显著性检验多元线性回归方程的方差分析,列表如下 P值小于0.05,通过总体显著性检验,说明模型整体是有效的,所建立的回归模型是有统计学意义的。 与回归工具输出的第二部分结果也是一模一样。(唯一不同的是,回归工具输出的是Significance F,而不是P值) 回归系数显著性检验 回归工具返回的结果,和LINEST函数所做的检验,都是T检验。 回归分析工具输出的回归系数显著性检验 与前面提到的 使用LINEST函数的多元线性回归模型 两个方法下,各个回归系数的P值结果都一样。 并且我们可以看到,其中X4(阅读关注率)的P值最小,是0.01796,X1(送达阅读率)的P值次之,为0.06948,但已经超过了0.05水平。X3(阅读完成率)P值0.10573,离0.05还有点近。但X2(首次分享率)P值就非常大了。 整体显著,部分回归系数不显著,如何处理? 建议把P值接近0.05的自变量保留剔除其他自变量,再重新建模。 使用回归工具重新建模如下 回归输出(剔除X2) 可以看到,模型得到了优化,所有回归系数都显著了,X3(阅读完成率)P值0.03057,降到了0.05以下。 综上,可以得出结论,对获取平台推荐流量最有效的指标是阅读关注率、其次是送达阅读率和阅读完成率。 应用模型——因变量预测见Excel示例文件中的G4-G10单元格。此处略。 最后给大家介绍一本书,也是本系列文章的主要参考文献。是一块大部头,对Excel统计分析比较感兴趣的,推荐购买,可作为工具书,随时翻看。 |
|