分享

体育统计与SPSS读书笔记(13)——多元逐步回归分析

 cfplhys 2012-05-09

二、多元逐步回归分析

多元线性回归分析指不只一个自变量的线性回归分析。多元线性回归方程可以表示为(以二元为例):

Y=b0+b1x1+b2x2

根据自变量的引入方式不同,又有多种多元线性回归。前面介绍一元线性回归分析时,自变量采用的是”enter”进入方式,这里说说另外一种自变量引入方式“stepwise”(逐步引入),这种方式的回归分析又叫逐步回归分析。

在实际问题中, 人们总是希望从对因变量 y有影响的诸多变量中选择一些变量作为自变量, 应用多元回归分析的方法建立最优回归方程以便对因变量进行预报或控制。所谓最优回归方程, 主要是指希望在回归方程中包含所有对因变量y影响显著的自变量而不包含对y影响不显著的自变量的回归方程。逐步回归分析正是根据这种原则提出来的一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对y的作用大小, 显著程度大小或者说贡献大小, 由大到小地逐个引入回归方程, 而对那些对y作用不显著的变量可能始终不被引人回归方程。另外, 己被引人回归方程的变量在引入新变量后也可能失去重要性, 而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行F检验, 以保证在引人新变量前回归方程中只含有对y影响显著的变量, 而不显著的变量已被剔除。

这里继续以前面的数据为例,不过本例把因变量设置为肺活量,自变量位身高、体重、耐力项目成绩、柔韧力量项目成绩、速度灵巧项目成绩。

 

步骤:

1.  SPSS里执行“分析—〉回归分析—〉线性”,弹出对话框,因变量设置为肺活量,自变量选择身高、体重、耐力项目成绩、柔韧力量项目成绩、速度灵巧项目成绩,方法选择“stepwise”,然后点确定。

 

2.  逐步回归分析结果,见下面的四个表格。

表格一:

该表格显示逐步回归的四个模型的复相关系数(R)及决定系数(R2)和校正的决定系数。从表中可以看出,随着引入自变量的增多,复相关系数也在增大。模型能解释的比率(校正的R2)也增大了。

 

       表格二:

      

   该表格为对逐步回归分析的四个模型进行F检验,从表中可以看出,四个模型都具有统计学意义。

 

表格三:

 

该表为各个系数的检验,从表中可以看出,各个模型的所有系数都具有统计学意义。

 

表格四:

 

该表格为新增的一个表格,主要是按照偏回归系数的大小逐步引入自变量。首先引入偏回归系数最高的身高变量(模型1),剩下的变量在固定了身高的影响后再进行分析,找到偏回归系数最高的,并进行显著性检验,只有在变量具有统计学意义的时候才能引入,从而依次引入了体重(模型2)、速度灵巧项目成绩(模型3)、柔韧力量项目成绩(模型4)。耐力项目成绩因检验不具有统计学意义,放弃引入。每引入一个变量都要进行F检验,以检查模型是否具有统计学意义(见表二)。

 

综合上面几个表格,可以得出逐步回归分析的回归方程依次为:

=-8307.226+70.996x1

=-5869.159+45.960x1+30.886x2

=-6003.115+46.459x1+30.975x2+8.555x3

=-6389.881+46.518x1+31.007x2+37.559x3+8.202x4

 

最后一个方程即为最优的回归方程。从回归方程也可以看出,肺活量与身高、体重、速度灵巧项目成绩、柔韧力量项目成绩均有线性正相关关系。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多