分享

SPSS回归分析到底有多少种?该如何选择?

 思想年代 2020-08-06
SPSS多元线性回归分析

案例解析

关键词:SPSS 回归

    SPSS回归分析是研究变量之间因果关系的一种统计模型。回归分析中的因变量,就是因果关系中的结果;回归分析中的自变量,就是因果关系中的原因。

    基于结果变量(因变量)的种类,回归分析又可以分为线性回归(因变量为连续变量)、logistic回归(因变量为分类变量)、泊松回归(因变量为计数变量);这三种回归模型中自变量则可以是任意类型的变量。

    本期课程以《卵巢癌患者情绪状况的影响因素》为案例,详细介绍SPSS线性回归模型,并对模型的诊断给出详细解释和阐述。      

请观看下方视频教程

全屏播放请关闭手机中“方向锁定”,然后将手机横向放置

(若无法播放,请联系客服微信3301888200)


    案例介绍:对69名卵巢癌患者进行问卷调研,通过调研结果对她们的情绪状况、疲倦状况、恶心与呕吐状况、疼痛状况、呼吸困难状况、失眠状况、食欲丧失状况进行评分,最后,通过评分数据来考察卵巢癌患者情绪状况的影响因素。

    统计方法:线性回归分析。因为情绪状况为本次研究的结果变量,该变量为评分数据,属于连续数值型变量,因此统计方法应该选择线性回归分析。

    数据展示:本次案例的数据如下图所示:

    本次研究中,结果变量(因变量)为情绪评分,自变量则是情绪的可疑影响因素,即疲倦评分、恶心与呕吐评分、疼痛评分、呼吸困难评分、失眠评分、食欲丧失评分。

SPSS线性回归分析操作步骤:

STEP1:点击“分析”→“回归”→“线性”,然后将自变量和因变量选进对应的对话框

STEP2:点击“统计”,勾选“共线性诊断”和“德宾-沃森”:

STEP3:点击“图”,将ZPRED选进X轴,ZRESID选进Y轴,勾上“正态概率图”:

最后点击“继续”,再点击“确定”,即可得到运算结果:

以上结果的分析如下:

1、模型摘要表。回归模型的拟合度调整R方=0.657,拟合度较好,意味着自变量能够解释因变量变化原因的65.7%,即卵巢癌患者的情绪状况有65.7%是由疲倦、恶心与呕吐、疼痛、呼吸困难、失眠、食欲丧失引起的;

2、系数表。显著性P<0.05的自变量有疲倦、恶心与呕吐、疼痛、呼吸苦难这四个自变量可以显著影响患者情绪,而失眠和食欲丧失这两个自变量不能显著影响情绪。更进一步,疲倦、恶心与呕吐、疼痛、呼吸困难的回归系数均为负数,意味着这4个自变量显著负向影响患者的情绪,即患者的疲倦、恶心与呕吐、疼痛、呼吸困难症状越严重,情绪状况越不好。

3、基于以上的分析,得出情绪与疲倦、恶心与呕吐、疼痛、呼吸困难之间的定量关系(回归方程)如下:

情绪=94.183-0.277*疲倦-0.213*恶心与呕吐-0.301*疼痛-0.177*呼吸苦难

    然而,以上的分析仅仅只是对回归运算结果的分析。这个结果是否准确可靠、是否具有可信度,还需要继续对本次的回归模型进行诊断:

    诊断1:线性回归模型要求自变量之间不存在多重共线性

    所有自变量的VIF值全部小于5,意味着变量之间不存在多重共线性,诊断1通过。

    诊断2:线性回归模型要求残差服从正态分布

    PP图散点全部在对角线上,意味着本次回归模型的残差服从正态分布。诊断2通过。

    诊断3:线性回归模型要求样本之间不存在序列相关(仅仅时序类数据需要进行该诊断)

    考察样本数据之间是否存在序列相关的统计量是DW(德宾-沃森),DW值在2附近,意味着样本数据之间无序列相关。

    本次回归模型的DW=1.08,偏离2比较远,意味着样本数据存在序列相关性。但是,由于本次的样本数据不是时序类数据,而是普通的截面数据(样本数据是针对不同患者在同一个时间段搜集的),因此诊断3(序列相关)可以不考虑。

    综合以上分析,本次线性回归模型的结果是稳定可靠的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多