之前我们详细讲解了因变量为二分类的变量的影响因素的分析,采用二元Logistic回归分析。 但是在实际情况中,有些因变量的数据类型为连续数值型变量,并无特定的分类,这时候要分析他的影响因素,就无法采用logistics回归,由于变量数据为线性数值,这里就要采用线性回归模型来分析。 本次我们就来详细讲解SPSS多元线性回归在医学统计分析中的应用操作。 先来看今天的案例,我们采集了80位患者的骨吸收的数值数据,临床上可能对其造成影响的因素有吸烟、牙周炎、CA、固位方式、性别、年龄、固定支架直径、长度、修复类型、位置这些因素。如下图1: (图1) 我们要分析吸烟、牙周炎、CA、固位方式、性别、年龄、固定支架直径、长度、修复类型、位置这些因素这些因素中,哪些确实是对骨吸收有显著的影响。就要以骨吸收为因变量,以吸烟、牙周炎、CA、固位方式、性别、年龄、固定支架直径、长度、修复类型、位置为自变量,采用多元线性回归模型分析。这里要注意的是,CA、年龄、为线性变量,可以直接作为自变量,但是吸烟、牙周炎这些属于分类变量,本应先对其进行虚拟化,才能作为自变量,但是由于这里的分类变量全部为二分类,因此虚拟化操作和当前实际一致,因此可直接作为自变量。关于如何做多分类自变量虚拟化的线性回归,我们将在今后的文章中再另行详解。 下面进行SPSS多元线性回归的操作步骤 ①点击“分析”--“回归”--“线性”,在弹出的回归对话框中,将骨吸收选入因变量框中,将其他变量选入自变量框中。 (图2) (图3) ②进行相关的输出和参数设置,点击右侧“自助抽样”按钮,在弹出的对话框中勾选“执行自助抽样”,“置信区间”级别填写95。然后点击继续,确定按钮。 (图4) ③得到输出结果,并进行分析。这里我们只对重要的表格进行详细讲解分析。 (图5) 模型摘要这张表,主要看R方为52.6%,大于50%,说明数据与模型拟合程度较好。 (图6) ANOVA这张表,F=7.653,P<> (图7) 系数表这张表就是我们分析的主要结果,反应了自变量与因变量之间的具体影响关系。首先看显著性水平,在0.05的显著性水平下,可以看到。吸烟、CA是P<0.05,能显著影响骨吸收的,回归系数b分别为0.387和0.07都大于0,说明ca值越高,骨吸收的值就随之越高。吸烟这里由于参考类别为0(不吸烟),因此就是吸烟患者的骨吸收比不吸烟的显著要高。而其余自变量则不能显著影响骨吸收,他们的p>0.05。 (图8) 上图为95%置信区间,一般如果在分析报告中需要置信区间,则将上表红框标注的部分添加到图7表格后面,这里不再赘述。 以上就是今天我们讲到的SPSS多元线性回归在医学统计分析中的应用操作及分析, 回顾一下知识点:1,因变量为连续数值型变量 2,自变量可以为数值型,也可以为分类型,但是多分类自变量需要虚拟化 3,回归结果主要看3张表,模型摘要、ANOVA、系数表。至于如何操作与使用虚拟线性回归,将在下一讲中详细讲解,敬请大家的关注! |
|
来自: 洪梅6jraxg3utr > 《统计》