线性回归的因变量Y必须为连续变量,但当我们研究的因变量为分类变量时,因为不再是随机变量,不符合正态分布,因此不能采用线性回归,此时应该使用Logistic回归。 SPSS有话说 概述 Logistic回归分析也用于研究变量之间的影响关系,即X对Y的影响情况,此处涉及的Y是分类数据。结合Y的具体情况,Logistic回归分析可以分为三种,分别是二元Logistic回归、多元无序Logistic回归和多元有序Logistic回归。Logistic回归分析的分类情况如下图: 如果因变量Y仅有两个类别,分别是有无之类的分类数据,则属于二元Logistic回归分析。如果因变量Y有两个以上的类别,并且类别之间没有高低、顺序关系,比如血型“A型、B型、AB型和O型”,则可以使用多元无序Logistic回归分析。如果因变量Y的类别有两个以上的类别,并且类别之间有高低、顺序关系,如伤痛级别“轻度、中度、重度”,则可以使用多元有序Logistic回归分析 问卷研究中,二元Logistic回归使用频率最高,该方法简单易懂,多元无序Logistic回归和多元有序Logistic回归则相对复杂。本次仅对二元Logistic回归进行说明。 特别提示 在进行二元Logistic回归(包括其他Logistic回归)分析前,建议先通过单因素分析(t检验、卡方检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再进行多因素分析,这样可以保证结果更加可靠。同时为了防止一些有意义的自变量被单因素分析剔除,单因素分析时将检验水准设为P<0.01,只要小于0.01,就认为有意义,然后进行多因素分析。 操作步骤 问题:性别、学历、独生子女对去新疆就业意愿的影响? 性别:1=男,2=女; 学历:1=研究生,2=本科生; 独生子女:1=是,2=否; 就业意愿:1=愿意,0=不愿意。 (一)单击“分析” “回归” “二元logistic” (二)选入相应的因变量和自变量,如图所示。 (三)单击“分类”,将各分类变量选入“分类协变量”框中,将参考类别选中“第一个”,单击“更改”。 注:在参考类别的右侧选择First(表示选择变量COPD中,赋值最小的,即“0”作为参照。如果选择Last则表示以赋值最大的作为参照)。 (四)单击“选项”,勾选“Hosmer-Lemeshow拟合度”和“exp”(OR值),继续。 结果解释 ①该结果显示各变量的编码情况。 ②模型系数的Omnibus检验表明该模型总体有意义,R平方值越接近1,回归模型拟合越好。 ③“Hosmer-Lemeshow”检验,sig=0.443>0.05,即模型拟合优度较高。 ④该结果显示,学历(P<0.01,OR=1.684)、独生子女(P=<0.01,OR=0.599)纳入模型中有统计学意义,性别(P>0.05)无统计学意义;常量,即截距,在模型中无实际意义。根据上述的结果,研究生的就业意愿是本科生的1.684倍,非独生子女的就业意愿是独生子女的1.669倍(1/0.599)。 特别提示 OR值的含义为:相对于赋值较低的研究对象,赋值较高的研究对象发生某种情况风险的多少倍。例如,男生吸烟发生的可能性是女生的1.292倍。对于连续型变量,如:年龄,即年龄每增加1岁,患鼻咽癌的风险增加OR倍。 |
|
来自: 洪梅6jraxg3utr > 《统计》