分享

多分类Logistic的SPSS实现

 CoLiN_shsmu 2018-04-15

空格在日常的数据分析中,我们常需要研究二分类因变量(如是否患病)或多分类因变量(如 A/B/O/AB型血)与一组自变量的关系,通常我们采用logistic回归来完成此类分析。大家对因变量为二分类变量的logistic回归的软件操作及结果解读可能较熟悉,但对多分类logistic回归的了解相对较少,今天我们来了解下因变量水平数大于2时的logistic回归。根据因变量水平是否有序又可分为有序多分类和无序多分类的logistic回归。两种模型原理不同,下面分别进行介绍。

 

 一、有序多分类 

空格当因变量的分类水平大于2且水平之间有等级关系(如疾病严重程度为:轻、中、重三个等级)时,需通过拟合累加Logit模型(Cumulative logits model)来进行logistic回归。需拟合的模型数为:水平数-1。如某四分类有序变量的取值水平分别为1、2、3、4;相应取值水平的概率为π1、π2、π3、π4,则应当同时拟合以下3个模型:

①logit[π1/(1-π1)]=logit[π1/(π2+π3+π4)]=α1+βX

②logit[(π1+π2)/(1-π1-π2)]=logit[(π1+π2)/(π3+π4)]=α2+βX

③logit[(π1+π2+π3)/(1-π1-π2-π3)]=logit[(π1+π2+π3)/(π4)]=α3+βX

空格模型中π1、π2、π3分别为因变量取第一、二、三类时的概率,第四类为参照。可见,这种模型实际上是依次将因变量划分为两个等级,不管模型中因变量的分割点在什么位置,模型各自变量的回归系数β都保持不变,发生改变的只有常数项α。此时的OR值是自变量每改变一个单位,因变量变化一个及以上等级的比值比。即自变量的回归系数与分割点无关,这是应用有序多分类logistic回归的一个前提。也就是说各回归方程在多维空间中互相平行,相应的检验方法称为平行线检验(Test of parallel lines)。

空格在多数情况下,平行性假设的前提都会满足,SPSS也提供了相应的检验方法。平行线检验P>0.05说明满足此前提条件。但如果平行线检验的P值非常小,需考虑更换连接函数或选用无序多分类的logistic回归进行模型拟合。

 

 实例解读 

空格研究性别和两种疗法对某病疗效的影响,疗效评价分为三个等级:显效、有效和无效。数据如下表,试进行logistic回归。

性别

疗法


疗效


合计

显效

有效

无效

新(treat=1)

5

2

7

14

(sex=0)

传统(treat=0)

1

0

10

11

新(treat=1)

16

5

6

27

(sex=1)

传统(treat=0)

6

7

19

32

空格本例有2个自变量:性别(共2个水平:男、女)和疗法(共2个水平:传统疗法和新疗法);因变量为三分类有序变量:疗效(共3个水平:显效1、有效2、无效3)。SPSS数据集如下:


sex

treat

effect

count

1

1

1

1

16

2

1

1

2

5

3

1

1

3

6

4

1

0

1

6


操作过程如下:

1.加权:

Data→WeightCases

WeightCases by: Frequency Variable框选入count

OK

2.Logistic回归:Analyze→Regression→Ordinal

Dependent:effect

Factors: sex, treat

OK

Output子对话框中可勾选平行线检验(Test of parallel lines),其他选项或对话框皆取默认值。

 

注:Factors框选入欲分析的分类自变量,可以是有序或无序多分类,系统会自动为它们生成哑变量(SPSS默认取高水平为参照)。Covariates框选入欲分析的连续型自变量。

 

SPSS主要结果的解读:


空格此表为总模型的似然比检验结果,最终模型和只含常数项的无效模型相比,Deviance(即-2对数似然比)由43.484下降到23.598,似然比卡方检验结果P<>


空格上表为拟合优度检验结果(Pearson检验P=0.752,Deviance检验P=0.607),结果显示模型拟合良好(P>0.05)。


空格上表为平行线检验的结果,结果显示P>0.05,说明各回归方程互相平行,可使用有序logistic回归进行分析。


空格上表为参数估计的结果。共给出4个参数,前两个为常数项α1=0.449,α2=1.303,后两个分别为性别和疗法这两个变量的回归系数。结果显示这两个自变量对疗效的作用都有统计学意义(P值均小于0.05)。具体来说,女性(sex=1)比男性(sex=0)的疗效好:疗效至少降低一个等级(显效1、有效2、无效3)的可能性,男性是女性的exp(1.319)=3.798倍;新疗法(treat=1)比传统疗法(treat=0)的疗效好:疗效至少降低一个等级的可能性,传统疗法是新疗法的exp(1.797)=6.032倍。


 二、无序多分类 

空格若因变量的水平数大于2,且水平间不存在等级关系时,需通过拟合广义Logit模型(Generalized logits model)来进行logistic回归。若因变量有K个水平,则除一个对照水平(SPSS默认取高水平为参照)外,以每一分类与对照水平作比较,拟合K-1个广义Logit模型。以4水平的因变量为例:因变量的取值水平分别为1、2、3、4;对 p 个自变量拟合3个广义Logit模型:

①logit(π1/π4) = α1 + β11·X1 + ... + β1p·Xp

②logit(π2/π4) = α2 + β21·X1 + … + β2p·Xp

③logit(π3/π4) = α3 + β31·X1 + … + β3p·Xp

空格显然,同时应当有:P1+P2+P3+P4=1。其中Y=4为参照,如果希望比较水平2和水平3,则直接将 Logit P2和 Logit P3相减即可得到相应函数。

 

无序多分类的logistic回归模型一般可用于以下几种情况:

(1)因变量为无序多分类;

(2)因变量为有序分类,但存在以下情况:①平行线检验(test of parallel lines)P<>

 

 实例解读 

空格研究不同学校和不同课程计划对学生学习方式偏好的影响,数据如下表,试进行logistic回归。

学校

课程计划

学生偏好的学习方式(style)

(school)

(program)

自修

小组

上课

1

常规

10

17

26


附加

5

12

50

2

常规

21

17

26


附加

16

12

36

3

常规

15

15

16


附加

12

12

20


空格本例有2个分类自变量:学校(共3个水平:1、2、3)和课程计划(共2个水平:常规1、附加2);因变量为三分类无序变量:学习方式(共3个水平:自修1、小组2、上课3)。SPSS数据集如下:


school

program

style

count

1

1

1

1

10

2

1

2

1

5

3

2

1

1

21

4

2

2

1

16


操作过程如下:

1. 加权:

Data→WeightCases

WeightCases by: Frequency Variable框选入count

OK

2. Logistic回归:Analyze→Regression→Multinomial Logistic

Dependent:style

Factors:school, program

OK

其他选项或对话框皆取默认值。

 

SPSS主要结果的解读:


空格同前,总模型的似然比检验结果显示,最终模型和只含常数项的无效模型相比,Deviance(即 -2对数似然比)由78.128下降到51.303,似然比卡方检验结果P<>


空格接下来分别对每个自变量的作用进行似然比检验。自变量school的P值小于0.05,表明该自变量对模型的作用是有统计学意义的。同理,自变量program也有统计学意义。


空格最后是参数估计的结果。“自修”部分为第一个广义Logit模型的参数估计,“小组”部分为第二个广义Logit模型的参数估计。其中school=3,program=2为各个自变量的参照水平,因此其参数默认为0,无法估计。

 

结果表明:

1、“自修”与“上课”两种学习方式相比,学校1的学生选择“自修”的可能性是学校3的学生的0.269倍(χ2=11.783,P<0.05),而学校2和学校3的学生对学习方式的偏好没有差别(χ2=0.052,p>0.05)。“常规”学习计划的学生选择“自修”的可能性是“附加”学习计划的学生的1.855倍(χ2=4.702,P<>

2、“小组”与“上课”两种学习方式相比,学校1与3、学校2与3的学生对学习方式的偏好皆无差别(P值分别为0.053, 0.356)。同样,“常规”学习计划的学生选择“自修”的可能性是“附加”学习计划的学生的1.887倍(χ2=5.417, P<>


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多