医务工作者的医学统计词典 品质源于专注 服务源于真心 在SPSS中进行Fisher判别分析的 具体操作及研究意义 关键词:SPSS、判别分析 导 读 临床研究中,常常需要根据患者的主诉、体征、检查结果等作出诊断,如对于腹痛的患者,需要诊断具体的患病原因,若确诊为饮食造成的急性肠胃炎,还需要诊断具体是何种食物导致的刺激,以为病人提供合理的治疗方案和建议。而判别分析就是这样一种辅助医学鉴别诊断的数学方法。比较经典的判别分析方法有Fisher判别和Bayes判别。 本期,我们就来具体介绍Fisher判别的基本原理、适用范围及其在SPSS中的具体操作应用。 下方为视频版和音频版,含软件操作步骤 (1)判别原理 Fisher判别又称典则判别(canonical discriminant),适用于两类和多类判别。以两类判别为例,已知有A、B两类观察对象,A类有nA例,B类有nB例,分别记录了X1,X2,Xm个观察变量,其基本思想是,找到一个线性组合:Z=C1X1+C2X2+...+CmXm,使得综合指标Z在两类的均数间的差异尽可能大,而两类内综合指标Z的变异尽可能小,即要使达到最大。 (2)判别规则 按照Z=C1X1+C2X2+...+CmXm分别计算判别函数值Zi,并进一步求Zi的两类均数、和总均数,按下式计算判别界值: 判别规则: (3)判别效果评价 判别效果一般用误判概率P来衡量。P=P(A | B)+P(B | A),其中P(A | B)是将B类误判为A类的条件概率;P(B | A)是将A类误判为B类的条件概率。一般要求判别函数的误判率小于0.1或0.2才有应用价值。 判别分析有以下要求: ①各判别变量近似服从正态分布; ②变量间不存在多重共线性; ③各组样本的协方差矩阵相等; ④样本量应是自变量个数的10~20倍以上时,建立的判别函数比较稳定;而在8~10倍之间时,函数的判别效果比较理想。 我们收集了一份原发性肾小球疾病(PGD)的三种主要病理类型(MsPGN、MPGN、FGS)及其临床特征的57名患者的样本数据,其中有3名患者的疾病类型未知,欲探讨在不经肾活检的情况下来预判其原发性肾小球疾病的病理类型,已知患者性别在病理类型上无显著差异(P=0.284>0.05),样本数据具有可比性;判别指标感染史、病程、尿量、尿RBC和尿蛋白定量之间不存在多重共线性。采用Fisher判别分析,具体操作如下: (1)在SPSS中的具体操作 ①依次点击“分析——分类——判别式”。 (点击图片查看大图) ②出现“判别分析”的窗口。 (点击图片查看大图) ③将病理类型分类放入“分组变量”,点击“定义范围”,最小填入1,最大填入3。 (点击图片查看大图) ④将其他指标“病程”“尿量”“尿RBC”和“尿WBC”;点击“统计”,勾选“平均值”、“费希尔”和“未标准化”。 (点击图片查看大图) ⑤点击“分类”,勾选“摘要表”、“合并组”和“领域图”。 (点击图片查看大图) ⑥点击“保存”,勾选“预测组成员”。 (点击图片查看大图) ⑦点击“继续”,选择“一起输入自变量”。然后点击“确定”,得到检验结果。 (点击图片查看大图) (2)结果解读 ①首先,查看“威尔克Lambda”表,可以看到,函数1的Lambda检验显著性P=0.000<0.05,提示采用函数1得到的判别结果是有效的,效能很高,而函数2的判别结果是无效的,效能低(P=0.681>0.05)。 ②进一步,由“特征值”表,“特征值”表反映了典型函数所能解释的方差变异程度,由函数1的方差百分比值为99.2%,说明函数1能够解释变量的占比达到99.2%,解释能力很高。 ③进一步,结合查看“典则判别函数系数(未标准化系数)”和“典则判别函数”图,图表中给出的是利用样本数据结合函数1和函数2判别出样本数据的所属类别。 ④查看“分类函数系数”表,由该表可以直接得出各诊断类别的Fisher判别函数。以MsPGN为例,其判别函数为: MsPGN=-70.094+26.498*感染史+0.588*病程+0.657*尿量+2.340*尿RBC+3.876*尿蛋白定量 ⑤最后,查看“分类结果”表,由该表下备注可知,函数1根据判别指标对数据进行正确判别的准确度达到了85.2%。 ⑥并回到变量数据窗口,可以看到,数据列中出现了“Dis_1”列数据,该列数据呈现的则是经Fisher判别分析后的判别结果。可以看到,未知分类的患者已经由其他54名患者的信息给出了其相应的判别类别。 |
|