spss kappa 分析补充说明

皈依沙漠 2011-11-17

展开全文

spss kappa 分析补充说明

2009-02-17 15:44:44| 分类： spss学习 | 标签： |字号大中小订阅

关于对诊断一致性Kappa系统的探讨
对诊断一致性的简单Kappa系数、加权Kappa系数以及总Kappa系数进行了分析和说明，由于Kappa系数仅适用于行数和列数相等的方表，针对Kappa检验的这一局限性，给出了行数和列数不一致时使用SPSS软件实现Kappa检验的方法。

　　关键词：诊断试验；一致性检验； Kappa系数

　　在诊断试验中，研究者希望考察不同的诊断方法在诊断结果上是否具有一致性。诊断试验的一致性检验经常用于下列两种情况［1］：一种是评价新的诊断试验方法与金标准的一致性；另一种是评价两种诊断试验方法对同一个样本(化验对象)的化验结果的一致性、两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性等。1960 年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明，它是一个描述诊断的一致性较为理想的指标，因此在临床试验中得到广泛的应用。

　　本研究分别给出三种Kappa系数，即简单Kappa系数，加权Kappa系数和总Kappa系数及标准误和检验统计量的计算公式，并针对Kappa系数仅适用于行数和列数相等的方表的问题，给出了用SPSS软件实现对行列数不等资料的Kappa检验方法。

　　1 简单Kappa系数的计算公式［1］

　　K=P0-Pe[]1-Pe(1)

　　其中P0=∑ipii，称为观测一致率，Pe=∑ipi.p?i，称为期望一致率，即两次检验结果由于偶然机会所造成的一致率，其中 pi.=Ri[]N, p?i=Ci[]N, Ri,Ci分别为第i个格点所对的行合计和列合计，N为总例数。当两个诊断完全一致时，P0=1，此时Kappa值为1。当观测一致率大于期望一致率时，Kappa值为正数，且Kappa值越大，说明一致性越好。当观察一致率小于期望一致率时，Kappa值为负数，这种情况一般来说比较少见。根据边缘概率的计算，Kappa值的范围值应在-1~1之间。Kappa≥075两者一致性较好；0.75>Kappa≥0.4两者一致性一般；Kappa<0.4两者一致性较差。

　　Kappa系数标准误的计算公式为：

　　S=Pe+P2e-∑ipi.p?i(pi.+p?i)[](1-Pe)N(2)

　　其95%的置信区间为：

　　(k-1.96S, k+1.96S)(3)

　　由于Kappa值是一个样本统计量，作是否有统计学意义的假设检验时，应选用统计量：

　　U=Kappa[]S(4)

　　2 加权的Kappa系数［2］

　　加权的Kappa系数是简单Kappa系数的推广，是用加权的方法对两个评价结果进行量化。对于四格表来说，简单Kappa系数与加权的Kappa系数是相等的，对于一般的行列表，加权的Kappa系数的计算公式为：

　　Kw=P0(w)-Pe(w)[]1-Pe(w)(5)

　　P0(w)=∑i ∑jwijpij

　　Pe(w)=∑i ∑jwijpi.p?j

　　其中0≤wij=wji<1, i≠j, wij=1。

　　加权Kappa系数的标准误计算公式为：

　　Skw=∑i ∑jpi.p?j［wij-(i.+?j)］2-P2e(w)[](1-Pe(w))2 N(6)

　　95%的置信区间为:

　　(kw-1.96Skw, kw+1.96Skw)(7)

　　假设检验的统计量为U=kW[]Skw(8)

Kappa的权系数一般使用CicchettiAllison和FleissCohen两种权值类型［2］，CicchettiAllison的计算公式为：

　　wij=1-|Ci-Cj|[]Ck-Ci(9)

　　FleissCohen的计算公式为：

　　wij=1-(Ci-Cj)2[](Ck-Ci)2(10)

　　其中，Ci表示第i列的评价分值，k表示列数。如果是数值型变量，评价分值Cij就是第i行第j列对应的具体数值；如果是分类变量，可按照相应级别进行赋值。由于wij=1，而当i≠j时，0≤wij<1，所以由Kappa系数的计算公式可知加权的Kappa系数大于简单Kappa系数。

　　3 总Kappa系数

　　假设列联表为多向列联表(我们不妨设有q个方向)，且每个变量有两个水平，即为2×2×…×2列联表，令ki表示第i个变量的Kappa系数，Ski表示第i个Kappa系数的标准误，则总Kappa系数的计算公式为：

　　K总=∑q[]i=1 ki[]Ski ／ ∑q[]i=1 1[]Ski(11)

　　若要检验各变量Kappa系数是否都相等，可采用自由度为q-1的χ2检验，计算公式为：

　　χ2=∑q[]i=1 (ki-k总)2[]Ski(12)

　　(11)、(12)两个公式均适用于加权的Kappa系数。

　　4 行列数不等时Kappa系数的计算

　　Kappa系数的计算适用于两个评价人分级水平数相同的情况，即数据格式为行数和列数相等的方表。而在实际操作中，经常会出现分级水平数不一致，即行列数不等的情况。我们来看一个实例：两名医生按照某项指标的1~4个等级来评价8个病人。一个医生用全部4个等级进行评价，而另一医生只有3个等级进行评价。此时，对于两个医生来说，他们评价的级别范围不同。数据见表1。

　　表1 甲乙两医生对病人的评价（略）

　　下面我们使用SPPS软件获得Kappa值及检验结果。SPSS 110或更低的版本在这种情况下均无获得Kappa统计量。SPSS115以上的版本可以计算出Kappa值。首先进入数据编辑器并给甲医生添加额外的观测值0001。数据录入见图1。选择Analyze→Descriptive Statistics→Crosstabs，将变量甲，乙分别放入对应的行列框内，选择Statistics按钮，得到如下对话框(图2)，选择 Kappa复选框，按continue即可输出Kappa值、标准误和P值。

　　相应的结果为：

　　Kappa=0.810, P=0.001,S=0.176。

　　5 讨论

　　在诊断试验的研究中，数据资料多为双向有序的列联表资料，即两个变量都是有序变量，而且属性相同。属性相同分为三种情况，一种情况是属性、分级水平数和分级水平都完全相同。如甲医生和乙医生都把病人的检查结果分为1、 2、3、4四个等级。此时可直接作Kappa检验。当这两个变量都只有2个水平时，就成为配对设计的四格表资料，可使用配对χ2检验，即McNemar检验。第二种是属性相同的分级水平数相同，但分级水平不全相同。如甲医生和乙医生都把病人的检查结果分为四个等级，但甲医生的分级为1、2、3、4，而乙医生的分级为2、3、4、5。在这种情况下，由于列联表的行数和列数仍然是一致的，即列联表仍为方表，所以也可计算出相应的Kappa统计量。第三种是属性相同，但分级水平数和分级水平不全相同。这种情况就是我们所说的列联表的行列数不一致。由于收集上来的数据不能轻易删除掉，所以我们考虑添加行或列使联表成为方表。如行数为n，例数为n-1，则我们只需要添加第n列，在第n行第n列的格点中添加权值0001，而第n行的其它格点均设为0，就可以命名其成为方表，并计算Kappa统计量了。由于权值系数很小，所以不会影响Kappa值的计算结果。

　　另一方面，如果两个变量中有一个变量是金标准，那么我们不但能分析出检验结果的一致性，还可以计算出敏感度、特异度、误诊率和漏诊率等指标。如果有不同的诊断分界点，还可以绘制出ROC曲线。

　　诊断试验的评价［3］在医学研究中具有十分重要的意义，目前大多数文献都使用Kappa统计量来检验结果的一致性。所以本研究主要是对Kappa系数作一个探讨和分析。诊断试验评价的统计学方法还会随着更多问题的提出和解决而不断得到发展、修正和扩展。

spss kappa一致性检验

想要检验两位检查者对同一位患者检查结果的一致性，不知用spss如何计算kappa值，最好有截图，包括数据的录入。

检查数据是牙周袋探诊深度，根据不同的患者，数据是大于1的整数，单位是毫米，一般最大14左右，但不一定1～14每一个数值都有。如下是检查的一组数据，甲乙分别为两位不同的检查者，请问各位高手，该如何计算kappa？

甲乙
1 1
1 1
1 1
1 1
1 1
1 1
1 2
1 2
1 2
1 2
1 2
1 2
1 2
1 2
1 2
1 2
1 2
1 2
2 1
2 1
2 1
2 1
2 1
2 1
2 1
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 2
2 3
2 3
2 3
2 3
2 3
2 3
2 4
3 1
3 1
3 1
3 1
3 1
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 2
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 3
3 4
3 4
4 2
4 2
4 3
4 3
4 3
4 3
4 3
4 3
4 3
4 3
4 3
4 3
5 2
5 3
5 3
5 3
5 3
5 3
5 3
5 3
5 3
5 3
5 4
5 4
5 4
5 4
6 3
6 4

解决方法:
analyze-descriptive statistics-crosstab
statistics-Kappa

我做的免疫组化，数据为等级资料，想分析两个指标的相关性，请问“如何使用SPSS进行等级资料的Spearman非参数相关分析”谢谢！

Analyze->Correlate->Bivariate->将两个指标选入右框，然后在框下面勾上Spearman－>OK

但是那两个指标的结果是+、++、+++等，是否还要定义一个变量表示等级？

对，输入格式如下：
指标1 指标2 频数
1 1 21
1 2 32
1 3 21
1 4 21
2 ......
........

频数治疗要加权，Data－》weight cases－》选入要加权的频数

明白了，这种相关分析对变量的定义和“秩和检验”对变量的定义是一样的，频数都要加权！十分感谢“统计之星”对我的帮助，谢谢！

younger611981你好!我想请教一个问题.我也做的免疫组化,两组等级资料,四个等级,分别是—、+、++、+++。每组42个样本.输入格式如下：
指标1 指标2 频数
1 1 4
1 2 6
1 3 8
1 4 24
2 ......
........
但我觉得疑问的是：最后的N是42还是应该是84？谢谢！期盼您的回复！

我不是专业学统计学的，但我翻了一下倪宗瓒编写的《医学统计学》，其中对等级资料的Spearman非参数相关分析有如下阐述：
Spearman非参数相关分析“其基本思想是将n对实测值x,y分别由小到大编秩，并以其秩次进行积矩相关分析”，据上N应是42，希望对你有所帮助！

“zogzhuzhu”你是皮肤科的？

我的标本是36例，但我今天用SPSS算了以后发现最后的N是72！这是怎么回事？

等级资料的相关性分析可以进行Kappa检验，即一致性检验，求kappa值。如果kappa〉0.75, 两个指标的一致性非常好，即相关性高，kappa值在0.4~0.75之间，两个指标间的一致性中等，kappa<0.4, 两个指标间一致性较差。

younger611981您好,我用spss12.0做出来的结果和你的一致,即N是标本数的两倍,非常疑惑!按道理和我看过的文献,N应该恰好是标本数才对.

hanchunhee您好!请问在spss12.0中如何操作Kappa检验呢?

首先，选择DATA菜单中的最后子菜单weight, 权重结果变量。然后选择ANALYZE菜单中的第二个子菜单中的crosstable, 将行变量和列变量分别移动到相应的框内，在最下面点击statis...打开统计方法选择对话框，选择kappa, OK，返回，然后OK. 就可以得到结果。就这么简单。仅供参考。

hanchunhee您好:kappa检验是不是仅适合四格表的情况?

kappa检验适合于多格的表格，比如一个指标有+，++，+++，++++，另一个指标也是+，++，+++，++++。考察这两个指标间的一致性，也就是相关性。

你有多少个样本你输入的时候就有多少行.
有多少个变量就有多少例.(编号、权重，也都各属于一个变量）.
按照这个去检查你就发现你的数据不是输错了。

hanchunhee wrote:
等级资料的相关性分析可以进行Kappa检验，即一致性检验，求kappa值。如果kappa〉0.75, 两个指标的一致性非常好，即相关性高，kappa值在0.4~0.75之间，两个指标间的一致性中等，kappa<0.4, 两个指标间一致性较差。