分享

ROC曲线那些事儿:ROC曲线的“正反”之忧 | 医学统计学专题

 爱飞的蜗牛 2017-01-17


看点


ROC曲线的“正反”之忧

在SPSS里面画ROC曲线是很简单的,只需要选择好检验变量(TestVariable)和状态变量(StateVariable)即可出来ROC曲线图,但在画ROC曲线图的时候,很多新手会纠结疑惑:为什么我画出来的ROC曲线在对角线的下方呢?为什么ROC曲线的面积AUC<0.5呢?在SPSS里该怎么设置状态变量(Valueof state variable)的值呢?


【具体例子】



检测54名非糖尿病人以及64名2型糖尿病人的成纤维生长因子21,用ROC分析评价成纤维生长因子21(FGF_21)对2型糖尿病(Group)的诊断价值。


所得结果为



按理说,本例子做出来的ROC曲线面积AUC应该在0.5以上的,可为什么做出来的结果只有0.105,而且ROC曲线在对角线的下方呢?好纠结,问题究竟出在哪里?


【问题解决思路及步骤】


01

步骤一:探索分析

首先看一下正常组及糖尿病组中成纤维生长因子21的数据特征,所以我们先对数据进行探索性分析。点击分析——描述统计——探索,从“描述”表中可以看到,糖尿病组中的成纤维生长因子(203.12)大于正常组(159.90)。


2
步骤二:绘制ROC曲线

在了解了数据特征后,接下来开始绘制ROC曲线,将FGF_21(成纤维生长因子21)放在检验变量里,Group(正常组/2型糖尿病组)放在状态变量里,状态变量的值是指定义阳性事件的值,本例中阳性事件为糖尿病,值为2,所以填入2。

在探索分析里面,我们知道糖尿病组的成纤维生长因子21的值大于正常组,因此选项里面的检验方向(TestDirection)选择较大的检验结果表示更肯定的检验(Largertest result indicates more positivetest),即较大的检验结果表示阳性诊断。就是因这点没选好导致ROC曲线反了。


ROC曲线下面积为0.895,面积的标准误为0.030,成纤维生长因子用于判断糖尿病有显著意义(P=0.000<0.05),成纤维生长因子越大是糖尿病的可能性越大。面积的95%可信区间(Asymptotic95% Confidence Interval)是(0.836,0.954),不包含0.5,得出相同的结论。

一般情况下,曲线下的面积AUC为0.5~0.7时,表示诊断准确性较低;面积AUC为0.7~0.9时,表示诊断准确性中等;而面积AUC大于0.9时,表示诊断准确性较高。


3
步骤三:寻找最佳诊断界值

在实际应用中,SPSS会给出不同界值下的敏感度和1-特异度,对于最佳诊断界值点,最重要一点就是要结合临床实际进行选择。如果不是特殊情况,一般以约登指数(Youdenindex)(灵敏度 特异度-1)最大时所对应的点为最佳诊断界值。

将SPSS里的“曲线的坐标”的数据复制到Excel里进行计算,Youden指数刚好是敏感度-(1-特异性),设置公式后直接下拉计算,Youden指数最大值为0.703,对应的敏感度为0.766,特异度为0.937,成纤维生长因子21的值为189.68,因此可认为成纤维生长因子诊断糖尿病的最佳界值为189.68。




通过以上三个步骤,相信大家已经能正确地绘制ROC曲线,终于不用再纠结啦!

最后再提供一个画ROC曲线中很实用的小妙招。不知道大家发现没有,在SPSS里面画的ROC曲线图,有时候X轴和Y轴的原点并不在一起,那怎样解决呢?双击图片——图表编辑器——点击图片空白区域——出现黄色框线——用鼠标,将左侧框线往右侧拉,拉到两条轴的原点在同一点即可



我得意的笑~我得意的笑~~





想了解“医学方”最新课程动态?可登陆腾讯课堂收看

目前已有课程:

(1)医学方|医学统计学公开课|石小白老师教您轻松学统计(公益免费课程)

(2)医学方|医学数据挖掘精品课程|豪斯医生手把手教您如何数据挖掘

腾讯课堂:https://medfun.ke.qq.com

网易云课堂:http://study.163.com/u/ykt1467466791112

客服电话:15821255568

客服微信:yixuefang1234

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多