分享

ROC曲线应该怎么看?

 Mark_killua 2020-01-17

Roc曲线,又称“受试者工作特征曲线”,抛开这个难记的名字不谈,主要来谈谈Roc主要用于预测事件/诊断的准确率。

应用场景

ROC曲线的应用广泛,最初是运用在军事上,现在更多应用在医学领域。不仅如此还可使用在投资预测、生物实验等等场景下。比如用ROC曲线天气预报中对暴风预告的准确率,或者....

简单理解

ROC曲线图是反映敏感性与特异性之间关系的曲线。横坐标X轴为 1 – 特异性,也称为假阳性率(误报率),X轴越接近零准确率越高;纵坐标Y轴称为敏感度,也称为真阳性率(敏感度),Y轴越大代表准确率越好。

根据曲线位置,把整个图划分成了两部分,曲线下方部分的面积被称为AUC(Area Under Curve),用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角,预测准确率越高。

接下来就简单了解一下,如何绘制ROC曲线,如何解读结果。

案例分析

(1)背景

当前进行一项影响“低出生体重儿”的研究,希望研究产妇年龄,产妇体重对于“低出生体重儿”的预测准确率。将低出生体重儿赋值为1,正常出生体重儿赋值为0。

(2)操作步骤

使用路径:SPSSAU→可视化→ROC曲线  

首先要拖拽分析项到分析框中,放置位置如下图所示:

右上侧的数值(分割点)代表变量Y的判断标准,大于或等于这个标准的数值判断为“阳性”,小于这个标准的数值判断为“阴性”。默认判断数值为1,如果默认数值与判断标准不符,可手动修改。

*设置不同的数值,会得到不一样的结果,如果没有公认的金标准,也可以尝试设置不同的数值,对比分析找到更佳的预测曲线。

本例中数字1代表低出生体重儿,数字0代表正常儿,所以将分割点设为1。

(3)结果分析

①频数分析

表1频数分析

表1为频数分析表格,主要来简单描述Y值的分布情况。根据上表显示,低出生体重儿共有130人,正常儿为59人,阳性比例为68.78%,阴性比例为31.22%。

②ROC结果汇总

表2 ROC曲线结果汇总

表2展示的是根据产妇年龄、产妇体重分别构建的ROC曲线,AUC代表ROC曲线下的面积,表示预测准确率。AUC值越大,代表正确率越高。

根据上表可知,产妇年龄对应的AUC值为0.549,说明产妇年龄对于低出生体重儿的诊断价值比较低。产妇体重对应的AUC值为0.601大于0.05但小于0.7,P=0.025 <0.05,说明虽然产妇体重对低出生体重儿的诊断价值显著的高于0.5,但诊断价值依旧比较低。

综合来看,产妇年龄、产妇体重两个因素对判断低出生体重儿的诊断价值都比较低。

ROC曲线

从ROC曲线上也可以直观的看出,曲线没有靠近左上角,说明诊断的准确性并不高。

③ROC最佳界值结果

如果表2的某个因素的AUC值大于0.7说明有较高的诊断价值,此时可通过此表找到最佳界值。最佳界值点也就是ROC曲线最靠近左上角的点。

从上表可以看出:产妇年龄,其最佳界值出现在敏感度为0.277,特异度为0.881时,即在该点时,最靠近左上角,整体最优。针对产妇体重,其最佳界值出现在敏感度为0.785,特异度为0.407时,整体最优。

SPSSAU-ROC曲线


其他说明

通常情况下AUC值普遍大于0.5,如果出现AUC小于0.5时,通常原因诊断标准设置有误,比如把阳性设为0,阴性设为1。判断标准为1,此时得到的就是相反的结果。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多