这次推出的新工具是用来绘制受试者工作特征曲线(ROC曲线),关于ROC曲线的介绍和用途,我们之前微信也分享过一期(可戳这里查看)。 ROC曲线主要用来评价一个二值分类器(binary classifier)的优劣,目前广泛应用于医学诊断、生物信息学、数据挖掘和机器学习等研究中。如可检测某种生物标记物(biomarker)的好坏以及多种biomarker进行比较等。
之前公司帮助客户做过数据量较大的ROC曲线个性化分析,取得了不错的结果。现在基迪奥的云平台(www./tools/)加入了ROC曲线绘图工具,旨在帮助更多的科研工作者高效地绘出可用于发表的图形!下面就来看看使用ROC曲线图工具的具体步骤。 利用113例动脉瘤疾病观察数据(aSAH)进行示例测试[1](为方便大家试用,本文所用数据已上传到论坛,点“阅读原文” 可查看,链接:http://www./forum/thread-3224-1-1.html),比较2种biomarker(NDKA和S100β)和1种临床参数WFNS的诊断表现。
点击“软件库”——“所有软件”——“统计”——“ROC曲线图”,进入工具页面。 第一次使用的童鞋,请记住务必先仔细看看“案例演示”里面的说明,明白各种输入要求和格式要求后再使用工具~~
上传矩阵表格文件:上传拥有表头的数据文件,且表头位于第一行。数据与数据间以制表符分开(Tab键),不能直接使用Excel文件,可以在Excel里打开然后另存为txt文件使用。第一列为二分类的结果(如good/poor,也可以用1/0表示),其它列(可以1列,也可以多列)为各种标记物的打分情况。参考文件如下图所示: 上传好正确的格式文件后,可以选择参数:① 曲线是否光滑:默认为no,即不光滑,也可以选择yes,生成光滑曲线;② 默认为no,即不光滑,也可以选择yes,生成光滑曲线:选择曲线围成面积颜色,可以点击颜色框,选择自己需要的颜色,或者直接输入自己需要的颜色。 提交任务,就等着收菜啦!任务也是眨下眼的功夫就完成了,超高速的有木有!如果显示排队中,过几分钟后可以手动刷新看结果,网页默认3分钟刷新一次。 结果文件下载后,得到各个标记物的ROC曲线图和常见参数文档。 单一指标ROC曲线结果如下:
上图可以清晰的了解各个指标的AUC,从而可以评估各个标记物的表现。 多重ROC曲线用于三种标记物的比较: 该图清晰反映出三种标记物的优劣: wfns >s100b > ndka 今天的内容就到这里啦,赶快去云平台使用吧~ 工具链接:http://www./tools/Home/Soft/roc 参考文献: [1] Natacha Turck, Laszlo Vutskits, PaolaSanchez-Pena et al. (2010) “A multi-parameter panel method for outcomeprediction following aneurysmal subarachnoid hemorrhage”. Intensive CareMedicine 36(1), 107–115. DOI: 10.1007/s00134-009-1641-y.
|
|