分享

天啊,ROC曲线也要控制协变量啊!

 松哥精鼎统计 2020-10-23
导读

     我们以前说相关的时候,说到过偏相关;而所谓的偏相关就是消除其他变量影响后,研究单纯的X和Y之间的相关。

    ROC曲线主要用于诊断试验诊断阈值的设定,也可用于预测模型效果评价。比如我们研究AFP在诊断原发性肝癌中的价值,一般ROC直接对病例和对照组进行AFP测定,然后做ROC曲线即可。

   然而有些因素是会影响AFP的,如果不消除这些因素的影响,可能得到诊断结果就不可靠。这种消除某些因素后,进行ROC分析的方法,就叫协变量调整ROC。

   这种方法SPSS暂不可实现,但用stata实现非常方便。

喜讯:6月18日!!!!,京东、当当、淘宝图书5折特惠,想学统计的话,推荐松哥独著花了1年时间写的《SPSS实战与统计思维》!这本书在京东和当当销量排名都是第一的哦!

精鼎51期SPSS实战训练营-昆明站

stata实现

随机模拟一组数据,仅做演示stata实现。如下图:

Disease代表疾病,1有,0无。

health和weight为检测变量

sex和age是要控制的协变量

  1. 正常ROC不控制

命令:roccurve Disease health weight

结果:

2.ROC控制sex和age

命令:roccurve Disease health weight,adjcov(age sex) adjmodel(linear)

结果:

3.计算结束,数据库视图自动生成fpr和tpr。

补充一点

上述语法虽然可以快速制作协变量调整ROC曲线,但不能给出AUC。我们可以调用rocreg语句实现。

命令:

rocreg Disease health weight,ctrlcov( sex age ) ctrlmodel(linear) nobootstrap

结果:

如果没校正会怎么样

语句:rocreg Disease health weight, nobootstrap

结果:

比较:

发现矫正后的效果似乎好一点,但差别不大。本例只是虚拟案例数据。理论上应该相差较大。

当然相差大不大也不是靠看的,可以用comproc语句进行比较

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多