分享

临床预测模型 | 第18期. 明明白白决策曲线(DCA)

 新用户4064dVjo 2023-09-06 发布于北京

在上期内容中,我们介绍了外部验证的定义,以及在进行外部验证时常见的误区(第17期. 外部验证这些常见误区,你知道吗?。但是我们知道,任何临床模型都应该是以临床应用为导向的,其目的是为了让患者受益,尽管我们之前讲了很多评价模型的指标和方法,他们都无法真正评价模型在临床应用中的实用性,要做到这一点就需要用到决策曲线(Decision Curve Analysis)。下图是一个典型的决策曲线,纵坐标为净获益(Net benefit),横坐标为阈值概率(Threshhold probability)。在解读决策曲线前,我们需要先厘清这两个概念。

一、阈值概率

阈值概率是模型中用来区分事件是否发生的阈值。假设用logistic回归预测一个人是否患癌症,我们可以根据模型预测所有纳入人群患癌症的概率,那logistic如何判定某个人是否患癌症呢?这就需要设定一个阈值,即预测概率超过某一个阈值时,logistic模型就会将其判定为患者,那么临床上可能就会给予相应的处理。例如,当阈值为10%时,任何被模型预测患癌症概率超过10%的人,都会被判定为患者,后续可能就需要接受手术等治疗。

二、净获益

净获益是决策曲线中主要需要比较的指标,它的计算方法如下图,其中的pt就是上文提到的阈值概率,将不同阈值概率下所得到的净获益连起来便得到了决策曲线。净获益的概念类似于商业中的净利润,即收入减去成本。对于模型而言,计算的是患者从模型中的获益,收入就是模型的真阳性率,因为这部分患者被正确预测,并可以从临床处置中获益;成本是假阳性率,这部分患者因为模型而接受了不必要的临床处置;因此净获益越大,表明模型在实际中的应用价值越大。

三、决策曲线在R的实现
library(ggDCA) #需要提前安装相应的R包哦
library(survival)
data(pbc)
fit=glm(ascites~age+hepato+bili,data=pbc,family = "binomial")
ggplot(dca(fit),linetype =T,lwd = 0.7)+  
theme(legend.position=c(0.8,0.8))+
xlim(0,0.5)

那么这就是本期的全部内容啦,你学会了吗?大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话”栏目中提出,我们会尽快回复!


参考文献

Lee C, Light A, Alaa A, Thurtle D, van der Schaar M, Gnanapragasam VJ. Application of a novel machine learning framework for predicting non-metastatic prostate cancer-specific mortality in men using the Surveillance, Epidemiology, and End Results (SEER) database. Lancet Digit Health. 2021;3(3):e158-e165. doi:10.1016/S2589-7500(20)30314-9

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多