分享

预测模型好文学习!柳叶刀子刊Lancet Oncol的一篇预测模型,详细解读

 妙趣横生统计学 2023-01-11 发布于江苏
欢迎加入郑老师课程会员,每周直播答疑、赠送多门统计学课程(包括预测模型)。
公众号会员来了,每周直播答疑,配2200页纸质讲义


预测模型好文详细解剖

今天给大家介绍的一篇柳叶刀子刊Lancet Oncol发表的一篇有关于前列腺癌患者预后的预测模型文章。

这篇文章是加州大学洛杉矶分校研究团队针对接受 ¹⁷⁷Lu-PSMA 治疗的转移性去势抵抗性前列腺癌(简称:mCRPC)患者的预后预测模型。

文章即有对生存资料结局(OS和PFS)的预测,也有对二分类结局(PSA50)的预测。所用的预测模型的方法也中规中矩,是值得初学者模仿学习。

题外话





介绍文章之前,给大家普及外部验证的知识点:

外部验证指的是外部有效性反映了模型的普遍性,需要使用不是来自研究本身的数据集进行验证,这些数据集在时间或地理上是相互独立的。

其种类主要分为:

时段验证:指的是利用与模型开发队列来源相同,但是时间段不同的 数据对模型表现进行验证。

空间验证:指的是 对模型在其他中心甚至其他国家的数据中的表现 进行验证,所以验证队列可能采用与开发队列不 同的纳入/排除标准或不同的预测因子和结局变 量的测量方法。。

领域验证:是指在不同 的临床场景中对模型进行验证,如开发用临床的数据,验证用社区的数据。

为什么要给大家普及外部验证呢??

还是和这篇文章有关系。

比较有意思,这篇文章外部验证与模型开发的同一人群,这和外部验证的概念、作用就冲突了,外部验证的模型的外推性就满足不了,也失去了外部验证的意义。

接下来给大家介绍一下这篇文章:

文章简介





目的:本文通过开发列线图预测接受 ¹⁷⁷Lu-PSMA 治疗mCRPC患者的预后效果
开发验证队列:数据来源于德国、美国、澳大利亚三个国家的6家医疗和研究中心机构。数据按2:1分成开发队列和验证队列
研究设计:国际、多中心、回顾性分析
预测变量:26个预测变量进行筛选
结局指标:主要结局(OS、PFS),次要结局(PSA50:前列腺特异性抗原下降50%以上)
模型开发:OS结局利用诊断时间,化疗状况等7个变量构建列线图;PFS结局利用平均标准摄取值等6个变量构建列线图;PSA50结局利用有无肝转移等4个变量构建列线图
模型评价:C指数及95%CI,校准图
模型验证:内部验证(bootstrap法)和外部验证计算C指数和校准图

结果简介:270名患者分为开发队列(196人)和验证队列(74人),中位生存时间为21.5(13.3-30.7)月。
OS结局开发模型C指数为0.71(95% CI 0.69–0.73),内部验证和外部队列C指数与开发模型相似,分别为0.71(95% CI 0.69–0.73),0.72(95% CI 0.68–0.76)。

PFS结局开发模型C指数为 0.70 (95% CI 0.68–0.72),内部验证和外部队列C指数与开发模型相似,分别为0.70 (0·68–0·72),0.71 (0.68–0.74)。

所有模型的校准度都较高,总体而言,这个模型不管是开发还是验证,效果还是比较好的

根据开发模型的最佳截断值,将病人划分为低风险及高风险,结果发现,在开发队列、验证队列、全数据集中低风险病人较高风险病有有较长的生存时间:
os中位生存时间:验证队列低风险24.9(95%CI 16.8-27.3)月 VS 高风险 7.4(95%CI 4.0-10.8)月


PFS中位生存时间:验证队列低风险6.6(95%CI 6.0-7.1)月 VS 高风险 2.5(95%CI 1.2-3.8)月


以下就是这篇文章详细的介绍:

研究背景





研究表明在mCRPC患者接受 ¹⁷⁷Lu-PSMA 治疗给予标准化护理以提高OS和PFS。因此需要探索接受 ¹⁷⁷Lu-PSMA 治疗后mCRPC患者的预测因子,以支持¹⁷⁷Lu-PSMA的实施及下一代¹⁷⁷Lu-PSMA试验设计的开展。作者主要是开发列线图预测接受 ¹⁷⁷Lu-PSMA 治疗mCRPC患者的预后效果。作者认为结合造影数据和临床特征数据可以提高选择新疗法的证据和临床决策,并为后续的临床试验的实施提供思路。

研究方法





研究人群:介绍了人群的来源,三个国家,6个医疗及科研机构。同时也详细介绍了病人纳入的标准,在这也估人群研究时要明确的人群来源。

数据的收集及变量的选择:这一块作者人群分成了两块,开发队列和验证队列,而且还平衡了两个队列在各机构的研究数量,强调这两个队列是同一人群(这种操作是比较少见的)。另外还介绍了预测变量及检测方法,共收集了26个变量(变量多,样本少所以作者用lasso回归进行样本量的筛选)

样本量的问题:能得到多少样本量就用多少样本量,预测模型文章也没少这么描述。而且作者也任性,检验效能也没有事先计算。
模型的建立与验证:
作者建立多个列线图,也就是多个模型(OS两个模型,PFS两个模型,PSA50一个模型)。每个模型建立的步骤基本上相同,先通过Lasso回归筛选变量,然后再通过Cox等比例风险模型,logistic回归建立模型(PSA50的方法和结果都在附件中呈现)。
模型评价用两个方法:区分度和校准度,区分度用C指数及95%可信区间,校准度用校准图表示。(在这里大家就可以看到用了几个模型)
另外作者还利用开发的模型确定最优截断值,并根据最优截断值将患者分成了高风险和低风险,还对这两类人群的生存状况进行了分析。
模型验证:模型验证分成了两步
第一步:采用了bootstrap法进行内部验证
第二步:在验证队列进行了外部验证,指标也是c指数和校准图

结果





第一:作者介绍了两个队列的造影结果和临床特征,两个队列基本上没有差异,郑老师认为就算有存在差异性影响也不大,本来就是两个队列。

二:介绍了OS结局预测模型的列线图,介绍了该模型在开发数据集校准图(这些图形只是看看,没有提供精确数据)

第三:介绍了OS结局预测模型的列线图,介绍了该模型在开发数据集校准图(和OS一样)

作者还将开发模型的最佳截断值,将病人划分为低风险及高风险,比较在开发队列、验证队列、全数据集中两类人群的生存时间,结果发现低风险病人较高风险病有有较长的生存时间(在这前面已经介绍过了)

另外一个结局指标就是PSA50,模型构建的方法及结果都放到了附件里

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多