分享

预测模型校准曲线 | Calibration curve (中篇:基于Cox模型)

 YLWUGD 2018-07-14

预测未来,就必然受到时间的影响。



如果预测患者1年的死亡率

需要建立预测模型计算

如果预测患者100年死亡率

不需要复杂的计算

死亡概率99%以上


因此建立预测模型及模型评价

时间是需要考虑的


方案一:不问早晚,只要结局


例如预测住院期间是否发生并发症,住院第一天或最后一天发生的并发症,都认为是在住院期间发生了事件。不关注早晚,只关注结局。


通常根据临床意义确定时间段。数据结构和软件操作之前的微信推文已经分享了:预测模型校准曲线 | Calibration curve (上篇)


方案二:考虑时间,预测结局


1
论文实例


2008年发表在J Clin Oncol 的预测结肠癌复发的研究。Individualized prediction of colon cancer recurrence using a nomogram.



图3是校准曲线(Calibration curve),AB两图分别预测60个月和120个月结局事件。横纵坐标分别是预测概率和实际概率。本研究考虑到发生事件的时间,运用Cox模型建立列线图(Nomogram)并绘制校准图。论文统计方法部分描述如下:



操作实例


例如:用多个临床指标(年龄、性别和BMI)建立结局指标的预测模型,绘制校准曲线。



首先看数据结构:

  1. 需要有结果变量(是否发生事件),事件可以是死亡(是/否),也可以是发病(是/否)。通常没有发生事件编码为0,发生事件编码为1。

  2. 生存分析是考虑到时间的,因此数据中需要有时间变量(time),时间变量是末次随访到患者的日期减去随访开始日期,单位可以是日、月或年等(连续变量)。

  3. 把原始数据整理到一张表中,每个研究对象一行,全数字编码,缺失的数据可以空着。


例如本表中:

  • 编号=1的患者:随访到72天时没有发生事件,时间(time)=72,结局(Outcome)=0

  • 编号=2的患者:随访到275天时发生事件了,时间=275,结局=1


软件操作


第一步:选择数据操作的“计算残差与预测值”模块,给出结果变量、自变量(即用于建立预测模型的指标)、时间变量和预测时间,点击查看结果。



说明:只要给出时间变量,就是选择用Cox模型拟合生存状态。“预测时间”如果空着,则使用研究对象的观察时间(有长有短);如果要预测某时间段内的事件,就手动输入时间。例如这里输入50,表示预测50个月时的事件,还是调用Cox模型计算的。



得出后缀是PRED的新变量,范围是0-1,表明基于Cox模型预测的发生事件的风险。


第二步:数据操作菜单下的“平滑曲线拟合”模块,给出应变量(结局指标)、暴露变量(上一步得出的预测值),点击查看结果。



结果出来了,横坐标预测的事件发生率,纵坐标是实际事件发生率。红线是曲线拟合线,蓝线是95%CI。绿线是参考线,即预测值=实际值的情况。可见当风险较高时(34%)红线在绿线的下面,表明预测风险高于实际风险。



这个曲线拟合的Calibration curve 放在文章中

可以瞬间增加“颜值”




注意:易侕软件输出的是曲线拟合 95%CI的图(png图片和pdf格式),以及用于绘制曲线的原始数据(Excel格式)。参考线(如上图绿线)是后期做图添加的,其实很简单,两点连起来就是一条,本例中把0.4和0.8对应的横纵线一画,找到两个交点后连线就ok啦。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多