分享

SPSS 生存分析 Vol.2

 钟山紫竹林 2020-01-13

大家好,在上期推文中我们讲到了寿命表法的操作及结果解读,但是这种不是最常见的,最常见的还是像下图中的每个人一条记录的:

像这种就会选用Kalpan-Meier法,简称K-M法,用于我们的资料是逐条出现的,并且适用于小样本,当样本量太大时它计算比较麻烦。我们讲个实例,39数据库中,某医院44例某病患者随机化分组后,一组为对照组,一组为实验组,实验组采用某种干预措施,对照组不采用任何干预措施,观察患者生存时间及结局。我们打开39数据库讲解:

从变量视图中我们可以看到0=“出现结局”,代表出现了结局事件,所以0是目标重点事件。我们点击分析-生存分析-Kalpan-Meier:

将“生存时间”放入时间框中,将“生存情况”放入状态框中,将“组别”放入因子框中,点击“定义事件”:

因为0是我们的目标重点事件,因此在单值里面输入0,点击继续,回到上框,点击比较因子:

将检验统计下面的三个选项均勾选上,点击继续,回到上框,点击保存:

勾选“生存分析”,点击继续,回到上框,点击选项:

图这里勾选“生存分析函数”,它就会做出生存函数图,点击继续,回到上框,点击确定,得出结果:

我们可以看到它做出了个生存分析表,将每一个样本都列出来了,因此说样本量不能太大,不然这里做不完。

再看到均值和中位数,由于生存分析一般为偏态分布,因此我们只要看中位数项就行了,我们可以看到治疗组生存时间中位数是146,对照组生存时间中位数是40。

在这里看到使用三种方法得出的P值均<0.05,因此说明治疗组和对照组生存时间差异是有统计学意义的。在这里三种方法,我们发表文章的时候只需要报道其中一种就行了。下面就做了生存函数图:

里面可以看到有+号的都是截尾数据,以上就是K-M法的操作和解读。

最后我们再讲解一种比较复杂的方法,叫Cox回归模型。我们刚刚前面讲到的两种方法,只是能反映能活多长时间,只是能做出个生存函数图,都没有分析有哪些因素能影响生存时间,因此引入了Cox回归模型。我们以实例进行讲解,40数据库中,某研究者项研究肺癌四种亚型的生存时间有无差别,收集了一些肺癌病例的数据,用Cox回归模型分析。我们打开40数据库:

此处1=死亡,0=失访,因此1是结局事件。此处我们要研究肺癌类型、健康指数、确诊时间、年龄和性别等因素对生存时间是否有影响,我们看肺癌类型:

分为四种类型,这四种类型是属于多项无序的,因此此时需要设置哑变量(原理同Logistic 回归分析Vol.1)。我们进行具体操作,点分析-生存分析-Cox回归:

将“生存时间”放入事件框,将“生存状态”放入状态框,同时定义结局事件为1,将五个影响变量均放入协变量框中,由于刚刚提到了“肺癌类型”需要设置哑变量,因此点右上角“分类”:

将“肺癌类型”放入分类协变量框中,默认以最后一个(鳞癌)作为对照参考即可。点击继续,回到上框,点击图:

勾选“生存分析”,就会做出个生存函数图,点击继续,回到上框,点击保存:

勾选“生存分析函数”,点击继续,回到上框,点击选项:

勾选“EXP(B)的置信区间”,即OR值,点击继续,回到上框,点击确定,得出结果:

我们可以看到哑变量的设置是以鳞癌为参照的。

此处我们可以看到-2对数似然,之前讲到了越接近于0是越好的。

此处我们就看到了建立的Cox回归模型,首先看到显著性,我们可以发现确诊时间、性别和年龄是对生存时间没有影响的,而肺癌类型和健康指数是有影响的。也就是在这一题里面我们发现了两个有意义的变量,我们看后面的Exp(B),肺癌类型1是腺癌,其Exp(B)的解读是患腺癌,其死亡的风险是患鳞癌的4.187倍,后面同理。健康指数Exp(B)解读是,健康指数上升一个级别,死亡的风险下降至0.957倍。后面还可以看到95%的置信区间。

我们还可以看到生存函数图。问题还没有结束,比如说刚刚的数据,假如有一个50岁的腺癌患者,其健康指数是80,那么他死亡的风险是鳞癌的4.187倍我们可以理解。如果过了五年后,他的健康指数没有变,还是80,那他死亡的风险还是鳞癌的4.187倍吗?理论上就不会了是吧,因为健康指数理论上会随着时间的增加发生的效率会变化,也就是说时间会和我们其中的某一个影响因素发生交互作用的,因此就会有一种新的Cox模型,叫时间依存变量Cox模型,我们以实例进行讲解,41数据库中,某研究者想研究肺癌的术后生存时间与手术时年龄大小有没有关系,收集了一些肺癌病例的数据,我们打开41数据库:

此处1=死亡,代表结局事件,我们可以看到变量有生存时间,也就年龄,年龄和时间可能会有交互作用,我们进行操作,点分析-生存分析-考克斯依时协变量:

此处我们需要设置交互作用的两个变量,交互作用我们一般用乘号表示,如上图设置好后,点右上角模型:

我们发现又出现了这个框,而且产生了一个新的变量就是交互作用的变量,我们如下图进行设置:

由于年龄已经进行了交互作用分析,因此建议协变量框中就不需要加入年龄了,我们点击保存:

发现时间依存变量保存里面是不给勾选的,也就是不会出生存函数图的,我们点击继续,回到上框,点击选项:

依然是勾选这个OR值,点击继续,回到上框,点击确定,得出结果:

我们可以看到性别是不影响的,而和时间交互的年龄是对生存时间有影响的。我们可以看到虽然有影响,但是OR值仅有1.049,在流行病学来看,1-3为弱风险,3-6为中强度风险,6以上才是高度风险,这一题只是说年龄每增加一岁,死亡的风险提高1.033-1.064倍,相差并不是很大,但确实又是影响因素,因为P<0.05,但并不是一个非常重要的影响因素。

时间依存变量Cox模型遗憾的是没有图形选项,不能做出生存曲线图,但其用于与随时间变化有关的生存分析模型的评估与预测还是有独到的作用的。

结语

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多