在临床研究中,我们最常用的有logistic回归、线性回归和Cox回归。对于前两种回归分析模型,我们的教科书有比较详细的公式,根据公式很容易进行计算,用来做预测比较方便。而对于Cox回归分析,由于其是一个半参数模型,而且它的结局有两个:结局状态和时间。对于一般研究者来说,用Cox回归做预测分析十分困难,似乎无从下手。 Cox回归既然可以做危险因素分析,能计算出风险比例(HR),也是可以做个预测的。怎么做呢? 理论部分(对生存分析原理不熟悉者可略过) Cox回归模型的生存函数表达式为 S(t∣X)是指在t时间时某种协变量(X)条件下的生存概率,要想计算它,需要知道两个参数:S0(t)与Xβ。 S0(t)为基础生存函数,即t时间时X=0时的生存概率。它的计算方法是: 从随时开始到t1时间的生存概率S0(t1) 为生存总人数除以随访总人数; 从随时开始到t2时间的生存概率S0(t2) 为S0(t1)乘上t1时间到t2时间的生存概率,即S0(t1)*S0(t1→t2)。 以此累计计算…… 因此S0(t)是很多条件概率的乘积,不是一个公式,不能通过带入参数计算。 Xβ就比较简单了,它就是回归系数与变量的乘积的和,即 与线性回归和logistic回归相同。
实践部分 对于生存概率的计算,SPSS和SAS都给出了相应模块供我们使用。我们以SPSS为例。数据如下,有4个协变量(分期(stage)、分级(grade)、肿瘤大小(size)、某指标阳性(positive)),生存状态(status)和随访时间(time)。 点击“分析”-“生存分析”-“Cox回归”,按下图选择相应的变量,并对stage设置亚变量。
在”选项“中选中”显示基线函数“。
结果中会出现一个生存分析表: 表中第一列和第二列为相应时间对应的累积风险。 如果我们想计算一年的累积生存率,即找到12月对应的累积风险为0.001289, 12月生存函数为: 带入每个病例的Xβ即可计算出每个病例的一年生存概率。 |
|