转自个人微信公众号【Memo_Cleon】的统计学习笔记:生存分析之Cox回归。 随访资料的生存分析是一个很大的题目。 模型结构与参数释义可参见颜虹等主编的《医学统计学》,如下。对此不感兴趣而只关心操作和结果解读的,可直接越过。 当前笔记用STATA演示Cox回归操作。STATA在进行Cox回归分析前首先需要声明生存时间变量,另外比例风险假定是进行Cox回归的前提条件,需要进行考察和检验。 X1:gender; X2:age; X3:grade; X4:recur; X5:PD_L1 【1】数据录入:略 相应命令如下: stset time, failure(status==1) 也可以不指定失效值,默认不等于0的为失效值。另外scale选项可以重新定义生存时间,如本例生存时间单位是月,可以使用scale(12)后生存时间代表的就是年啦,命令为:stset time, failure(status) scale(12) 【3】Cox回归:统计>>生存分析>>回归模型>>Cox比例风险模型,选入相应的自变量即可。主要添加自变量时应选择合适的变量类型即参照水平(默认低水平为参照),如果未经步骤【2】的生存时间变量声明,也可以在此对话框中的[生存设置]中声明。需要说明的是,本例有序变量按连续变量处理,性别、病例分级、复发即PD-L1虽然是分类变量但都是二分类,直接按连续变量分析也不影响结果。命令为:stcox i.gender age i.grade i.recur i.PD_L1 或者stcox gender age grade recur PD_L1。 很明显,模型给出是强制纳入了所有的变量的结果,但实际上有很多因素并不具有统计学意义,为了精简模型,我们可能需要对模型的变量进行筛选,可以采用逐步回归,SPSS里面可直接在[method]中进行选择相应的方法。STATA里面则可借助stepwise命令,Cox逐步回归菜单操作: 相应命令:stepwise, pr(0.1) pe(0.05) forward: stcox gender age grade recur PD_L1 stepwise, pr(0.1) pe(0.05) forward : stcox (gender) (age) (grade) (recur) (PD_L1), nohr pr(剔除标准),pe(纳入标准)。逐步回归方法:forward、backward,逐步回归方法:lr,默认是wald法。括号内为同进同出的变量为一个回归项,类似于SPSS里面的Block,同一个回归项中变量同进同出,比如同一个分类变量设置为哑变量后可以放在同一个回归项中。nohr表示报告系数而不是风险比。 有时候我们还想得到生存曲线。以指定协变量recur,绘制生存率曲线为例,操作如下: [图形>>生存分析图>>生存,风险,累积风险或累积发生函数]或者[统计>>后验估计],在打开的[后验估计选择器]中依次选择:设定,诊断和拟合优度分析>>生存函数,风险函数,累积风险等图形,点击[开始]进入[曲线-绘制生存函数,风险函数,累积风险函数或累积发病率函数]对话框,界面操作如下: 相应命令为:stcurve, survival at1( recur=0 ) at2( recur=1 ) 你也可以绘制Kaplan–Meier生存函数图、Kaplan–Meier失效函数图、Nelson-Aalen累积风险函数图即平滑危险估计图等,可在[统计>>生存分析>>回归模型>>图形] 或 [图形>>生存分析图] 中进行。 4.1计算检验命令:整体检验estat phtest;单独检验每个协变量estat phtest, detail 菜单可通过以下途径进入 ①统计>>生存分析>>回归模型>>比例风险假设检验; ②图形>>生存分析图>>stcox后比例风险假设检验; ③统计>>后验估计,在打开的[后验估计选择器]中选择[比例风险假定的检验]; 点击[开始]进入对话框[estat-后验估计统计量],选择[基于Schoenfeld残差的比例风险假设检验(phtest)]。如想进一步检验每个协变量的比例风险假定,可在继续点击对话框[estat-后验估计统计量]中的[选项]按钮,在打开的对话框中选择复选框[单独检验每个协变量的比例风险假设]。 4.2 图示法可以通过生存函数的双对数图(Log-log plot of survival)与Kaplan–Meier与Cox预测的生存曲线图(Kaplan–Meier and predicted survival plot) stphplot plots sln{−ln(survival)} curves for each category of a nominal or ordinal covariate versus ln(analysis time). These are often referred to as “log-log” plots. Optionally, these estimates can be adjusted for covariates. The proportional-hazards assumption is not violated when the curves are parallel. stcoxkm plots Kaplan–Meier observed survival curves and compares them with the Cox predicted curves for the same variable. The closer the observed values are to the predicted, the less likely it is that the proportional-hazards assumption has been violated. 命令1:stphplot, by(recur) 根据分类变量recur拟合单独的Cox模型,结果是下图左; 根据分类变量recur拟合分层的Cox模型,并根据变量age进行调整,调增方法是将age值调整为0(默认是均值),结果为下图右。 ①统计>>生存分析>>回归模型>>比例风险假设的图形评估; ②图形>>生存分析图>>比例风险假设检验; 选入相应的自变量和分层变量即可。 4.2.2 Kaplan–Meier and predicted survival plot 命令:stcoxkm, by(recur) 当然你可以单独绘制recur两个水平的观测预测曲线:stcoxkm, by(recur) separate ①统计>>生存分析>>回归模型>>Kaplan–Meier生存曲线和Cox预测曲线比较; ②图形>>生存分析图>>Kaplan–Meier和Cox生存曲线比较; 选入相应的自变量即可。 如果运气不好,你的数据违背了比例风险的假定,可以考虑含时依协变量的Cox回归。含时依协变量的Cox回归也可以作为验证比例风险的假设的一种手段。个人理解,这个所谓时依协变量,其实就是在Cox回归里构建的一个交互作用项。这个关于含时依协变量的Cox回归我们放在以后分享。 |
|
来自: Memo_Cleon > 《待分类》