对于需要长期观察的病例,如慢性病或恶性肿瘤,原有疗效指标如有效率、治愈率等就不适用,还需要考虑出现结局的时间长短。生存分析(survival analysis)是将结局和出现时间结合起来分析的统计分析方法。 生存分析最常用的方法有乘积限法和寿命表法、生存率比较的log-rank检验和Wilcoxon检验以及Cox比例风险回归模型。 生存分析的基本概念
研究生存时间需要通过随访完成,随访有两种形式:
终点事件(endpoint event):又称失效事件(failure event),是指研究对象发生的研究者关心的特定结局。 起始事件:研究对象生存特征的起始特征事件。 生存时间(survival time):两个有联系的起始事件和终点事件之间的时间。为了得到准确的生存时间,必须明确规定起点事件和终点事件。需要注意,虽然名词是“生存时间”,但事实上不一定是说生存,只要符合上面定义的任何时间段都可以叫生存时间。生存时间需要恰当的测度单位(小时、日、月、年等),一般测度时间越小,准确性越高。 删失(censoring):也叫终检,是指没有观察到终点事件,无法得知确切生存时间。包含删失数据称为不完全数据(incomplete data)。 右删失(right censoring):从时间轴上看,终点事件发生在最后一次随访时间的右方,真实生存时间只能大于这个时间。 产生右删失原因: 1 随访对象失访 2 随访结束仍未出现终点事件 3 治疗措施改变 生存率估计与生存曲线 常用的两种方法:乘积限法(product-limit method),用于小样本未分组资料。寿命表法(life table method),用于大样本分组资料。 乘积限法:也叫Kaplan-Meier法或K-M法,主要用于小样本,也可用于大样本。 生存概率(survival probability):用p表示,是指单位时间段开始存活的个体到该时段结束仍然存活的可能性。p = 同年内活满一年人数/某年年初尚存活人数 生存率(survival rate):用S(t)表示,是指观察对象活过t个单位时间的概率。如果没有删失值,计算公式为S(t) = t时刻仍存活的观察例数/总观察例数 生存曲线(survival curve):根据不同时间点的生存率,可将随访时间做横坐标,生存率为纵坐标将各个时间点连成一起的曲线。曲线下降陡峭,则说明生存率较低,下降平缓,则生存率较高。 中位生存期(median survival time):也称半数生存期,表示50%个体尚存活的时间。中位生存期越长说明预后越好。但是中位数不能用原来我们说过的中位数计算方法,因为有删失值存在,可用生存曲线图法估计或用线性内插法求得。 log-rank test :是生存率比较的非参数法之一,可以做各组生存率的整体比较,还可以分析危险率是否随分组等级变化,称为趋势检验。 寿命表法:样本量大,按照生存时间分成不同组段求得各组段频数。 以上两种方法计算及检验这里不再给出,具体实例请参阅医研云(1rcloud.net)的帮助文档。 Cox比例风险回归模型 上述方法适用于单因素分析,且组间可比性较好。如不能满足或影响生存时间的因素大于一个,应采用多因素分析方法。同时生存分析的反应变量是时间,不满足线性回归和logistic回归要求,同时资料中还有删失问题,此时应该使用专有的模型--比例风险回归模型(proportional hazards regression model),简称Cox回归。 协变量(covariates):影响结果的其他因素,这里是研究者认为可能影响生存的其他因素。 相对危险度(RR):暴露组与非暴露组的风险率之比。 PH假定:任意两个个体风险函数之比,即相对危险度RR或风险比(risk ratio)保持恒定,与时间t无关,成为比例风险(proportional hazards)假定,简称PH假定。 Cox回归应用注意事项 1. Cox回归分析结论正确是以科学设计、有代表性的抽样为前提的。如样本量过少或不随机会导致错误结果。过少的样本、过多的删失都会导致错误。 2. 数据编码可能会严重影响结论的解释。对于某些数值型协变量转换为等级编码更合适。 3. Cox回归必须满足PH假定,否则需要用其他扩展Cox模型。 4. 自变量筛选比较复杂,需要充分的专业和统计学考虑。 |
|