写在前面:2022年即将正式实施的E9R1中提出,对伴发事件“治疗转组”采取假想策略进行处理,逆概率删失加权IPCW分析法是应对此类问题常用的统计方法。也鉴于涉及IPCW方法在治疗转组情况下应用的中文参考较少,所以写下此篇,共同学习。 首先需要明确的概念
需要注意的是,根据不同的假想,可能会代表不同的临床意义,建立不同的主估计方法,所以需要明确具体的假设情景。例如,针对上述示例,只说“假想受试者未使用下一线治疗”是不准确的,因为存在两种情况:(1)假想受试者无法获得下一线治疗,(2)假想受试者临床状态良好无需使用下一线治疗。根据这两种不同的假想情况,在预测/填补受试者数个周期治疗后的最佳响应时,可能基于不同临床状态的其他受试者进行预测/填补。由于假想策略下的假设通常无法验证,因此,为了评估统计推断在假设偏离下的稳健性,敏感性分析尤为重要。另外,当试验中有大量受试者发生伴发事件并使用假想策略时,大量受试者的变量(终点)需要通过模型预测得到,这将影响疗效评估的有效性和稳健性。所以,假想的情境不仅要具有临床意义,同时要确保估计目标能被较好地估计。
常见的处理转组数据的方法现有的在随机临床试验中出现病人转换治疗的常用分析方法大致有三种,第一种是简单方法,就包含了我们这里的意向性分析和符合方案分析。第二种是调整的风险比方法,包括校正比例风险模型等。第三种则是加速失效时间AFT模型,比如两阶段方法。
案例引入:BIG1-98下面通过一个女性绝经后乳腺癌辅助内分泌治疗药物 弗隆的双盲随机对照Ⅲ期临床研究案例,来说明一下应对转组问题的策略方法。 BIG1-98是在1998年由诺华启动研究,国际乳腺癌研究组之IBCSG完善的芳香化酶抑制剂AI的临床试验。主要研究的药物是来曲挫片,或者叫弗隆。今天我们只介绍这套研究的其中一部分,也就是弗隆和他莫昔芬两种药物的单药对照分析。两款药物都是针对绝经后女性早期乳腺癌患者的辅助治疗。 这项研究共有4922例激素受体阳性早期乳腺癌绝经后受试者加入试验,其中在1998年第一批次LET试验组入组911例,对照组TAM也就是他莫昔芬组入组917例。在次年的第二批次,LET入组1546例,TAM入组1548例。 受试者随机入组后,记录受试者基线数据,并分别接受两种药物的治疗,随访记录受试者的实验室数据。 本次单药分析研究在中位随访51月和76月分别做两次分析,主要疗效终点为乳腺癌患者的无病生存期DFS(随机化开始至第一次肿瘤复发/转移或由于任何原因导致受试者死亡的时间),次要疗效终点为总生存率OS和远处复发等。并通过风险比HR来比较试验药物与对照药物的优劣。 下面这张图展示的是中位随访51月的比较分析结果。可以看出,来曲挫显著提高了无病生存率DFS,在我们关注的远处复发时间指标也有统计学显著的改善。在两组对照中,来曲挫相比于对照组 他莫昔芬 可以降低死亡风险,但是统计学意义并不显著。 中位随访51月的单药分析显示了来曲唑在疗效上的优势,导致TAM他莫昔芬单药治疗组在2005年揭盲,依据伦理学原则,在随后的一段时间,发生619例,约25.2%的受试者从对照组转到试验组。这些转组受试者在转组前至少在对照组接受2.5年的治疗,转组后的治疗期和随访期的中位数分别为18和21个月。此时试验设计由随机双盲阳性药 对照临床试验变为一项观察性研究。这些发生转组的受试者在转组时有47%为淋巴结阳性,有35%患有直径大于2cm的肿瘤。而这两个数字在试验组是29%和26%。可以说发生转组的受试者在接受药物治疗的效果方面是要差于试验组的。 交叉后使用试验药物的中位时间这里是18个月,研究人员在中位随访76月又对两组进行了一次分析。 中位随访76月,研究者更加关心受试者的总生存期OS,分析的结果分别基于意向分析治疗ITT,符合方案分析也就是删失分析,以及IPCW方法。IPCW方法的结果在后面会展示。 意向治疗原则下,无病生存和远处转移时间分析中,与中位随访51月的分析结果类似。试验药有着较显著的提升。OS的风险比为0.87,但95%的置信区间包括1,即差异没有统计学意义。相较对照组,试验组对总生存率的提升效果不显著。 而删失分析下,总生存期的风险比置信区间上界小于1,可以说明试验药来曲唑的疗效优于对照药。 如我们之前所提到,意向治疗原则把发生转组的受试者仍作为转组前所在分组考虑,鉴于已知试验药比对照药的疗效更优,换药人群可能从来曲唑治疗中获益,因此在考虑意向治疗的情况下,会高估对照的疗效,从而低估试验药物的效果。 而删失分析则直接不考虑转组治疗者的数据,这种情况下,样本量减少,产生偏倚且不能客观反映对照组的真实情况,在这个实验中,一部分病人因对照药的副作用而换药,有研究标识这部分病人对对照药的疗效更好,做删失分析会一定程度上会夸大试验药物的作用。 鉴于IIT分析和删失分析均会导致不小的偏倚,研究者在这个案例中考虑了逆概率删失加权法IPCW,也就是我们今天要讨论的内容。 IPCW方法 Robins在1994年提出的逆概率删失加权方法是为了应对自变量存在MAR缺失,或者已知缺失概率的情况。IPCW作为一种较好的处理治疗转换的办法,已经被运用到临床分析研究中。主要是在出现受试者删失或者单项交叉时,调整受治疗或暴露因素影响的、随时间变化的混杂因素所造成的偏倚。 这个方法的思想其实很简单,就是,把发生治疗转换的人看作删失,删失的时间为治疗转换发生的时间,这必将导致对照组有效人数减少,之后再通过对没有发生转组的病人进行加权,把没有发生治疗转换的人扩张成原来的人数,进而校正转组对效果评价的影响。我们这里可以举个简单的例子,比如对照组有10名受试者,其中有2个转入了治疗组,那我们将这两个病人看作删失,因此只剩下8个人在对照组内,而IPCW方法就是通过对对照组剩下的8个人进行加权,把人数扩张成10个人,并能反应10个人如果都没有发生转组的两种治疗效果的差异。当然这只是理想情况,实际上只能逼近。在扩张人数时,IPCW法用未删失概率的倒数进行加权。 在临床实验中,IPCW方法是基于假想策略下的一个应对手段,伴发事件也就是转组事件发生后,这些受试者的测量不再是我们感兴趣的一个量,而是由假想不发生转组情景下的数据替代。 IPCW步骤IPCW方法应用于转组数据分析的时候一般有三个步骤:
在说明权重计算公式前,我们先给出一些定义。首先Tic表示受试者i发生治疗删失的时间,tk表示各个可能发生转组的有序时间点,可以理解为各个访视。Xbartl,i表示截止到t_l时间点,受试者i的时变因素的历史观测值,在临床实验中一般是指过去各个访视的实验室指标,不良事件的发生等。而vi为观测到的不随时间变化的固定协变量,一般是一些基线数据 那么受试者i在tk时间点的权重就可以理解为,tk及所有之前时间点的逆概率乘积。而这个逆概率是在已知tl时间点之前未发生转组,且已知时变和固定因素的条件下,tl时间点仍然不发生转组的概率的倒数。 分母条件概率越大表示该受试者不被删失,不发生转组的概率也就越大,也就意味着整个分式以及整个权重是越小的。这样的受试者与原先发生转组的受试者具有差异较大的预后特征。相反,有较大概率发生转组的倾向但还没有发生转组的受试者,就被赋予一个更大的权重,来模拟因为转组而被治疗删失的那些受试者数据。因为分母的概率是小于等于0的,所以权重永远是大于等于1的值。 但是这样的权重也存在一个问题,就是当分母很小,也就发生转组概率很大的时候,可能会导致权重不稳定的情况。所以robins在2000年又提出了一个更稳定的权重: 权重的分母没有发生变化,分子与分母类似,但是在其概率中不考虑随时间变化变量的条件,而仅包含基线的协变量。这是一个比较稳健的权重。当且仅当治疗转换不是选择性的,而是随机发生的时候,给定的协变量不能预测转换治疗发生的风险,权重就趋向于1,而当转组事件的发生不随机,那么权重不会趋向1. 这里分子和分母的条件概率计算可以运用logistic回归模型,以是否转组C为因变量,如果计算分子的概率,那么就是以基线特征v为自变量。分母的话就是基于基线特征V和一些时变变量X拟合logistic回归模型。 我们这里只介绍单向转组的情况,如果出现双向转组,则需要分别拟合模型计算每组的权数。 3. 待权重计算完毕后,IPCW方法要求使用一个边际结构模型 来描述治疗组与主要终点目标(比如总生存期)之间的关系。我们这里使用的是Cox 边际结构模型,它估计了没有发生转组或退出治疗的情况下会观察到的边际效应。更具体地说,假设所有的混杂因素都被观察到了,是已知的,将这些权重应用到Cox偏似然估计中,就会产生一个假想的遵守了他们所分配的治疗方案的人群集。Cox边际结构模型与普通的Cox模型都是利用传统的cox模型,但是区别在于,我们在对参数做偏似然估计的时候,对病人在某一时间点的风险用我们第二步计算的权重进行加权。 接下来我们构造Cox比例风险模型来描述两治疗组的风险率,Ai是二元变量,表示不同治疗组,我们可以假设Ai=1为试验治疗组,=0为对照组 之前我们提到,COX边际结构模型与COX传统的风险比例模型区别在于参数的偏似然估计。Robins提出IPCW的Cox偏似然得分函数U beta。 Deltaj表示受试者j的事件发生的指示变量,如果我们这里的疗效终点目标是OS,那么deltaj表示的就是j这名受试者死亡事件发生的指示变量 Tj表示发生事件和治疗删失时间的较小值 Yi tj则表示受试者i在tj这个时间点是否发生结局或删失 Ai的含义和上张幻灯片的描述一致 Robins证明,在满足cox比例风险模型的假设,并且第二步计算的权重的是稳定的条件下,通过这样一个偏似然得分函数计算出的计算参数估计值是一致的,并且是渐近正态的。 将这些IPCW权重使用在Cox边际结构模型,就可以得到试验治疗对我们疗效终点的发生的因果效应关系。 案例回顾我们在开头介绍的BIG1-98,来曲唑的临床研究案例。IPCW方法也被应用在中位生存76个月估计DFS和OS的风险比的分析中。在这项临床实验中,研究者对发生转组的受试者数据进行删失,随后一些临床特征,包括年龄,先前局部治疗,淋巴结状态,肿瘤分级,肿瘤大小以及随访中体能状态的改变,都与患者预后和转组的概率有关,所以被作为因素考虑到IPCW权重的计算中去。把权重代入到3/4未转组的对照组患者中,得出一个较为合理的结论。 IPCW方法试图从治疗效果的比较中消除选择性交叉带来的影响,并估计出如果25%的被随机分配到对照组的患者如果没有选择转组的治疗效果。 从我们上述的IPCW分析方法,可以计算出风险比,robust的标准差,95%的置信区间以及wald检验的p值。图中分析结果可以看出IPCW方法计算出的风险比,介于ITT分析和删失分析之间,是一种处理单向交叉数据比较稳健的方法。 模拟分析李玉森在2013年采用蒙特卡洛模拟比较IPCW ITT和删失法处理单项交叉设计生存资料数据的检验效能随样本量和预定风险比增加的变化趋势。模拟假定试验组与对照组样本量为1:1,分别考虑不同的样本总数。首先模拟产生基线年龄和性别数据,其次模拟产生两组在各个访视的ECOG评分,当第二次访视的评分大于等于4时,对照组受试者转到实验组。通过这个方式来模拟带信息删失情况。此外模拟通过预设两组的中位生存时间来假定对照组与试验组风险比为0.6,0.7,0.8,0.9。 模拟数据生成之后随后利用三种不同方法去拟合风险比例模型。 然后重复1000次模拟,分别计算三种方法的检验效能。随后改变样本量,在每个样本量和预设风险比下再模拟同样的次数。1000次模拟中假设检验有统计学意义的次数与1000次的比值即为该方法的检验效能。 从图中可以看出,当模拟假设HR=0.6时,样本量在接近100的时候,三种方法检验效能几乎都接近于1. 当样本量为50时,三种方法的检验效能差距较大, 4张图对比来看,IPCW方法要优于ITT分析。此外试验药与对照药疗效差异越小,在相同样本条件下,检验效能差距越来越大,删失法的优势越来越明显。因为删失法倾向于高估试验药的疗效,因此有较高的概率拒绝两药品没有差异的原假设。这样也带来一个问题,就是,删失法有着较高的一类错误率。因此我们再模拟三种方法在1类错误随样本量变化的曲线. 与之前的模拟,略有不同的是,我们模拟假定两组间的中位生存期相同,即HR=1,模拟原假设为真的情况,1000次模拟中假设检验有统计学意义的次数与1000的比值即为该方法的1类错误率。 图中可以明显的看到,删失分析法随着样本量增大,有着越来越高的1类错误率,而意向分析法和逆概率删失加权法差距很小,维持在较低的水平。综合考量,在第1类错误稳定在0.05的情况下,IPCW同时有有着相较于ITT法更优的检验效能,是一种分析单项交叉数据较好的统计方法。 总结
参考文献
|
|