IPCW（逆概率删失加权）方法

Simbab 2023-05-05 发布于北京

展开全文

写在前面：2022年即将正式实施的E9R1中提出，对伴发事件“治疗转组”采取假想策略进行处理，逆概率删失加权IPCW分析法是应对此类问题常用的统计方法。也鉴于涉及IPCW方法在治疗转组情况下应用的中文参考较少，所以写下此篇，共同学习。

首先需要明确的概念

假想策略：根据E9R1，假设所有受试者都依从方案且没有伴发事件发生。对伴发事件使用假想策略，则关注的是倘若不发生伴发事件时的治疗效应。此时关注的科学问题是试验用药的“纯”疗效。受试者在接受下一线治疗后的疾病评估不再能真实反映所关注的疗效，其前数个治疗周期后的总体最佳响应将在假想情景下基于模型预测/填补得到，具体的假设和模型应在主估计方法中明确。从数据收集的角度来看，伴发事件发生后的测量不再是感兴趣的量，而由假想情景下预测的数据替代，故无需收集(除非这些数据被用于其他分析)，一般都作删失处理。

需要注意的是，根据不同的假想，可能会代表不同的临床意义，建立不同的主估计方法，所以需要明确具体的假设情景。例如，针对上述示例，只说“假想受试者未使用下一线治疗”是不准确的，因为存在两种情况：(1)假想受试者无法获得下一线治疗，(2)假想受试者临床状态良好无需使用下一线治疗。根据这两种不同的假想情况，在预测/填补受试者数个周期治疗后的最佳响应时，可能基于不同临床状态的其他受试者进行预测/填补。由于假想策略下的假设通常无法验证，因此，为了评估统计推断在假设偏离下的稳健性，敏感性分析尤为重要。另外，当试验中有大量受试者发生伴发事件并使用假想策略时，大量受试者的变量(终点)需要通过模型预测得到，这将影响疗效评估的有效性和稳健性。所以，假想的情境不仅要具有临床意义，同时要确保估计目标能被较好地估计。

单项交叉设计/单向转组设计：指在进行抗肿瘤新药临床试验时，由于周期比较长，研究者考虑研究风险和伦理学原则等因素，常不同于一般设计，往往会增加期中分析。根据期中分析结果，受试者可以因无效提前退出试验或转到试验组接受试验药治疗。这种设计称之为单向交叉设计或单向转组设计。

带信息删失Informative censoring：表示一种失效时间T和删失时间C是存在相关性的删失。换句话说就是，删失的概率取决于在没有删失的情况下受试者的结果。举个例子，在主要终点为OS的临床实验中，安慰剂组的受试者可能因为疗效不好而发生转组，发生删失。这类删失发生的概率其实是和如果不发生转组，他们继续留在安慰剂组的检查情况和生存时间是相关的。在一般临床试验中，如果协变量不仅影响删失概率，也对未来发生的结果，在这个例子中就是死亡事件，有影响。那么失效时间T和删失时间C的相关性就会增强。IPCW方法就是处理单项转组或退出试验可能引起的带信息删失的情况。

边际结构模型：是一种因果推断方法，主要适用于存在与时间相关协变量的观察性研究。在观察性研究中，暴露变量可能受已观测协变量的影响。边际结构模型通过构造已观测协变量与暴露变量的模型，提出校正了的已观测混杂偏倚的暴露变量的逆概率权重，消除已观测协变量的影响，从而获得暴露变量与结局变量间真实的因果关联。图中的A表示暴露变量，L表示已观测的协变量，U表示未观测的协变量，Y表示结局变量。我们的目标是，直接得出A与Y之间的因果推断关系，所以在图中，也就是，1c是我们最理想的一种状态，这样，我们可以直接建立A与Y的模型来得出A与Y的关系。但在现实情况下，1a和1b才是最常发生的情况，未观测的协变量会直接或间接影响A与Y的相关性。如果是图1a这种情形，如果没有合理的前提假设，任何方法都不能得到A与Y之间因果关联的无偏估计。对于1b这种情况，通过边际结构模型可以建立已观测协变量与暴露变量之间的模型，从而通过加权来消除已观测协变量L的影响。

常见的处理转组数据的方法

现有的在随机临床试验中出现病人转换治疗的常用分析方法大致有三种，第一种是简单方法，就包含了我们这里的意向性分析和符合方案分析。第二种是调整的风险比方法，包括校正比例风险模型等。第三种则是加速失效时间AFT模型，比如两阶段方法。

意向性分析法：是将经随机化分组后接受治疗的受试者纳入分析，无论其是否发生转组，均按其随机化时的分组统计分析。若对照组受试者发生转组，统计分析时仍将其视为对照组受试者，发生转组的受试者生存时间将会被延长，试验组与对照组受试者的疗效差异会被低估。特别是在做优效性试验的情况下，ITT分析法很有可能会低估试验药的疗效。

符合方案分析法：是选择依从方案的受试者进行统计分析，将不依从方案的对照组中发生转租的受试者剔除出数据集或者将其转租后的生存时间看作删失值。对于抗肿瘤新药临床实验中发生转租的受试者，应用该方法分析数据时，将此部分受试者的生存时间看做是删失值，会低估对照组的受试者的总生存期，高估试验药的疗效。若受试者发生转租的原因与疾病的严重程度或药物的疗效有关时，疾病进展的受试者转到试验组后，该部分受试者被剔除或生存事件被看作删失则会产生偏倚。同时样本量减小也会降低检验效能。

校正比例风险模型：该方法可以针对双向转组的情况，把试验和对照组扩大到4个分组，除了不发生转组的情况，新增了试验转到对照，和对照转到试验分组的情况，对重新分组后的数据拟合COX回归模型，评价试验组与对照组的疗效差。在满足某些假设的情况下，理论上是无偏的。但是由于转组的这两个分组在试验初始时的基础风险率无法计算，所以拟合COX模型时评价药物疗效可能会有偏倚。

秩保持结构失效模型：待补充。

案例引入：BIG1-98

下面通过一个女性绝经后乳腺癌辅助内分泌治疗药物弗隆的双盲随机对照Ⅲ期临床研究案例，来说明一下应对转组问题的策略方法。

BIG1-98是在1998年由诺华启动研究，国际乳腺癌研究组之IBCSG完善的芳香化酶抑制剂AI的临床试验。主要研究的药物是来曲挫片，或者叫弗隆。今天我们只介绍这套研究的其中一部分，也就是弗隆和他莫昔芬两种药物的单药对照分析。两款药物都是针对绝经后女性早期乳腺癌患者的辅助治疗。

这项研究共有4922例激素受体阳性早期乳腺癌绝经后受试者加入试验，其中在1998年第一批次LET试验组入组911例，对照组TAM也就是他莫昔芬组入组917例。在次年的第二批次，LET入组1546例，TAM入组1548例。

受试者随机入组后，记录受试者基线数据，并分别接受两种药物的治疗，随访记录受试者的实验室数据。

本次单药分析研究在中位随访51月和76月分别做两次分析，主要疗效终点为乳腺癌患者的无病生存期DFS（随机化开始至第一次肿瘤复发/转移或由于任何原因导致受试者死亡的时间），次要疗效终点为总生存率OS和远处复发等。并通过风险比HR来比较试验药物与对照药物的优劣。

下面这张图展示的是中位随访51月的比较分析结果。可以看出，来曲挫显著提高了无病生存率DFS，在我们关注的远处复发时间指标也有统计学显著的改善。在两组对照中，来曲挫相比于对照组他莫昔芬可以降低死亡风险，但是统计学意义并不显著。

中位随访51月的单药分析显示了来曲唑在疗效上的优势，导致TAM他莫昔芬单药治疗组在2005年揭盲，依据伦理学原则，在随后的一段时间，发生619例，约25.2%的受试者从对照组转到试验组。这些转组受试者在转组前至少在对照组接受2.5年的治疗，转组后的治疗期和随访期的中位数分别为18和21个月。此时试验设计由随机双盲阳性药对照临床试验变为一项观察性研究。这些发生转组的受试者在转组时有47%为淋巴结阳性，有35%患有直径大于2cm的肿瘤。而这两个数字在试验组是29%和26%。可以说发生转组的受试者在接受药物治疗的效果方面是要差于试验组的。

交叉后使用试验药物的中位时间这里是18个月，研究人员在中位随访76月又对两组进行了一次分析。

中位随访76月，研究者更加关心受试者的总生存期OS，分析的结果分别基于意向分析治疗ITT，符合方案分析也就是删失分析，以及IPCW方法。IPCW方法的结果在后面会展示。

意向治疗原则下，无病生存和远处转移时间分析中，与中位随访51月的分析结果类似。试验药有着较显著的提升。OS的风险比为0.87，但95%的置信区间包括1，即差异没有统计学意义。相较对照组，试验组对总生存率的提升效果不显著。

而删失分析下，总生存期的风险比置信区间上界小于1，可以说明试验药来曲唑的疗效优于对照药。

如我们之前所提到，意向治疗原则把发生转组的受试者仍作为转组前所在分组考虑，鉴于已知试验药比对照药的疗效更优，换药人群可能从来曲唑治疗中获益，因此在考虑意向治疗的情况下，会高估对照的疗效，从而低估试验药物的效果。

而删失分析则直接不考虑转组治疗者的数据，这种情况下，样本量减少，产生偏倚且不能客观反映对照组的真实情况，在这个实验中，一部分病人因对照药的副作用而换药，有研究标识这部分病人对对照药的疗效更好，做删失分析会一定程度上会夸大试验药物的作用。

鉴于IIT分析和删失分析均会导致不小的偏倚，研究者在这个案例中考虑了逆概率删失加权法IPCW，也就是我们今天要讨论的内容。

IPCW方法

Robins在1994年提出的逆概率删失加权方法是为了应对自变量存在MAR缺失，或者已知缺失概率的情况。IPCW作为一种较好的处理治疗转换的办法，已经被运用到临床分析研究中。主要是在出现受试者删失或者单项交叉时，调整受治疗或暴露因素影响的、随时间变化的混杂因素所造成的偏倚。

这个方法的思想其实很简单，就是，把发生治疗转换的人看作删失，删失的时间为治疗转换发生的时间，这必将导致对照组有效人数减少，之后再通过对没有发生转组的病人进行加权，把没有发生治疗转换的人扩张成原来的人数，进而校正转组对效果评价的影响。我们这里可以举个简单的例子，比如对照组有10名受试者，其中有2个转入了治疗组，那我们将这两个病人看作删失，因此只剩下8个人在对照组内，而IPCW方法就是通过对对照组剩下的8个人进行加权，把人数扩张成10个人，并能反应10个人如果都没有发生转组的两种治疗效果的差异。当然这只是理想情况，实际上只能逼近。在扩张人数时，IPCW法用未删失概率的倒数进行加权。

在临床实验中，IPCW方法是基于假想策略下的一个应对手段，伴发事件也就是转组事件发生后，这些受试者的测量不再是我们感兴趣的一个量，而是由假想不发生转组情景下的数据替代。

IPCW步骤

IPCW方法应用于转组数据分析的时候一般有三个步骤：

第一步是对转组受试者的数据进行删失。这里的删失可以被记为是一种治疗删失，而不是传统意义上的在发生死亡事件前因为退出研究导致的右删失。这种治疗删失机制是依赖于被删失受试者会影响发生治疗转组的基线数据和与时间相关的影响因素。由于这些这些因素可能具有一定的预测意义，它们与终点和治疗删失机制都有关系。因此IPCW方法引入了权重来纠正这种带信息的删减。
IPCW方法的第二步是计算删失的逆概率权重，权重被定义为给定在时间t的基线数据和与时间相关的混杂因素的观察值，在时间t之前仍在接受随机治疗，即未被治疗删减的概率的倒数。

在说明权重计算公式前，我们先给出一些定义。首先Tic表示受试者i发生治疗删失的时间，tk表示各个可能发生转组的有序时间点，可以理解为各个访视。Xbartl，i表示截止到t_l时间点，受试者i的时变因素的历史观测值，在临床实验中一般是指过去各个访视的实验室指标，不良事件的发生等。而vi为观测到的不随时间变化的固定协变量，一般是一些基线数据

那么受试者i在tk时间点的权重就可以理解为，tk及所有之前时间点的逆概率乘积。而这个逆概率是在已知tl时间点之前未发生转组，且已知时变和固定因素的条件下，tl时间点仍然不发生转组的概率的倒数。

分母条件概率越大表示该受试者不被删失，不发生转组的概率也就越大，也就意味着整个分式以及整个权重是越小的。这样的受试者与原先发生转组的受试者具有差异较大的预后特征。相反，有较大概率发生转组的倾向但还没有发生转组的受试者，就被赋予一个更大的权重，来模拟因为转组而被治疗删失的那些受试者数据。因为分母的概率是小于等于0的，所以权重永远是大于等于1的值。

但是这样的权重也存在一个问题，就是当分母很小，也就发生转组概率很大的时候，可能会导致权重不稳定的情况。所以robins在2000年又提出了一个更稳定的权重：

权重的分母没有发生变化，分子与分母类似，但是在其概率中不考虑随时间变化变量的条件，而仅包含基线的协变量。这是一个比较稳健的权重。当且仅当治疗转换不是选择性的，而是随机发生的时候，给定的协变量不能预测转换治疗发生的风险，权重就趋向于1，而当转组事件的发生不随机，那么权重不会趋向1.

这里分子和分母的条件概率计算可以运用logistic回归模型，以是否转组C为因变量，如果计算分子的概率，那么就是以基线特征v为自变量。分母的话就是基于基线特征V和一些时变变量X拟合logistic回归模型。

我们这里只介绍单向转组的情况，如果出现双向转组，则需要分别拟合模型计算每组的权数。

3. 待权重计算完毕后，IPCW方法要求使用一个边际结构模型来描述治疗组与主要终点目标（比如总生存期）之间的关系。我们这里使用的是Cox 边际结构模型，它估计了没有发生转组或退出治疗的情况下会观察到的边际效应。更具体地说，假设所有的混杂因素都被观察到了，是已知的，将这些权重应用到Cox偏似然估计中，就会产生一个假想的遵守了他们所分配的治疗方案的人群集。Cox边际结构模型与普通的Cox模型都是利用传统的cox模型，但是区别在于，我们在对参数做偏似然估计的时候，对病人在某一时间点的风险用我们第二步计算的权重进行加权。

接下来我们构造Cox比例风险模型来描述两治疗组的风险率，Ai是二元变量，表示不同治疗组，我们可以假设Ai=1为试验治疗组，=0为对照组

之前我们提到，COX边际结构模型与COX传统的风险比例模型区别在于参数的偏似然估计。Robins提出IPCW的Cox偏似然得分函数U beta。

Deltaj表示受试者j的事件发生的指示变量，如果我们这里的疗效终点目标是OS，那么deltaj表示的就是j这名受试者死亡事件发生的指示变量

Tj表示发生事件和治疗删失时间的较小值

Yi tj则表示受试者i在tj这个时间点是否发生结局或删失

Ai的含义和上张幻灯片的描述一致

Robins证明，在满足cox比例风险模型的假设，并且第二步计算的权重的是稳定的条件下，通过这样一个偏似然得分函数计算出的计算参数估计值是一致的，并且是渐近正态的。

将这些IPCW权重使用在Cox边际结构模型，就可以得到试验治疗对我们疗效终点的发生的因果效应关系。

案例回顾

我们在开头介绍的BIG1-98，来曲唑的临床研究案例。IPCW方法也被应用在中位生存76个月估计DFS和OS的风险比的分析中。在这项临床实验中，研究者对发生转组的受试者数据进行删失，随后一些临床特征，包括年龄，先前局部治疗，淋巴结状态，肿瘤分级，肿瘤大小以及随访中体能状态的改变，都与患者预后和转组的概率有关，所以被作为因素考虑到IPCW权重的计算中去。把权重代入到3/4未转组的对照组患者中，得出一个较为合理的结论。

IPCW方法试图从治疗效果的比较中消除选择性交叉带来的影响，并估计出如果25%的被随机分配到对照组的患者如果没有选择转组的治疗效果。

从我们上述的IPCW分析方法，可以计算出风险比，robust的标准差，95%的置信区间以及wald检验的p值。图中分析结果可以看出IPCW方法计算出的风险比，介于ITT分析和删失分析之间，是一种处理单向交叉数据比较稳健的方法。

模拟分析

李玉森在2013年采用蒙特卡洛模拟比较IPCW ITT和删失法处理单项交叉设计生存资料数据的检验效能随样本量和预定风险比增加的变化趋势。模拟假定试验组与对照组样本量为1:1，分别考虑不同的样本总数。首先模拟产生基线年龄和性别数据，其次模拟产生两组在各个访视的ECOG评分，当第二次访视的评分大于等于4时，对照组受试者转到实验组。通过这个方式来模拟带信息删失情况。此外模拟通过预设两组的中位生存时间来假定对照组与试验组风险比为0.6，0.7，0.8，0.9。

模拟数据生成之后随后利用三种不同方法去拟合风险比例模型。

然后重复1000次模拟，分别计算三种方法的检验效能。随后改变样本量，在每个样本量和预设风险比下再模拟同样的次数。1000次模拟中假设检验有统计学意义的次数与1000次的比值即为该方法的检验效能。

从左上顺时针依次为HR=0.6 0.7 0.9 0.8

从图中可以看出，当模拟假设HR=0.6时，样本量在接近100的时候，三种方法检验效能几乎都接近于1. 当样本量为50时，三种方法的检验效能差距较大，

4张图对比来看，IPCW方法要优于ITT分析。此外试验药与对照药疗效差异越小，在相同样本条件下，检验效能差距越来越大，删失法的优势越来越明显。因为删失法倾向于高估试验药的疗效，因此有较高的概率拒绝两药品没有差异的原假设。这样也带来一个问题，就是，删失法有着较高的一类错误率。因此我们再模拟三种方法在1类错误随样本量变化的曲线.

与之前的模拟，略有不同的是，我们模拟假定两组间的中位生存期相同，即HR=1，模拟原假设为真的情况，1000次模拟中假设检验有统计学意义的次数与1000的比值即为该方法的1类错误率。

图中可以明显的看到，删失分析法随着样本量增大，有着越来越高的1类错误率，而意向分析法和逆概率删失加权法差距很小，维持在较低的水平。综合考量，在第1类错误稳定在0.05的情况下，IPCW同时有有着相较于ITT法更优的检验效能，是一种分析单项交叉数据较好的统计方法。

总结

IPCW方法的假定是，所有对患者预后和是否接受后线治疗有影响的因素都参与到加权的过程中，也就是“没有未测量的混杂因素 ”，否则IPCW的结果是存在偏倚的。但是显然这一假设在绝大多数情况下是不成立的。一方面是很难确定所有的影响因素，另一方面是对这些因素的收集不够完整。研究者的判断和数据的可获得性决定了哪些因素会纳入到IPCW的加权中，而采用不同的加权因素得到的结果也会有差异。但是如果没有重要的独立预测因素缺失时，IPCW方法也可以得到很好的结果。因为ipcw方法需要用到cox比例风险模型，所以满足比例风险假设也是必要的

IPCW方法可以控制带信息删失引起的偏倚，并且常常被用于受试者由于检查提示可能出现疾病进展提出转到另一治疗组或退出试验，或者受试者由于不良事件或研究药物的毒性撤回知情同意书或退出试验。

IPCW方法也存在很多的局限性，比如IPCW只能校正由于转组或退出试验等带信息删失引起的偏倚，而由于基线的差异导致两组间不同的情况（比如受试者是曾接受过抗肿瘤药物治疗等），IPCW无法校正。当样本较小以及接受后线治疗的患者比例较高时，IPCW的结果尤其需要谨慎解读。EMA也明确指出IPCW方法不能被用于挽救确认的阴性结果。

参考文献

J. M. Robins, M. A. Hern´an, B. Brumback, Marginal structural models and causal inference in epidemiology, Epidemiology 11 (2000) 550–560. doi:10.1097/00001648-200009000-00011.
Willems S J W, Fiocco M. Inverse probability censoring weights for routine outcome monitoring data[J]. Leiden, The Netherlands: Universiteit Leiden, 2014.
Latimer N R, Abrams K R. NICE DSU technical support document 16: adjusting survival time estimates in the presence of treatment switching[J]. 2014.
金欢. 肿瘤临床试验中三个实际问题的统计方法研究[D]. 复旦大学, 2011.
Colleoni M, Giobbie-Hurder A, Regan M M, et al. Analyses adjusting for selective crossover show improved overall survival with adjuvant letrozole compared with tamoxifen in the BIG 1-98 study[J]. Journal of clinical oncology, 2011, 29(9): 1117.
李玉森. 单向交叉设计生存资料数据IPCW分析方法比较研究[D]. , 2013.