《新英格兰医学杂志》(NEJM)作为宇宙第一医学期刊,它每周会全文翻译一篇专著。 在其小程序《NEJM医学前沿》,大家可以点击查看学习翻译全文。 NEJM杂志的统计学,篇篇堪称典范,我想很多人想学习,但是英文全文晦涩难懂。但中文译稿就不同了,对于想学习那些文章研究设计 与统计学方法,又苦于英文理解的朋友来说,简直不能再好的福利! 但统计学还是不好理解(哪怕是中文),所以我想来一个沉浸式学习的模式:论文全文阅读+统计学解读。
可能您一开始不太懂,但是如果你能够坚持半年,我想你就懂了它的套路。 第一部分:今日试水文章 最近来自西班牙某大学的研究者们发起了一项开放标签、多中心随机对照试验,旨在研究积极液体复苏与中度液体复苏相比安全性和有效性对不同严重程度的急性胰腺炎患者液体复苏。该论文发表在9月15号出版的《New England Journal of Medicine》上,影响因子176.079 今天这篇论文,我聚焦于期中分析。 期中分析,是指正式完成临床试验前,按事先制订的分析计划,比较处理组间的有效性和安全性所作的分析。如果一个期中分析是为了决定是否终止试验而设计的,则常采用成组序贯设计。 有不少人问我,期中分析如何进行,如何中止。最近我看了一篇NEJM的论文,觉得写得还不错。 所以拿出来和各位一起分享下。 要学习本篇文章,强烈建议诸位首先点击下方卡片学习,也可以点击文末“阅读原文”点击进行学习。 请大家不妨忽略学科内容,聚焦于研究设计与统计方法。 第二部分:摘要与主要结果 一、摘要 背景 早期积极液体复苏被广泛推荐用于急性胰腺炎的治疗,但这一做法的证据有限。 方法 在18家研究中心,我们将急性胰腺炎患者随机分组,分别接受目标指导下的乳酸盐林格液积极或适度复苏。积极液体复苏包括快速输注20 mL/kg,随后给予3 mL/(kg·h)。适度液体复苏包括向血容量不足的患者快速输注10 mL/kg,对于血容量正常的患者不进行快速输注,随后对于这一组的所有患者,给予1.5 mL/(kg·h)。患者在12、24、48和72小时接受评估,液体复苏根据患者的临床状态进行调整。主要结局是住院期间中度重症或重症胰腺炎的发生。主要安全性结局是液体过多。计划样本量为744,第一次计划的期中分析在纳入248例患者后进行。 结果 共计249例患者被纳入期中分析。由于安全性结局存在组间差异,而中度重症或重症胰腺炎发生率(积极复苏组22.1%和适度复苏组17.3%;经校正的相对危险度,1.30;95%置信区间[CI],0.78~2.18;P=0.32)无显著差异,本试验终止。积极复苏组20.5%的患者和适度复苏组6.3%的患者发生了液体过多(经校正的相对危险度,2.85;95% CI,1.36~5.94,P=0.004)。在积极复苏组和适度复苏组中,中位住院持续时间分别为6天(四分位距,4~8)和5天(四分位距,3~7)。 结论 在这项在急性胰腺炎患者中进行的随机试验中,早期积极液体复苏导致液体过多的发生率较高,并且临床结局无改善(由萨洛德卡洛斯三世研究所[Instituto de Salud CarlosⅢ]等资助,WATERFALL在ClinicalTrials.gov注册号为NCT04381169)。 二、研究结果 结论:这项涉及急性胰腺炎患者的随机试验中,早期积极液体复苏导致液体超负荷的发生率更高,但临床结果没有改善。 第三部分:设计与统计学方法
二、样本量计算 中度重症或重症急性胰腺炎的预期发生率为35% 。我们计算得出,在预期10%患者退出的情况下,744例患者的样本量(每组372例患者)将为本试验提供80%的统计学功效,在0.05的双侧显著性水平(α),检测到10个百分点的组间差异(35%与25%之间)。在纳入1/3和2/3的患者(分别为248例和496例)之后计划进行两项期中分析;因此,样本量计算考虑了使用O'Brien-Fleming消耗函数的三次序贯检验。有三项事先确定的终止规则:主要结局存在组间差异,在第一次期中分析时,双侧P值<0.0002,或者在第二次期中分析时,双侧P值<0.012;根据数据和安全监察委员会判定,如果有一个试验组中的害处超过另外一组的明确证据(安全性),则减慢患者纳入速度
三、统计方法 1. 意向治疗分析人群包括所有接受了随机分组的患者,试验数据按照意向治疗原则进行分析。
2.正态性使用Shapiro-Wilk检验进行评估。分类变量报告为计数和百分比,连续变量报告为均值和标准差或中位数和四分位距
4.组间差异性分析:连续变量的差异使用t检验和Mann-Whitney U检验进行比较。分类结局使用卡方检验进行比较(必要时使用Fisher校正),表达为相对危险度和相应的95% CI。
5.作为事后分析,针对随机化分层因子(中心、基线是否有SIRS、基线是否存在血容量不足)进行校正的Cochran-Mantel-Haenszel方法用于实现较稳健的分析,并给出了校正后的相对危险度和相应95% CI。
6.对于主要疗效结局和安全性结局,双侧P值小于0.05被认为表示统计学意义。由于在检验次要结局或其他结局时,统计学分析计划未提供多重比较校正,因此这些结果报告为点估计值及其95% CI。本试验未对置信区间宽度进行多重性校正,因此置信区间不应用于推断次要结局明确的疗效。
7.缺失值采取多重插补。有缺失值的变量,该研究进行了完整病例分析,并在多重填补后进行分析(见补充附录)。
8.除了缺失数据多重填补、以及使用Cochran-Mantel-Haenszel方法针对随机化分层因子进行校正之外,所有结局和统计学分析是试验方案中预先设定的。
9.试验对疗效和安全性结局进行了预设的亚组分析,以确定基线血容量不足和SIRS的影响,因为有人提出,在有或没有这些因素的患者中,早期液体复苏策略可能有较好的疗效
10.使用 SPSS 28.0 (IBM) 版、SAS 9.4 版(SAS 研究所)和 R 软件4.1.2完成全部数据分析。 最后:闲来郑语 我今儿个对期中分析多说几句。 第一,什么时候有期中分析 一般是序贯设计事后 第二,期中分析目的是什么? 两点,第一,如果目标干预效果好,可以提前结束;第二,如果目标干预效果差,而且有不良反应较高,也可以提前终止。本例就是第二种情况,早期积极液体复苏导致液体过多的发生率较高,并且临床结局无改善。没效果,还副作用更强,难道还留着过年不成? 第三,期中分析需要进行假阳性α控制 一篇论文,多次进行假设检验,都会增加假阳性概率。次要结局指标可以任之由之,但主要结局指标假阳性率一般要控制在5% 以内。 一般的办法是α再分配,比如本例预设2次期中分析,一次终末分析,三次分析,在第一次期中分析时,双侧P值<0.0002,或者在第二次期中分析时,双侧P值<0.012。 结果发现,第一次期中分析P=0.32,远远大于统计学意义的界值,所以数据监察委员会就决定终止了。 OK,就这样子,感谢阅读。 |
|