分享

大热门IDEA研究,换个角度来看它(二) | 论坛报特邀 & 医统江湖出品

 邹子书库 2017-09-05



研究分析

2017年ASCO大会口头报告时,IDEA研究报道结果所采用的数据分析集的数据锁定日期为2017年2月1日。截至数据锁定日期,共计入组12834例患者,已大大超过研究方案中预估的样本含量10500例患者,收集到无疾病生存(DFS)事件数共计3263例,已达到研究方案预估所需要DFS终点事件数的96%。各研究中位随访时间从35个月(C80702)到62个月(TOSCA)不等。

IDEA研究对非劣效主要研究终点采用区间估计方法,针对3个月对比6个月方案DFS的HR值作区间估计,若95%CI上限不超过非劣效界值1.12,即可认为研究达到了主要研究终点,即3个月辅助治疗方案DFS不劣于6个月方案。实际从ASCO大会口头报告的IDEA研究结果来看,本研究并未达到预先设定的非劣效研究终点,3个月辅助治疗方案对比6个月方案HR=1.07(95%CI:1.00~1.15),95%CI上限超出了预设的非劣效界值HR=1.12,即主要研究终点未达到3个月非劣效于6个月的统计学结论。

预设的两个亚组分析分别是分期和化疗方案。对化疗方案进行亚组分析结果显示,FOLFOX方案中3个月对比6个月DFS的HR为1.16(95%CI:1.06~1.26),未达到非劣效终点,但CAPOX方案中HR为0.95(95%CI:0.85~1.06),显示3个月方案DFS不劣于6个月方案。对分期的亚组分析结果显示,在低危Ⅲ期结肠癌患者(T1~3N1)中,3个月对比6个月DFS的HR为1.01(95%CI:0.90~1.12),95%CI上限正好在界值范围,显示达到了非劣效终点,而在高危Ⅲ期结肠癌患者(T4/N2)为1.12(95%CI:1.03~1.23),显示3个月方案DFS显著劣于6个月方案。

进一步针对预设亚组分期和化疗方案联合分析,根据危险度分层显示,高危Ⅲ期结肠癌患者中(T4/N2),接受3个月的FOLFOX辅助化疗DFS显著劣于6个月(HR=1.20,95%CI:1.07~1.35),但在CAPOX组中并未观察到类似情况,3个月CAPOX方案对比6个月方案未达到非劣效研究终点,也并未显示出6个月方案更优(HR=1.02,95%CI:0.89~1.17);而低危Ⅲ期结肠癌患者(T1~3N1),FOLFOX方案中3个月未能证实和6个月组非劣效,但CAPOX方案中发现3个月组非劣效于CAPOX6个月组,达到了非劣效终点(HR=0.85,95%CI:0.71~1.01)。值得特别注意的是,对预设亚组分期和化疗方案联合分析发现,不同治疗方案(FOLFOX与CAPOX)与治疗时间对DFS的影响存在统计学交互作用(interaction p-value=0.0051),因此对于包含两个方案的分析结果应格外谨慎。

总结起来,IDEA研究者在2017年ASCO大会上的结果报道大致思路如下图所示,先在研究方案中设定的数据分析集mITT人群中做总的结果分析,然后根据预先设定的两个亚组分析因素,即分期和化疗方案,分别进行了亚组分析,最后再根据两个重要的预设亚组,进一步组合分析,将预设的两个亚组(分期和化疗方案)联合分析,形成4个亚组人群进行分析(高危/低危Ⅲ期结肠癌对FOLFOX/CAPOX方案)。

图  IDEA研究数据分析思路


Q:为什么IDEA研究者会采用这样的数据呈现方式呢?为什么在针对预设亚组因素分析之后,还要将两个亚组分析因素进一步进行组合分析呢?

这源于一个有趣的发现,即不同治疗方案(FOLFOX对CAPOX)与治疗时间(3个月对6个月)对DFS的影响存在统计学交互作用(interaction p-value=0.0051)。在研究数据的分析过程中,我们经常会遇到交互作用的问题,交互作用相对来说较为复杂,也往往难以描述和解释。对于交互作用概念,简单来说,如果某一个因素在另一个因素不同水平时产生的效应不一样,就可以说这两个因素间存在交互作用。当存在交互作用时,由于该因素不同水平层间效应不一致,此时就不应该继续看主效应,而应该特别关注该因素不同水平层间的交互效应。所以IDEA研究者在发现不同治疗方案与治疗时间对DFS的影响存在统计学交互作用后,需要考虑的另外一个问题是,对于高危或低危Ⅲ期结肠癌患者之间的主效应,是否由于治疗方案不同而产生不同效应?此时针对危险度分层(分期)的亚组分析,就非常有必要再按照治疗方案进一步分层分析,因此才会有后续4个亚组人群进行联合分析的数据分析模式。

进一步深入地说,针对交互作用的分析,往往需要考虑三个层面的内容:统计学交互作用、流行病学交互作用和生物学交互作用。三个层面的交互作用环环相扣,紧密相关,只有对交互作用一步步仔细分析,才能最终确认研究中发现的统计学交互作用是否为真实存在生物学交互作用。生物学交互作用是一种真实的关联,是研究者特别关注也特别感兴趣的内容。IDEA的数据报告思路,正是研究者一步步发现结果,寻找真实关联的过程。然而IDEA研究的设计初衷并不是要比较不同治疗方案对Ⅲ期结肠癌生存的影响,在基线时并未针对此因素进行随机分层,而是由医师决定选择哪种药物治疗方案,可能会存在潜在选择偏倚,因此后续针对FOLFOX/CAPOX方案的交互作用,有必要继续深入分析,计算各类交互作用评价指标,未来非常期待IDEA研究者报道相关数据结果。


Q:为什么IDEA研究这么重要,证据级别高呢?

在循证金字塔中,系统评价和荟萃分析高居塔尖,IDEA研究类型属于荟萃分析,但与传统荟萃分析相比,更具优势,证据级别更高。既往的荟萃分析(meta-anaylsis)往往是基于临床试验水平对所获得的结果进行合并分析,而IDEA研究是一个汇总分析,是基于个体病例数据,针对原始数据进行的合并分析。显然,汇总分析是属于荟萃分析中的一类,但它与传统的荟萃分析有所不同,它是直接从试验研究者获得试验方案和个体病例数据,通过集中收集、检查和分析数据,最终合并试验结果,得到干预措施的估计值。

从研究设计角度来说,汇总分析对所有研究使用统一的纳入和排除标准,可以观察到个体水平的缺失数据,可以调整不同研究中的基线因素,可以进行亚组分析等;从统计学角度来说,可以对不同研究间的统计分析进行标化,可以调整混杂因素,可以增加统计学检验效能,全面灵活应用所获得个体水平数据的相关因素。因其独具优势,目前越来越受到广大研究者的重视。


Q:IDEA的研究结果会改变目前的指南吗?

目前下结论为时过早,ASCO大会的口头报道中也并未对IDEA研究作最终结论,仅做了研究总结(summary)和共识(consensus)。综合整个研究来看,首先,IDEA尚未结束,目前ASCO大会报道的结果是基于收集到的96%DFS事件数,尚未达到方案预设的3390例DFS事件数,尚未达到研究预设的90%统计学检验效能作非劣效统计推断。其次,尽管在结肠癌中DFS被证明是OS的良好的替代终点,未来仍需要长期随访后的OS结果来证实IDEA研究结果的可靠性。第三,IDEA研究还有大量重要数据尚未披露,关于FOLFOX与CAPOX之间的交互作用评价,6个月方案中患者的治疗完成情况,均值得进一步深入分析。


Q:如何将统计学结果解读为临床结论?

ASCO大会口头报道IDEA主要研究结果以来,针对IDEA研究结果的各种观点分歧很大。面对不显著的统计学P值和差异非常小的临床结果,该如何看待?如何将IDEA研究的统计学结果解读为临床结论,面临极限挑战。是否可以根据无统计学意义的P值将IDEA研究“一棍子打死”,认为统计学不显著的结果一定是阴性结果,一定是没有意义的结果?从临床研究角度来看,统计学是工具,能帮助研究者更严格、更规范、更好地开展临床研究,说到底统计学应该为临床研究服务,绝不应当直接将统计学结论等同于临床结论,任何一个临床研究的结论,必定是将统计学分析结果与临床实践相结合,谨慎分析后得出的结论。从统计学角度来看,IDEA研究样本量较大,对主要研究终点的估计已经较为准确,不确定性较小,数据结果应当非常接近真实情况,尽管合并的总结果正在界值附近,但极有可能真实情况就是这样。虽未达到非劣效研究终点,但应特别重视3个月方案对比6个月方案在临床终点上真实的差异较小。此外,IDEA研究样本量很大,能保证亚组分析有足够的统计学检验效能,方案中预设的亚组分析应重点考虑,期待IDEA学术合作组进一步对数据仔细分析,披露更多研究结果,造福Ⅲ期结肠癌患者。


编辑 | 黄蕾蕾(中国医学论坛报)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多