大家好,这里是平鑫而论专栏,我是鑫仔。看了上篇推文,很多小伙伴已经开始磨拳擦掌,准备安排一篇影像组学文章了!还有一些小伙伴发来私信: 为了解答这个疑惑,鑫仔在解析新的一重影像组学花式玩法境界前,先为各位小伙伴来个头盘点评环节,选取几篇近两年有代表性的文章,我们一起看看这个最原始“单单单”的套路玩不玩得转!由于文章众多,本期推文我们先来介绍应用影像设备为CT的文章。 下面我们就开始吧~~ 第一篇文章,2021年发表于Frontiers in Oncology 题为“The Impact of Preoperative Radiomics Signature on the Survival of Breast Cancer Patients With Residual Tumors After NAC”。
研究对象(P):新辅助化疗(NAC)后残留肿瘤的乳腺癌患者(114例纳入) 预测模型(I/C):LASSO-cox回归模型构建的影像组学signature 结局指标(O):5年无病生存期DFS(生存终点,生存时间) 研究类型(S):回顾性队列研究 影像采集时间:NAC后,乳房切除术或保乳手术前 研究目的:利用CT术前影像组学signatures评价NAC后残留肿瘤的乳腺癌患者预后 预测变量X:影像组学特征 结局变量Y:DFS 协变量Z:年龄、绝经状态(前,后)、初始肿瘤原发灶(T2,T3,T4)、初始区域淋巴结受累情况(阴性,阳性)、初始雌激素受体ER(阴性,阳性)、初始孕激素受体PR(阴性,阳性)、初始HER-2(阴性,阳性)、初始Ki-67、术中肿瘤尺寸(<=2cm,2-5cm,>5cm)、手术分级(I/II,III)、术中血管侵袭(存在,缺失)、术中腋窝淋巴结、术中ER(阴性,阳性)、术中PR(阴性,阳性)、术中HER-2(阴性,阳性)、术中Ki-67、是否辅助化疗、是否辅助激素治疗。 借本文流程图,我们重点说说影像组学部分实验设计过程: ① 高质量CT影像数据获取:对比增强CT静脉期影像 ② 感兴趣体积VOI分割:3D Slicer,半自动分割 鑫仔说:高质量影像资料的获取精确的图像分割是影像组学分析的前提 ③ 影像组学特征提取:pyradiomics,得到形态学特征、一阶特征、二阶特征三类特征(见流程图) ④ 特征的一致性评价:观察者内ICCs用于评估影像组学特征提取的可重复性 ⑤ 数据预处理:z值标准化 鑫仔说:特征提取是影像组学的核心步骤 ⑥ 特征选择:10折交叉验证减少过拟合,后建立LASSO-Cox回归模型构建影像组学signature 鑫仔说:预测模型构建是影像组学分析的突破点 ⑦ 模型评价:生存分析风险分层 ⑧ 列线图:结合临床特征及参数构建 本文是一个中规中矩的单变量+单结局+单模型的影像组学文章,文章套路与鑫仔上期介绍的文章如出一辙! 至于2021年还能以这么老的套路发6分+文章,优势在于—— ① 研究人群为NAC后残留肿瘤的乳腺癌患者,他提出了一个没有人提出过的临床问题,并用目前火热的影像组学方法解决; ② 文章的纳排标准以及随访要求描述的比较清晰完整,值得大家学习; ③ 临床资料的完整度优,相关基线和与预后相关的病理参数都具备(诊断, 术中),这对文章模型预测效果的严谨度进行加持; ④统计学方法运用基本得当,这也是我们常说的(bushi)不在河边走就不会湿鞋; ⑤ 虽然没有展示,但文章对列线图预测能力的评估是完整的(区分度、校准度、临床获益) 可见,提出好的问题,把前人的老路取之精华弃之糟粕,把细节做到极致,有一个可以自圆其说的结果,近几年影像组学6分+即使是最简单的套路还是有可能的,而且本研究样本量仅100出头,可借鉴性、可模仿性还是比较强,值得学习。 第二篇文章,2021年发表于World Journal of Surgical Oncology 题为“The preoperative prognostic value of the radiomics nomogram based on CT combined with machine learning in patients with intrahepatic cholangiocarcinoma”。
研究对象(P):肝内胆管癌ICC患者(101例纳入) 预测模型(I/C):LASSO-cox回归模型构建的影像组学signature 结局指标(O):3年和5年总生存期OS(生存终点,生存时间) 研究类型(S):回顾性队列研究 影像采集时间:术前2周内 研究目的:探讨基于增强CT的影像组学列线图对ICC的预后价值 预测变量X:影像组学特征 结局变量Y:OS 协变量Z:性别、年龄、高血压(是,否)、糖尿病(是,否)、乙肝、肝硬化(有,无)、脾功能亢进(是,否)、ALT、AST、ALB、TBIL、PT、INR、AFP、CA 125、CA 19-9、肿瘤尺寸(<=5cm,>5cm)、分化程度(通过术前腰穿和术后病理获得:高,中等,低,不明) 同样,借本文流程图,我们重点说说影像组学部分实验设计过程: ① 高质量CT影像数据获取:对比增强CT门静脉期影像 ② 感兴趣体积VOI分割:LIFEx软件 (A) ③ 影像组学特征提取:LIFEx软件,本文依旧是提取了形态学特征,一阶特征(特征分布直方图),二阶特征(GLCM,GLRLM, NGLDM, 和 GLZLM) 三类(B) ④ 讨论部分研究在处理影响后进行了标准化操作,但具体的方法没有在文中提及 ⑤ 特征选择+列线图构建:利用LASSO-Cox回归模型选择影像特征和临床特征,构建列线图 (C) ⑥ 区分度+校准度评价列线图 (D) ⑦ 生存分析风险分层 (E) 玩烂同样的套路,单变量+单结局+单模型。但文章的劣势在于 —— ① 问题不是很新颖,鑫仔已经说了很多次,影像组学也属于临床研究的范畴,一个好的临床问题直接决定文章的档次,ICC预后这种大赛道已经被很多人解决过了,文章只是较为完整的利用影像组学最初级的方法再解决一次。问题新意以及解决方法上表现欠佳,竞争力就会小很多; ② 虽然文章常规临床研究方面写得比较出色,但与影像组学相关的细节交代并不清楚,在结构的把控上还是有些问题(例如需要关注的图像标准化没有提及等),作者很可能是临床研究的老鸟,影像组学的新手; ③ 本研究100例的样本,用入门级别的影像组学进行预后预测,仍然能发3分左右,是不是心里有点痒痒? 第三篇文章,2021年发表于Frontiers in Oncology(还是这本期刊,不要感到意外,这绝对不是美丽的误会)题为“Preoperative Assessment for Event-Free Survival With Hepatoblastoma in Pediatric Patients by Developing a CT-Based Radiomics Model”。
研究对象(P):小儿肝母细胞瘤(HB)患者(88例纳入:65例为内部训练队列,23例为外部验证队列) 预测模型(I/C):LASSO-cox回归模型构建的影像组学signature和Radscore 结局指标(O):无事件生存期EFS 研究类型(S):回顾性队列研究 影像采集时间:术前腹部CT 研究目的:探索基于 CT 的影像组学模型,用于术前预测小儿肝母细胞瘤患者的无事件生存 (EFS),并将其性能与临床病理学模型的性能进行比较。 小注: 无事件生存期(event free survival, EFS)是指从入组开始到发生任何事件的时间,包括死亡、疾病进展、改换化疗方案、改为化疗、加用其他治疗、发生致死性或不能耐受的副作用等种种事件。主要用于病程较长的恶性肿瘤、或该实验方案危险性高等情况下。 在本文中EFS被定义为从 CT 检查日期到第一次复发、第二次恶性肿瘤发展、疾病进展、死亡或最终随访日期(视情况而定)的时间段。 预测变量X:影像组学特征 结局变量Y:EFS 协变量Z:首诊年龄(<=2,3-7,>=8)、性别、血清AFP浓度(<=100,101-1000,>1000 ng/mL)、组织学亚型、PRETEXT(治疗前分期)组别(I,II,III,IV)、CHIC-HS风险分层、死亡病例、随访时间、术前化疗、手术切除、原位肝移植、肺转移瘤切除、血管受累((V,肝静脉/下腔静脉;P,门静脉),多灶性(F),肿瘤破裂(R),肝外肿瘤扩展(E),尾状叶受累(C),淋巴结转移 (N) 和远处转移 (M) )。 借本文流程图,我们重点说说影像组学部分实验设计过程: ① 高质量CT影像数据获取:对比增强CT门静脉期影像 ② 图像预处理:CT扫描来自不同中心(对整个图像利用公式进行强度归一化;重采样:消除影像组学特征对体素大小的内在依赖性) 鑫仔说:其实图像的预处理过程即使影像来自相同中心也是应该做的。可以对单中心的影像样本进行归一化处理,将信号强度归一化至 1~500 HU,减少不同机器采集图像信号强度的差异。 ③ 感兴趣体积VOI分割:Radcloud 平台 3.1.0 (http://radcloud. cn/) 小注: Radcloud平台是汇医慧影(中国北京)以深耕影像领域的科研积累和始终领先行业的创新技术实力,自主研发出全球唯一的大数据智能分析科研平台,提供以影像为专长,融合临床、病理等多学科研究方法的一站式医疗大数据研究解决方案 ④ 影像组学特征提取:pyradiomics,得到形态学特征、一阶特征、二阶特征和高阶特征四类特征(如流程图) 鑫仔说: 文中这句话,我们可以在特征提取后借鉴。引文PMID: 32154773。但文中并没有进行特征的一致性评价(起码是没有数据)。 ⑤ 特征选择:LASSO回归选取与EFS最强相关的影像组学特征,使用Cox回归模型构建Radscore,同时多因素回归选择临床病理特征 ⑥ 模型构建:基于Radscore和临床病理特征构建列线图 ⑦ Radscore评价:生存分析风险分层 ⑧ 列线图评价:区分度+校准度+临床获益 同样的套路再来一遍,但文章闪光点也是有目共睹的。文章除了继承了第一篇文章的有点外还具有如下优点—— ① 这是一个双中心的研究,模型在外部验证集的表现还是比较不错的C-Index = 0.810 (95% CI: 0.738–0.882),这对模型的泛化能力远比比单中心内部验证集更有说服力; ② 文章对图像对数据对模型的质控做得都比较完整; ③ 还有就是文章清晰的写作条理,读起来完全可以照着作者的方式去做了,这与作者思路的清晰是分不开的; ④ 赛道的竞争,儿童肿瘤本身研究的人就比较少,虽然影像组学与预后的研究已经不新了,但换个特殊的人群,一样能用较小的样本量发到较高的分值,不仅猜想,儿童可以,其他年龄上特殊的,比如妊娠期、老年、超高龄等,一个age纳入条件的变换,有一定的样本量的话,可能就有新的机会。 三篇文章的设计中相同中带着不同,仔细品品,反复对比两次就能发现其中的奥妙,进一步体会单预测变量+单模型+单结局套路的精髓。 好啦,本期平鑫而论的影像组学小白入门系列的单单单小插曲CT篇就到这里了哦,通过鑫仔的总结,你对这个套路的理解有没有加深呢?理解得不错的话,我们下期再一起看看近两年MRI的影像组学单单单套路文章又是什么成色吧~~o(* ̄▽ ̄*)ブ [1] Zhang L, Jiang X, Xie X, et al. The Impact of Preoperative Radiomics Signature on the Survival of Breast Cancer Patients With Residual Tumors After NAC. Front Oncol. 2021;10:523327. Published 2021 Feb 3. doi:10.3389/fonc.2020.523327 [2] Tang Y, Zhang T, Zhou X, et al. The preoperative prognostic value of the radiomics nomogram based on CT combined with machine learning in patients with intrahepatic cholangiocarcinoma. World J Surg Oncol. 2021;19(1):45. Published 2021 Aug 1. doi:10.1186/s12957-021-02162-0 [3] Jiang Y, Sun J, Xia Y, et al. Preoperative Assessment for Event-Free Survival With Hepatoblastoma in Pediatric Patients by Developing a CT-Based Radiomics Model. Front Oncol. 2021;11:644994. Published 2021 Apr 16. doi:10.3389/fonc.2021.644994 [4] Zwanenburg A, Vallières M, Abdalah MA, et al. The Image Biomarker Standardization Initiative: Standardized Quantitative Radiomics for High-Throughput Image-based Phenotyping. Radiology. 2020;295(2):328-338. doi:10.1148/radiol.2020191145 |
|