分享

病理组学的套路可以这么发!还发到了Nature子刊

 夏夜悠凉 2020-08-25

挑圈联靠解读2020Nature子刊生信文章,

肿瘤预测分析新方法! 


大家好,我是阿琛。还记得在三十六策中,酸菜老师总结在基础科研中有四大金刚,分别是基因组学,转录组学,蛋白组学,以及代谢组学。而在近年来,随着各个领域中大数据的迅速兴起,人工智能这一新兴领域也得以快速发展,各种组学技术和分析算法的开发也同样进入了快车道。

其中,人工智能在影像诊断和病理分析领域中的应用更是得到了广泛的关注。通过计算机来进行图像特征的提取与分析,进而辅助临床诊断,具有较高的诊断准确性。2020年7月27号,来自欧洲分子生物学实验室的研究团队基于病理图像识别,在Nature Cancer杂志上发表了题为“Pan-cancer computational histopathology reveals mutations, tumor composition and prognosis”的最新研究成果。

背景介绍

首先,来介绍一下Nature Cancer杂志。作为Nature旗下的新刊,其在线期刊于2020年1月份正式上线。尽管目前尚未进入SCI收录,但是根据预测,1-2年内应该就会进入,且未来的影响因子应该不会低于Nature Communication。心动的小伙伴们也可以尝试投稿一下哦~~

在本文中,作者通过深度转移学习,量化了来自28种癌症类型,17,355个HE染色的组织病理图像,并将其与匹配的基因组,转录组学和生存数据相关联。结果显示,这种方法可以准确地分类癌症类型,并提供空间分辨的肿瘤和正常组织的区别

同时,计算组织病理学特征与多种癌症类型的大量复发性遗传畸变相关,包括发生在多种癌症类型中的全基因组重复,单个染色体非整倍性,病灶扩增和缺失以及驱动基因突变中表现出普遍特征。而且,大量的基因表达水平和组织病理学之间存在广泛的关联,以及可以根据组织病理学亚型和分级提高预后。这些发现显示了计算机视觉在表征肿瘤组织病理学分子基础方面的巨大潜力。

文章解读

下面,我们一起来看下这篇文章的具体内容。

1

挑:泛癌H&E染色切片图像的预处理与特征提取

首先,作者获取了17,396张H&E染色的组织切片,将图像分割成1400万256μm x256μm大小的图像点,9754张肿瘤纯度大于85%的切片按8:2的比例分成训练组和验证组,以便于后续模型的建立和验证。通过深度转移学习,最终得到了1536个神经元的输出组成,并称之为计算组织病理学特征。其中,对于14例具有正常和肿瘤图像的癌症,肿瘤/正常组织分类的平均AUC为0.99,表明在同一器官中,肿瘤与正常组织之间存在差异,具有很高的区分准确率。

同时,作者将该模型用来训练区分不同的组织类别。结果显示,模型网络可以区分不同的正常组织类型,而不同肿瘤组织之间呈现聚集现象,且欧式距离显著降低,这也说明了不同肿瘤组织之间表型和生物学特性趋于相似。


2

联:基因组改变与组织病理学模式有关

组织特征的改变,其本质归结于内在基因表达的改变与变异。通过关联分析,作者发现,许多癌症类型的一系列基因改变与计算组织病理学特征之间存在广泛的相关性,包括发生在多种癌症类型中的全基因组重复,单个染色体非整倍性,病灶扩增和缺失以及驱动基因突变中表现出普遍特征。提取肿瘤细胞的特征,结合其中一些典型基因DNA水平的改变,作者解释了基因表达的变化可以反映具有不同形态特征的不同类型的肿瘤细胞,比如在EGFR扩增的胶质母细胞瘤中,肿瘤细胞呈现小细胞的特性。


3

联:转录组学关联揭示了免疫浸润和基质细胞类型

另一个影响癌症组织学的分子层面是转录组。除了肿瘤细胞,基因表达的变化还可以反映间质和浸润性免疫细胞,这些细胞具有明显的组织学特征。因此,作者将每种癌症类型中计算组织病理学特征与转录组表达数据相互关联,以探究其中的相关性。

结果显示,约25%的基因:癌症对之间存在显著的关联,其中相关基因最多的肿瘤类型是胸腺瘤(n=8,377)、肉瘤(n=8,359)和皮肤黑色素瘤(n=7,124),比如T细胞相关基因LCK、CD8A、CD247和CD4等与胸腺瘤的组织病理学密切相关。这反映了组织学通常反映肿瘤的成分和细胞类型,这种关系可以用计算机视觉和转录学来量化。

而且,组织病理学特征的这一特性还可以延伸到分子关联,如与炎性细胞浸润的关联,这似乎是各种癌症类型的主要特征。13种癌组织的肿瘤浸润淋巴细胞评分与组织学评分呈显著正相关。当然,在大多数情况下,对淋巴细胞浸润模式的预测相对一致,TIL呈分散分布,但在特殊情况下,信号经常局限于包含淋巴细胞聚集的区域内。


4

 靠:各种癌症的预后影响

最后,作者利用18种不同癌症的计算组织病理学特征,结合预后信息,建立了患者总生存期(OS)的预测模型。同时,Cox比例风险模型计算了PC-CHIP提供的预后信号,并评估了其单独预测的准确性,以及与传统组织病理学(分级和亚型)、临床特征(年龄、性别和癌症分期)以及转录本数据之间的相关性。

总体而言,18种癌症类型中有15种的计算组织病理学特征与OS显著相关。更重要的是,与通常用来评估预后的典型组织学亚型和分级相比,10/16的癌症类型的组织病理学特征显示出明显的改善。即使进一步包括年龄、性别和肿瘤分期等临床特征,这种预后信号在这些癌症类型中的大多数仍然是可以测量的。


同时,为了进一步验证组织病理特征网络模型的延伸性,作者将其用于了TCGA数据集和METABRIC数据集。在METABRIC和TCGA乳腺癌队列中,包括TP53突变等的基因组改变被发现与样本中的计算组织病理学特征相关。而且,组织病理学特征能够预测肿瘤浸润的淋巴细胞和预后的关联性。在TCGA训练数据中,该算法将病理切片上的坏死区和肿瘤浸润淋巴细胞分别被认为是不利和有利的预后标志。


好啦,整个文章就到此结束了。万变不离其宗,虽然结合了最新的病理组学技术,但是仍包含在酸菜校长总结的“挑”、“圈”、“联”、“靠”四字框架中,小伙伴们多多体会~~~

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多