分享

[遇检周三 | 预测未来] 同时在非小细胞肺癌(NSCLC)中进行病理组织学预测和基因融合检测联合功...

 生物_医药_科研 2019-05-30

摘要

精确的病理组织学分类和融合基因的鉴定是非小细胞肺癌临床诊断的两个基石。本文引进NanoString基因表达平台,一种可以对福尔马林固定石蜡包埋组织(FFPE)样本,同时进行病理组织学分类和融合基因检测的平台,NanoString基因表达平台是一种新的独立通过单个样本的基因表达谱即可对NSCLC单个样本病理组织学类型进行预测,病理组织学分型不需依赖其它平台的基因表达分析平台。病理组织学单样本预测(SSP,single sample predictor)基于68例IHC方法印证的腺癌(AC)、鳞状细胞癌(SqCC)和大细胞神经内分泌癌(LCNEC)组织中的基因表达谱建立。NanoString平台主要基于以下11个基因的表达谱(CHGA, SYP, CD56, SFTPG, NAPSA, TTF-1,TP73L, KRT6A, KRT5, KRT40, KRT16)。SSP与基因融合检测模块结合(分析ALK, RET, ROS1, MET, NRG1以及NTRK1),转化为多组分NanoString分析。组织学上的SSP检测在6例患者中得到验证。队列大小不同(n=11-199)、组织来源不同(早期或晚期疾病)、组织学组成(包括未分化癌)以及基因表达平台不同。131例受试者中,融合基因检测显示5个EML4-ALK融合,4个KIF5B-RET融合,2个CD74-NRG1融合和3个MET外显子14跳跃。组织学测试组和训练组SSP分析成功应用在发展队列中(重复试验组的平均AUC=0.96)。无论基因表达数据平台如何,SSP均能成功预测NSCLC定义明确的亚群以及难以区分的形态。基因表达预测和组织学诊断之间的差异包括混合组织学,真正的大细胞癌,或有粘蛋白表达非常细微差异分化的腺癌病例。该方法可作为肺癌活检常规评价的补充。

背景介绍

全世界每年有160多万人死于肺癌,使其成为最致命的癌症。根据组织学生长模式进一步划分,非小细胞肺癌(NSCLC)是主要的亚型。NSCLC组织学两种主要的亚型是腺癌(AC)和鳞状细胞癌(SqCC)。

作为一种基于NGS的RNA融合基因分析的替代方法,NanoString技术是基于用户捕获特定目标,能够实现聚焦基因表达谱分析和/或多重化分析,从少量降解RNA中进行基因融合检测的技术。因此,这个开放平台允许创建基于RNA的多组分分析,以满足不同的临床需求,同时节省时间、组织样本量和成本。例如,一个基于RNA的分析可以设计为结合多个基因的基因融合检测、组织学分型和基于不同基因表达分析预测新治疗方案以及预测预后特征的方法。Prosigna®分是NanoString技术析的基础,该方法是一种使用福尔马林固定石蜡包埋组织(FFPE)样本,协助临床进行乳腺癌化疗治疗决策的分析。

在这项研究中,目的在于测试基于多组分RNA的诊断工具的新概念,同时用于组织学亚型预测(AC、SqCC和LCNEC)(主要目的)以及适合FFPE样本检测的基因融合分析(次要目的),这两个独立的目的通过一次分析解决。作为实验基础,我们使用了一种现有的、经过验证的NanoString技术分析法来检测临床非小细胞肺癌组织中的基因融合。这一分析被扩展到其他融合基因,并再次验证第二目标以基于RNA的融合基因检测分析。在这一新的扩展分析中,我们还添加了关键的原型谱系相关基因(n=11),其中许多基因目前被用作NSCLC临床IHC标记组织学亚型的分类,同时也能够实现组织学亚型分类的主要目的。选择这组有限的关键基因的原因是:(1)有助于结果的解释;(2)模仿原型遗传基因在IHC中的使用;(3)限制最终分析的大小(基因数量)以降低成本;(4)允许更多的跨平台可能,包括在其他平台(如NGS平台)的分析中,因为这些关键基因可能被包括在内,或更容易被包括在内。这项研究的主要挑战在于利用检测基因的表达来获得一种新的组织学亚型预测因子。为了适用性于临床,以及与其他获得肺癌组织学基因表达预测因子研究相比,其目的是获得一个分类器,能够独立于其他病例(单样本预测因子,SSP)对样本进行分类,而不考虑基因表达平台。因此,理论上,应该是平台第一次推导出预测因子,这意味着它可以应用来自如qPCR,NanoString、微阵列或NGS平台的数据。基于FFPE队列的分析我们得出了一个亚型预测因子,包括新鲜冰冻样本和早期或晚期患者的FFPE样本,包括当前肺癌分类指南(WHO2015年)分类的未分化癌症样本和不同技术平台的样本。如之前报道,研究结果表明,将组织学分型和基因融合检测相结合的多组分基因表达分析可能是对肺癌临床诊断的有益补充。此外,我们还提供了一种生物信息分类器,可用于基因表达数据分析,如RNA测序。研究队列见表1、图1:

[表1*这一亚类包括肉瘤样癌、类癌和腺鳞癌。**对ssp发展队列的所有样本以及验证队列I、II和III加上其他组织学亚型的两个肿瘤进行融合基因分析。***有戒烟史和手术切除肿瘤的患者。◆晚期疾病。活检和细胞学。◆手术切除肿瘤材料。

[图1队列和SSP开发

对31例从不吸烟者的肿瘤患者进行了NanoString分析。来自内部生物库的29例患者SqCC和39例LCNEC的肿瘤患者,合并为最终的SSP发展队列(n=68)。在得出最终预测模型之前,对SSP进行了可行性试验。在可行性试验中,根据组织学将样品分别分成训练组和实验组,重复10次。在可行性试验中开发的SSP用于对试验组的肿瘤进行分类,并对训练组的肿瘤患者进行重新分类。准确度、平衡准确度和AUC值通过迭代计算为平均值。基于可行性试验中迭代SSP模型的不同样本选择导致的高性能和低变异性,在整个SSP发展队列(n=68)中训练最终预测模型,并用于对SSP发展队列中的肿瘤进行重新分类,以验证目的。为了测试最终SSP的独立性能,将该模型应用于6个肿瘤大小、肿瘤分期、组织学组成和基因表达不同的数据平台外部验证队列。对从不吸烟患者(n=31)、SSP发展队列和三个验证队列进行融合基因检测。

结果

NanoString技术用于融合基因检测 在所有NanoString分析融合基因中(发展+验证队列I-III,见表1)显示5个EML4-ALK融合(EML4-alk E6b:A20(n=1)、EML4-alk E13:A20(n=3)、EML4-alk E20:A20(n=1))(图2A)、4个KIF5b-RET融合(KiF5bret UK15:R12(n=2)、KiF5b-RET K16:R12(n=2))、2个CD74-NRG1融合(CD74-NRG1融合(CD74-NRG1融合)2个CD74-NRG融合(CD74-NRG1融合(CD4-NRG1融合)2个CD74-NRG1融合(CD74 nrg1_c8:n6)3个满足外显子14跳跃事件(图2B)。所有融合阳性和Met外显子14例跳跃病例均出现在发展队列(其中包括两例因组织学不同而未用于最后SSP发展队列)以及验证队列I中(包括从不吸烟者)。SSP发展队列中的高基因融合频率包括31名从不吸烟的患者主要是AC组织学亚型(仅此亚组7/31=23%的融合频率)。为了验证NanoString检测基因融合与临床ALK状态,我们比较了验证队列I(表1)中由IHC、 FISH 或者 qPCR得出的NanoString衍生ALK状态与临床确定的ALK状态。在这个队列中,NanoString分析确定了三个ALK融合阳性病例。39例患者中有38例(准确度=0.97,敏感性=1.0,特异性=0.67)观察到完全一致(表2)。发现一个不一致的情况是NanoString(EML4-ALK_E13:A20)和IHC 检测ALK阳性,但FISH检测ALK阴性(图2C)。综上所述,这些结果证实了之前基于FFPE样本基于NanoString的基因融合分析的可行性研究。

[表2使用NanoString技术检测ALK基因融合与临床诊断常规分析的一致性(外部验证队列I)。*使用的方法包括IHC、FISH和/或QPCR。**FISH阴性,IHC阳性。

[图2利用NanoString技术检测ALK基因融合和Met外显子14跳跃事件。

(a)通过NanoString分析检测基因融合,例如涉及ALK基因,基于基因3′、5′部分的表达(计数)和其他地方描述的融合特异性探针(参见)。样本S_0003中ALK相关探针的实际计数值(左边panel)精确显示了可能的ALK融合(EML4-ALK_E13:A20),并显示了ALK基因3'和5'探针在融合发生时的差异表达。将3′/5′探针与融合特异性探针表达相结合比率,可识别出3′/5′表达散点图右上象限的5个ALK融合阳性样品(红色样品)与融合基因分析病例的ALK融合特异性探针(左边panel)表达比率(详情见)表1。

(b)鉴定3名有Met外显子14跳跃事件的患者(红色样本)。检测基于跨越外显子13–15(不包括外显子14)(y轴)的特异性连接探针的高表达,与代表外显子3–4和20–21的探针的平均表达除以外显子14特异性表达(x轴)的比率。包含Met外显子14跳跃事件的样本在右上象限可见,因为这些样本报告了高连接探针计数和外显子14和外显子3–4和20–21探针计数的差异表达。

(c)S_0297_1样品的原始NanoString计数数据,经IHC临床检测ALK阳性,但被称为Fish阴性。NanoString分析确定了ML4-ALK_E13:A20融合的可能。一个5’探针与其余5’探针相比,具有较高的背景计数。

组织学SSP验证局部未分化非小细胞肺癌进展模式 验证队列II(n=11),手术的患者,用新鲜冷冻组织NanoString分析产生的数据组成。主要基于IHC染色,部分未被WHO 2004版指南区分归类为LCC,但根据WHO 2015年指南结果修改为AC(n=4)、SQCC(n=4)或LCC(n=3)。前面四个LCC肿瘤被重新归类为AC(根据WHO2015年指南),也被SSP归类为AC。重新分类的肿瘤样本中有4个(75%)SqCC,在SSP中有三个(75%)也被归为SqCC,一个被归为LCNEC。SqCC病例不一致的属于碱性亚型,没有p40蛋白表达。因此,SSP将8个AC中的7个归类正确(7/8)同时SQCC(88%)正确分类(表3)。对于三个LCC病例,2个被SSP归类为LCNEC,1个被SSP归类为SQCC。应该注意的是,SSP方法没有经过2015年LCC病例优化(不应表达任何诊断标记基因),特别是LCNEC的错误分类可通过分析原型LCNEC相关基因的表达进行调整(预计LCNEC中的错误分类显著升高)。总的来说,LCC病例分析报告低拷贝基因计数支持先前提到的“标记无效”表型的肿瘤类型。

[表3] 队列和SSP的一致性

组织学SSP验证晚期未分化非小细胞肺癌生长模式 验证队列III(n=11)由来自晚期肿瘤患者FFPE的NanoString数据分析组成,这些患者被常规临床诊断归类为NSCLC-NOS中。病理学家(K.E-L)将所有NSCLC-NOS病例重新分类为AC(n=8)、SQCC(n=1)、NE(n=1)或NSCLC-NOS(标记空白,n=1)。SqCC和LCNEC肿瘤的组织病理学分类与SSP分类的一致性为100%(表3)。在SSP分类中8例(38%)分类在AC肿瘤,而在SSP中分类不一致的AC病例被分类为SqCC(表3)。根据一个或两个粘蛋白标记物阳性(分别为CDX2或PAS-D,补充表1),将所有不一致的病例重新分类为AC。具有这种染色模式的肿瘤类型通常与分化不良有关,分型时需要特别注意。对5例不一致的AC肿瘤样本的NanoString结果进行个案回顾,发现2例患者的基因表达总体较低,这可能是由于RNA质量较低(即不确定分析)。一个肿瘤样本出现不同角蛋白高表达,例如角蛋白5(KRT5,在IHC中称为CK5)在NanoString分析中,将SSP分类改为SqCC。KRT5基因的高表达可能是由于正常支气管上皮细胞(包括柱状和基底细胞)和肿瘤组织周围的鳞状上皮化生表达,这在HE染色检查和KRT5(CK5)IHC染色时最明显(图3a),因为这些区域包括从组织块中提取的整个切片用于RNA萃取。其余两个不一致、分化差的病例,仅根据粘蛋白标记物的表达,在组织病理学上被归类为AC,没有NanoString探针存在。

非选择性局部非小细胞肺癌组织学单样本预测因子的验证   验证队列IV(n=199)由手术新鲜腺鳞状瘤或肉瘤样的肿瘤组织样本生成的RNaseq数据组成。根据WHO 2015年指南分类为AC, SqCC,LCNEC, LCC。在第四队列中,AC或SQCC组织学的肿瘤分别有95%(n=109/115)和97%(n=66/68),而LCNEC肿瘤相应初始成功率为60%(3例/5例)(表3)。有趣的是,两个被SSP错误分类的LCNEC肿瘤似乎没有表达LCNEC标记基因(图3b)。值得注意的是,最近的一项研究也没有将这些肿瘤分类为LCNEC,而是在转录亚组将这些肿瘤分为以AC病例。事实上,仅从新鲜组织进行取样分析AC和RNaseq分析,这两个病例进行详细的组织病理学复查发现,这两个病例都存在LCNEC和AC的混合组织学亚型(图3b)。总之,这解释了我们的预测因子与最初报告的组织病理学分类的差异性,也就是说,在验证队列IV中,SSP与当前LCNEC组织学一致性达到100%。验证队列IV中的组织病理分类AC、SqCC、LCNEC病例的总准确度为0.95(不包括两个有抽样偏差的LCNEC病例),如果将这些病例作为AC治疗,准确率则为0.96。在后一种情况下,对于单个组织学分类,AC的敏感性和特异性分别为0.95和0.97,LCNEC的敏感性和特异性分别为1和0.97,SqCC的敏感性和特异性分别为0.97和0.99。

[图3SSP分类不一致

(a)对最初归类为NSCLC-NOS的肿瘤进行深入的组织病理学评估,病理学家将其重新归类为AC,而验证队列III中的SSP(右上角小组)将其归为SqCC。肿瘤HE染色清楚显示肿瘤细胞丰富区(左下IHC板),而KRT5 IHC染色显示支气管上皮细胞阳性,肿瘤组织周围有鳞状化生(右下IHC板)。后者很可能是从组织中提取的RNA中KRT5(和其他鳞状标记物)表达升高的原因(左上方的表达面板)。

(b)验证队列IV中两个错误分类的LCNEC肿瘤。由于LCNEC相关基因的低mRNA表达和AC基因的高表达,这些肿瘤被SSP(顶级表达panels)归类为AC,与原始组织病理学评估不一致。对这些不一致病例的深入研究显示AC和LCNEC组织学混合,分别使用AC和LCNEC免疫标记物从IHC染色中可见(低panels)。对这些病例的进一步回顾显示,RNaseq仅从AC组这两个肿瘤中提取和分析RNA。

进一步验证组织学SSP的准确性 我们在另外三个验证队列(外部验证队列V、VI和VII,表1)中验证了SSP,这些验证队列包括使用微阵列(n=451,illumina HT-12 v4或affymetrix人类基因组U133加2.0阵列)生成可用基因表达的公开数据。由于病理学家用于组织学分类的WHO指南存在差异,因此仅使用SSP预测AC和SqCC组织学病例。V组和VI组的一致性比率较高(表3)(AC组织学的一致性比率为95%和92%,SQCC组织学的一致性比率为96%和92%),而验证队列VII组的一致性比率较低(AC组织学的一致性比率为83%,SqCC组织学的一致性比率为84%)。为了研究验证队列VII的低一致性,我们分别绘制了代表AC和SQCC典型谱系样基因的napsin a和krt5的基因表达,与组织病理学和SSP分类交叉定义的样本组相比。这些基因的表达明显模拟了SSP的预测,例如SSP预测为SqCC的组织病理性AC病例具有与两个预测因子预测为SqCC的病例相似的Napsin A和KRT5表达。此外,在验证队列7中,使用3000个变异的基因对170个病例进行了聚类分析,结果表明不一致的病例聚类分析与SSP预测一致。

讨论

肺癌组织学分类预测基因突变和基因融合是肺癌患者临床管理的重要因素,但是由于晚期患者的活检组织材料受限,因此从多个方面来说,同时满足多种临床检测类型分类的多成分分析是非常可取的。

在这项研究中,同时在非小细胞肺癌(NSCLC)中进行病理组织学预测和基因融合检测联合功能的基因表达工具。基于FFPE样本中基因表达模式的分析,提出了一种关键诊断基因独立于基因表达平台构建的NSCLC肿瘤组织学单样本生物信息学预测算法,以及基于NanoString平台的完整实验多组分分析法,同时用于FFPE样本进行组织学和基因融合检测互补评估。

本研究的重点,多组分分析的主要目的是预测肿瘤组织学的基因表达。NSCLC的正确组织学分类在临床上很重要,但由于技术问题(与影像学和IHC染色有关)、组织来源、组织量、肿瘤分化差以及肺癌的分子异质性,可能会带来挑战以及耗时长。

关于多组分分析的第二个目的,融合基因检测。


参考来源:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多