分享

文章解读 | 通过对血液中多种生物指标的检测进行肿瘤的早期筛查及定位

 生物_医药_科研 2018-12-15

本文通过对血液游离的蛋白标志物和DNA突变水平进行综合分析,能够分辨出8种常见肿瘤的类型。研究者将这种方法命名为CancerSEEK,并在8种肿瘤类型(卵巢癌,肝癌,胃癌,胰腺癌,食管癌,结直肠癌,肺癌和乳腺癌)的1005名肿瘤患者中进行了试验,检测出患肿瘤的阳性率为70%。在卵巢癌,肝癌,胃癌,胰腺癌和食管癌这五种肿瘤患者中,检测的敏感性在69%到98%之间。CancerSEEK检测的特异性大于99%,在812例健康人中只有7例被检测为阳性。除此之外,CancerSEEK还能够将83%左右的肿瘤患者进行小范围的精准定位。

文章题目:Detection and localization of surgicallyresectable cancers with a multi-analyte blood test

研究人员:约翰·霍普金斯大学Kimmel 癌症研究中心团队等人

发表时间:2018.01.18

期刊名称:Science

影响因子:37.205


研究背景

众所周知,癌症早期往往通过手术治疗就能够得到很好的控制甚至痊愈,但是一旦肿瘤发生发展到转移的程度,那么单纯依靠手术治疗就很难痊愈了。因此在肿瘤研究中,对肿瘤的早期筛查尤为关键。肿瘤从发生到转移通常是一个较漫长的过程,这也为肿瘤的早筛提供了时间上的可能。肠镜,乳腺X射线检查,宫颈脱落细胞检查等等是现阶段被公认的肿瘤早期筛查方式。基于血液检测应用最广的案例是检测前列腺癌特异抗原,然而这种方法的使用也存在着一定的争议。新型的血液肿瘤早筛技术,需要突破以下两个方面的问题。第一,早期肿瘤患者每毫升血液中大概含有1个突变,已经超过了基因检测突变的技术限制,因此血液检测的方法需要更高的特异性和灵敏度。第二,很多类型的肿瘤共享重要的突变基因,所以不能通过单纯的基因组突变检测来判断肿瘤发生的位置。本文CancerSEEK这个方法不仅能够对肿瘤进行早期筛查还能对肿瘤的原发灶进行定位。


研究方法与研究结果

1 CancerSEEK

1.1 方法

  • 建立一个蛋白和基因marker的panel。通过在序列上添加独特的barcode减少测序的错误率,并将总的DNA分成多个芯片进行扩增处理。Panel的蛋白数据信息主要是来自以往发表文章中肿瘤检测相关的蛋白,通过免疫分析平台进行评估,最终在41个蛋白中挑选出8个可以用于区分肿瘤患者和正常对照的蛋白标志物。

  • 基于PCR的芯片,寻找肿瘤相关的突变。

  • Panel:61个扩增区域,包括16个基因,每个片段平均长度为33bp。

1.2 挑战

  • 需要大量的测序数据

  • 高的测序深度(因为血液中的突变大多数为低频突变)    

  • 测序碱基数目的限制(碱基数目越多,人为的测序错误率越高)

  • 费用及产出

1.3 应对方法

研究者挑选出在8种类型肿瘤都至少存在一个driver突变的最少测序序列。对于挑战2,研究中发现当扩增达到60倍的时候,增加扩增的倍数不仅不能提高检测的灵敏度,反而会增加检测的假阳性。

1.4 结果

如图1曲线,本文设计的panel在COSMIC数据库肿瘤样本中能够检出41%的肝癌,95%的胰腺癌。在文章研究的805例肿瘤患者中,设计的panel效果更好一点,有82%的患者至少检出一个突变,47%的患者至少检出两个突变,检出两个以上突变的患者占8%。在不同类型肿瘤中,检出率差异比较大,例如在肝癌中检出率是60%,在卵巢癌中检出率可达到100%(见图1,彩色圆点)。

图1 基于PCR技术在血液中检测肿瘤特有突变

2 CancerSEEK对1005个病人进行研究

2.1 样本

1005个I到III期的8种肿瘤患者(卵巢癌,肝癌,胃癌,胰腺癌,食管癌,结直肠癌,肺癌和乳腺癌)。在取血液样本之前患者没有接受联合化疗治疗,也未出现远端转移。年龄在22-93岁不等,平均64岁。选取812个无肿瘤史及重大疾病的健康人做为对照组。

2.2 筛选标准

出现panel中任何一个gene的突变或者检测到8个蛋白中的任何一个出现表达,就判断这个人为肿瘤患者。为了进一步确定检测的准确性,将突变数据和蛋白标记物水平进行逻辑回归运算,对CancerSEEK检验进行打分。敏感度和特异性的均值由10次交叉验证的10次迭代运算结果决定。

2.3 结果

全部的肿瘤患者和对照人群放在一起展示的ROC曲线如图2A所示。如图2C所示,八种类型肿瘤平均的检测敏感度是70%,在卵巢癌中检测的平均灵敏度是98%,乳腺癌是33%。在这样的敏感度下,对应的特异性能达到99%以上。812个对照组中,只有7个人检测结果呈现阳性。不同时期的肿瘤患者检出的敏感性不同,在III期患者中敏感度是78%,II期是73%,I期是43%(如图2B)。在I肝癌期患者检出的灵敏度是100%,食管癌检出灵敏度最低是20%。

图2 CancerSEEK 检测效果统计图

3 验证血液检测突变与组织活检中突变的一致性

3.1 样本

153个肿瘤患者(血液检出突变呈显著水平,同时保留原发肿瘤组织)

3.2 结果

153例肿瘤患者中有138例的血液检测突变与组织活检检出突变一致。在八种类型肿瘤中,血液和组织检出突变皆出现一致性,一致性率从胃癌中的82%到卵巢癌中的100%不等。

4 液体活检局限性—很难判断肿瘤的类型

4.1 样本

626例CancerSEEK检测呈阳性的肿瘤患者。

4.2 目的

对检测阳性的肿瘤患者进行最适当的临床诊断和实时监控。

4.3 方法

采用监督式机器学习方法对CancerSEEK阳性的患者进行肿瘤类型的预测。算法将观察DNA突变以及几种蛋白质表达水平的可能性结合起来,以得出最终的检测结果。

4.4 结果

如图3所示,在不同肿瘤间对肿瘤定位的预测准确性存在差异。以乳腺癌患者为例,有83%的患者被定位在两个组织部位,有63%的患者被定位在一个组织部位。因为显著突变基因基本不存在肿瘤组织特异性,对肿瘤的定位主要取决于蛋白标志物信息。

图3 对CancerSEEK检测呈阳性的病人采用机器学习方法识别定位肿瘤发生部位准确性的统计

文章总结

研究者将血液中的ctDNA突变和蛋白生物标记物的信息整合在一起,运用监督式机器学习的方法对肿瘤进行早筛及定位。整个算法在提升预测敏感度的基础上并没有大幅度降低特异性。目前,这个检测方法还存在很多局限性。例如,一、我们研究的是在临床上有明显症状的肿瘤患者,对肿瘤初期患者的检出率可能会比现有发表数据小很多。二、健康人群建立的局限性,文章是以健康人群建立的对照组,这样对一些有炎症反应及其他类型非肿瘤疾病的患者来说,增大了假阳性的概率。三、尽管多重交叉验证在判断敏感性和特异性中是一个有力且应用广泛的方法,但是我们不能用一套完整且独立的例子进行验证。四、由于研究中使用的八种肿瘤类型所占比例与美国实际患病情况并不一致,研究结果显示CancerSEEK检出的平均灵敏度并不能反映实际情况。目前,这种预测方法可以作为其他检测方法的辅助检测手段,并不能代替其他非血液检测方法。


小编评论

肿瘤的早期筛查是肿瘤防控的重中之重。文章中将血液中的ctDNA突变和蛋白生物标记物的信息整合在一起,运用监督式机器学习的方法对肿瘤进行早筛及定位。由此受到启发,在未来的研究中其他一些肿瘤生物标记物,例如代谢产物,mRNA,miRNA和甲基化DNA序列等等都可以被整合以提高检测的敏感度及更精准的定位。未来多组学多维度的研究定能推动肿瘤研究取得突破性的进展。

参考文献

[1] Joshua D. Cohen, Lu Li, et al. Detection and localization of surgically resectable cancers with a multi-analyte blood test[J]. Science, 2018.

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多