研究人员通过大量样本数据分析选出有效标志物,并在测试数据集中拥有良好的检测特异性和灵敏性;研究人员利用甲基化分析,开发了一种能够对癌症病人进行癌症鉴定、预测预后及生存状况的方法,该方法对于常见癌症均有适用性;随着研究的不断深入,DNA甲基化标记有望应用于微创活检。 文章题目:DNA methylation markers for diagnosis and prognosis of common cancers 研究人员:徐瑞华和张康教授领导的团队 发表时间:2017. 07 期刊名称:PNAS 影响因子:9.661研究背景 以康复和生存为目的的最优癌症治疗策略的选择,很大程度取决于特定癌症类型或癌症亚型的确诊。一些原发性肿瘤的解剖结构复杂,不易精确识别其起源组织或肿瘤类型。为提高诊断准确性,大量的分子特征被用于监测治疗并预测预后和生存。这些方法在组织可用性或质量有限的情况下仍具有特定的效用。 CpG位点甲基化是基因表达的表观遗传调节因子,能够影响基因调控。对于特定类型的癌症,甲基化相较于体细胞突变具有更高的特异性和灵敏度。将特定的甲基化模式与癌症生物学的基因表达相关联对于进一步探索DNA甲基化分析在癌症诊断中的应用具有重要意义。 研究方法 使用来自TCGA的全基因组甲基化数据及机器学习的方法,在四种常见恶性肿瘤(乳腺癌、结直肠癌、肝癌、肺癌)中评估了正常组织和肿瘤组织的DNA甲基化水平。首先在1619个肿瘤样本和173个匹配的癌旁组织样本组成的训练集中确定肿瘤标志物。之后在包括791个肿瘤组织和93个癌旁组织的TCGA数据集中重复上述发现,同时还有一个独立的中国人群训练集,包括394个肿瘤组织和324个癌旁组织。研究发现甲基化模式可以预测患者的预后和生存情况。研究人员对CpG位点的差异甲基化进行了研究,将CpG位点的不同甲基化预测癌症与癌症活检中关键的基因表达进行关联,发现甲基化程度增加则基因表达减少。此外,还验证了肝癌小鼠模型的基因表达谱。 研究成果 1.患者和样本组织的特征 训练集:1619例肿瘤样本+173 例相匹配的癌旁正常组织样本。 测试集:791 例肿瘤样本 +93例癌旁正常组织样本,以上均来自TCGA。 验证集:394例肿瘤样本 +324 例癌旁正常组织样本,样本来自中国医院。 所有相匹配的癌旁组织均来自于同一病人并且经组织学证实没有肿瘤。 2.甲基化图谱识别癌症特异性的甲基化标签 为了识别癌症类型特异性的标记,在8个类型的样本组中将所有TCGA数据集按照2:1分为训练集和测试集。使用moderated t statistic去除极端的噪音;在多项分布中使用lasso(least absolute shrinkageand selection operator)进行多项式分类;多项预测系统使用markers的panel对样本进行预测; 根据CpG位点甲基化程度的不同对样本进行层次聚类来区别肿瘤的原发组织,并且可用于区分TCGA训练集中肿瘤和正常样本。训练集整体诊断的准确率达98.4%,测试集的准确率达97.1%,中国人样本(验证集)的准确率达95.0%。这一结果证实了这些甲基化模式(methylation patterns)的鲁棒性。 表1 TCGA训练集数据 表2 测试集1数据 图1 利用甲基化特征可以通过正常组织区分相对应的癌症类型 3.Methylation Block Structure for Improved Allele Calling Accuracy 借鉴连锁不平衡的概念研究不同DNA链的共甲基化程度,使用两端illumina测序片段来鉴定每个甲基化区块(mblock)。研究人员应用皮尔森系数量化mblock的共甲基化,之后将基因组分为block(紧密相关的共甲基化CpG位点),并将其称之为甲基化相关区域(methylation-correlatedblocks,MCBs),使用R2 阈值为0.5。在肿瘤和正常样本中分析MCBs,发现MCBs在不同的肿瘤和正常组织中具有高度一致性,然后使用MCB评估甲基化程度。研究发现,一个MCB中大量甲基化位点具有相似的β值,因此通过计算一个完整MCB的甲基化值来代替单个CpG位点的甲基化值,使得精确度大大提高。 4.甲基化图谱可以鉴别癌症肝转移 确定组织来源对于转移性肿瘤患者选择合适的治疗策略十分关键,因此研究人员对DNA甲基化分析在诊断中国人数据集中肝、肺癌转移中的作用进行分析。除了上述原发肿瘤外,还分析了30例结直肠癌肝转移和34例结直肠癌肺转移。研究人员发现无监督的分层聚类可以区分这些结肠癌或正常组织的转移。甲基化标记可以正确诊断29/30大肠癌肝转移和32/34大肠癌肺转移。这些发现提高了利用DNA甲基化特征诊断转移性疾病(非原发性癌症)的可能性。 表3 测试集2数据 图2 利用DNA甲基化特征可识别结肠转移癌的原发癌 5.甲基化图谱预测患者预后和生存情况 接下来研究组对每种癌症甲基化标记的预后效果进行评估。其中,临床和人口统计学特征包括:年龄、性别、种族和癌症分期,通过将临床信息与分子数据相结合,可以大大提高预后能力。对于每一种癌症类别,研究人员使用了两种不同的统计学习算法,lasso和Boosting(减少markers的维数),并建立一个预测模型。以2:1的比率评估TCGA训练集和验证集的的预后效用。该方法在低风险组和高风险组的鉴别中均表现良好,使用Kaplan–Meier分析和相关对数秩检验显著P值,证实在BRCA和LUAD甲基化标记在预后方面具有显著的效用。 6.癌症甲基化图谱与其基因表达模式和功能相关 鉴于DNA甲基化是基因表达的一个重要的表观遗传调节因子,因此研究人员试图研究突变与正常组织中基因位点的差异甲基化与基因表达之间的关系。这些位点在前面的标记中预测了恶性肿瘤的存在。像方法中描述的那样,使用甲基化和RNA测序数据选择LIHC中的top CpG markers,其甲基化与基因表达显著相关。与预期中的一致,观察到的启动子甲基化、基因表达和识别已知的几个基因在肿瘤发生中是重要的负相关关系,以及在LIHC中具有相对未知功能基因的相关性。研究人员进一步尝试验证top gene list ,发现其甲基化模式与基因表达在小鼠LIHC模型中紧密相关。在人类和小鼠LIHC中均发现基因表达图谱具有极好的相关性。该结果支持这些甲基化标记物在促进癌变过程中的功能作用,并为它们在甲基化研究中用于癌症特征的生物学验证提供了依据。 总结 研究人员确定了四种常见肿瘤(乳腺癌、结直肠癌、肝癌、肺癌)的DNA甲基化标记物。利用甲基化分析完成癌症的鉴定、病人预后及生存情况的预测。鉴定癌症的准确率高达95%。研究人员对CpG位点的差异甲基化进行研究,将CpG位点的不同甲基化预测癌症与癌症活检中关键的基因表达进行关联,发现甲基化程度增加则基因表达减少。此外,还验证了基因肝癌模型小鼠的表达谱。总之,这些发现证明了甲基化生物标志物在癌症分子特征方面的应用,对癌症的诊断和预后具有深远意义。 小编评论 DNA甲基化是重要的表观遗传过程,与许多疾病的发生发展过程密切相关,其中肿瘤的发生伴随着诸多表观学的改变;DNA甲基化标记应用于微创活检,在减轻患者痛苦的同时增加检查的特异性和灵敏性,将会更有助于患者治疗方案的选择。本文运用常见癌症样本数据选择标志物,对不同癌症种类具有适用性,这对进一步研究DNA甲基化在个性化癌症治疗中的临床应用潜力具有启发和指导意义。此外,涉及更多癌种的研究仍然任重道远。 参考文献: [1] Xiaoke Hao, Huiyan Luo, et al. DNA methylation markers for diagnosis and prognosis of common cancers[J]. PNAS, 2017,114(28): 7414–7419. |
|