分享

文献解读 | TCGA-从10389个成人癌症患者发现的致病胚系变异

 生物_医药_科研 2018-12-15

文章题目:Pathogenic Germline Variants in 10,389 Adult Cancers

研究人员:华盛顿大学医学部和McDonnell基因所等研究团队

发表时间:2018. 04

期刊名称:Cell

影响因子:31.398


研究亮点

1.从10389例患者(来源于33个癌种)中检出了871个易感型变异和CNV;

2.泛癌症研究鉴定了跨癌症共同的变异基因;

3. 33个影响致癌基因激活结构域的变异表达量较高;

4.使用了癌症富集,杂合性缺失(LOH),表达和其他证据优化出47个VUSs ( variants relegated to the uncertainsignificance)。


研究背景

相当一部分的癌症是可遗传的,但是已知的常见变异只能解释癌症的一部分遗传负荷。100多个基因(其中大部分是抑癌基因)拥有罕见的易感型等位基因。虽然越来越多的证据表明许多癌症有着共同的易感因子,但是大多数报道的胚系变异都集中在单一的癌症类型。先前的泛癌症研究阐明了这些抑癌基因的致病胚系变异,包括TCGA和COGS中的ATM、BRCA1、BRCA2、BRIP1、PALB2基因,PCGP中的TP53,APC,BRCA2,NF1,PMS2,RB1基因。随着测序项目的扩大,对多基因范畴和多癌症型别的大范围系统分析是急需的。对胚系变异的高通量数据进行的系统分析,像肿瘤测序数据和mRNA测序数据,这些可以提供功能实验的证据,也便于深层次的临床解释。诸如肿瘤和正常样品的测序数据中等位基因信息可以验证抑癌基因的变异在经典的二次打击理论模型下是否经历了正向选择,mRNA分析则可以给出胚系截断突变是否导致表达减少的证据。值得注意的是,现在的的ACMG-AMP指南没有使用这种类型的体细胞分析证据作为胚系变异有害性评价的证据。


研究成果

本文研究中,作者分析了TCGA中33个癌种共计10389例样本的致病性变异的图谱,发现致病胚系变异或疑似胚系变异占比8%,在致癌基因中鉴定了33个变异,然后通过在其他癌种群体的验证和RET等位基因的实验,调查了这些变异的功能性后果。最后,又发现了18个拷贝数缺失和47个基于多条功能性证据的VUSs。总之,本研究呈现了关于罕见的胚系易感变异的最大系统性分析的结果,也提供了解决癌症功能性问题的强大基础支持。

跨33个癌种的致病变异发现

作者开发了一个名称为CharGer的变异自动分类流程,它采用并扩展了ACMG-AMP指南,专门用于癌症的罕见变异。CharGer评估每一个变异后,如果是Clinvar和自建数据库中已知的致病变异会将其标记为致病,反之则将CharGer得分大于8的变异记为疑似致病,得分大于4的记为优先VUSs(图s2)。使用PCGP库的883个胚系变异对这个自动分类流程基准评价,证明了它的高性能:敏感性88%,假阳性率4.9%。使用CharGer对TCGA群体中的变异进行分类,31963个变异中1393个记为癌症中的罕见变异(1000人基因组和全ExAC r.3.0.1中等位基因频率<=0.05%>

4.1%(n=428)的个体中检出致病变异,另外3.8%(n=390)的个体携带疑似致病变异(图2A)。不同的癌症类型致病或疑似致病变异检出的频率极为不同,OV中检出19.9%,BRCA中为9.9%。其他的癌症类型和组织相关,涉及到环境暴露因子的有着较低的携带检出率,比如SKCM(6.2%)和UVM(5%)。在PCPG中22.9%,PAAD中14.1%,SARG中12.5%的检出表明罕见胚系变异在这些癌症人群中有着较多的分布。

作者也研究了致病变异/疑似致病变异和癌症类型的关系,发现28个特异的癌症-基因关系(FDR<><><>



图2 跨基因癌症类型的致病胚系变异分布

变异携带者基因表达产量的改变

致癌基因的表达量与抑癌基因相比分布明显不同(图4B),抑癌基因的致病/疑似致病变异胚系变异相对有着较低的基因表达量。抑癌基因的47.6%变异位于表达量的底部1/4,致癌基因的62.1%位于表达量的顶部1/4,这表明携带致病/疑似致病变异的致癌基因和抑癌基因有着大相径庭的转录调节作用。在变异水平,有METp.H1112R变异的三种肿瘤都在KIRP的顶部的25%。12例携带易感RET等位基因的个体在他们各自的癌种群体中有着较高的RET表达量。两个乳腺癌PTPN11携带者p.N58S和p.T411M都有着较高的表达量(>88%)。肿瘤中高表达的变异相关致癌基因,许多都没有检出拷贝数扩增,暗示癌症细胞倾向上调致癌基因的致病等位基因。

图 4B 胚系变异基因

罕见的胚系拷贝数改变

对SNP芯片数据和外显子数据分析,分别发现42208和53726个罕见的CNVs(图5A)。频率过滤后得到3584个重叠的CNVs。总体而言,每个个体有0.38个重叠的缺失,0.96个重叠的重复。44%的CNV影响一个基因,56%的CNV影响多个基因(图5B)。基于大量发现的CNVs,作者假设致病的CNVs位于特定癌症富集的基因上。使用28个癌症-基因关联对,发现11个抑癌基因中明显拷贝数缺失的18次事件(图5C)。验证特异肿瘤中CNVs缺失的转录效果显示:9/14的个体显示在他们各自的癌症中有明显的较低表达,其他受累样品没有此种情况。


图5罕见胚系拷贝数变异

独立的致病性基因组支持证据

作者寻找了853个致病/疑似致病变异可以致病的独立证据:(1)单个变异水平,癌症个体相比非癌症个体的显著富集程度;(2)变异与儿科癌症中致病胚系等位基因共定位,或者是周期性体系突变;(3)与转录后修饰位点的共定位。为了确定致病/疑似致病变异是否富集于癌症病例中,作者通过比较TCGA 病例中的等位基因频率与非TCGA的个体进行了关联测试,发现了30个暗示关联性的独特变异(图6A),TOP4是ATM的p.E1978*,BRCA1的p.Q1777fs,POT1的p.R363*,PALB2的p.R170fs。同时,这些结果也为致癌基因变异MET p.H1112R和MPL p.F126fs提供了证据。在TCGA队列中,观察到先前在1,120种儿科癌症中发现的28种致病/可能致病变异,包括BRIP1,ERCC3,FANCC,MSH2和WRN中的获得终止密码子变异。而且,发现23个胚系变异和频发的体细胞突变共定位于TCGAMC3人群中(图6B)。比如TP53 p.R248W是高度复发的体细胞突变,同时被观察为小儿横纹肌肉瘤和LGG的胚系变异;MEN2(多发性内分泌肿瘤2型)相关等位基因RET p.M918T也检出于 PCPG,并与MEN2B疾病相关也被发现是复发体细胞突变。这些暗示了儿科癌症和成人癌症共享着同样的致癌过程,就和胚系基因组和体细胞基因组一样。进一步评估这组853例致病/疑似致病变异是否可以影响更广泛的患病人群:作者对德克萨斯州大学的MDACC研究所收集的肿瘤群体进行了重叠性研究,在MDACC的8种肿瘤类型人群中重新发现了TCGA中发现的29个特异性变异(0.96%突变携带频率),作为比较,在来源于ExAC人群的非TCGA样品中只发现0.58%的变异携带率(53105个样本),这表明这些变异富集于癌症中。

图 6 致病变异功能支持性独立证据

转录后修饰位置的变异

对853个变异和ActiveDriverDB/ PhosphoSitePlus/UniProt Knowledge Base的316216个已知转录后修饰变异进行对比,发现65个错义变异和34个独特的PTMs重合或相近。和致病PTM(post-translationalmodification)相关的前6个基因包括VHL,CHEK2,BUB1B,TP53,RET。这和我们之前发现的PTMs位点富集于疾病突变是一致的。对PTM变异和位点特异的酶底物反应匹配研究表明60%以上发生在已知蛋白位点的9/18个基因的独特取代边界都是上游激酶或者其他类型的酶。这都表明一系列的致病易感胚系变异都是通过扰乱或重组复杂的蛋白信号网络发挥功能。

组合证据判定VUSs

用于判定VUSs的整合途径分析可以联系到潜在的功能性,在540个优先的VUSs中,作者发现了47个额外的易感变异,然而需要至少以下的2类证据:案例-对照频率,LOH,表达效果,和频发突变/PTMs的共定位情况(图S2)。这些功能评价的方法在未来变异分类中可能会更广为人知。


文章总结

一般而言,胚系变异经常由于在现行可用数据库中缺乏证据,在ACMG-AMP分类系统缺少体细胞突变信息两类原因在分类系统中被忽视。文章所用的方法证明肿瘤和正常组织匹配的测序对于胚系变异的解释的有用性,因为它们需要二次打击事件,包括LOH和二等位基因事件。在每一个癌症患者个体中,检出34%和4.3%的致病/疑似致病胚系变异发生了LOH和二等位基因事件。在群体水平,发现胚系变异和体细胞突变影响相同的基团。尽管以上的方法提供了对于胚系变异的系统评价,但是谨慎的评价要求去除复杂因子的影响,如可能诱导LOH的乘客体细胞拷贝数事件。这些信息帮助验证了多效基因变异的致癌效应。RNA-seq的肿瘤表达数据表明近半数抑癌基因的变异有着较低的基因表达,突出了体细胞突变影响功能基因的潜力,也可能验证了胚系变异的转录效果。胚系变异与PTMs的重合显示了信号作为癌症一种可能的易感机制。除了2个已知的与PTMs重合的致病变异(TP53和PTEN)和其他接近PTMs的变异,选择优先的VUSs也显示了调整PTMs的重要性。总之,文章系统核实超过1万个样本的易感变异和相应的功能证据。33个癌症类别中致病变异的分类告诉我们癌症的基因遗传学知识。而且,这些结果表明每一个胚系变异都应该在相应体细胞基因组和下游表达的背景下谨慎评价。这些证据不仅有助于验证致病变异,并且有利于对VUSs的优先排级和对非编码基因组的发现。


小编评论

本文利用TCGA数据库的上万例样本进行了多癌种的胚系致病变异分析,因为数据量较大,所以其中使用的研究分析方法和得到的结论值得我们借鉴。首先,对癌症胚系变异的致病性评价所使用的ACMG-AMP,文章专门进行了一些针对性扩展,并相应添加了一些独立的致病性支持证据如致病变异与频发体细胞突变共定位等。令人佩服的是作者还特异开发了变异分类的CharGer流程。其次,进行一些统计分析时,公共人群数据库资源的使用也是恰到好处的。当然,大数据泛癌症分析中的一些发现也很让人惊讶。


参考文献

[1] Samantha J. Caesar-Johnson, John A. Demchok, Ina Felau, et al. Pathogenic Germline Variants in 10,389 Adult Cancers[J]. Cell, 2018, 173(2):355–370.e14.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多