分享

Nature子刊文献解读|外显子测序不白做,如何解读数据是关键!

 小梦想在努力 2019-01-01

全外显子组测序(WES):一种利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。

由于其能以相对较低的检测成本,获得更加可靠的突变,创造更多的临床价值,受到了越来越多学者的喜爱,成为遗传病诊断的新秀

但是,做WES的人多了,后续出现的问题也多了。Iasia老师最近就收到了很多客户的反馈,说是测完序后拿到一堆数据不知道该怎么做,挖掘不出更多更有价值的内容,想让我帮忙做更深、更全面的分析

Iasia老师今天索性就以nature communication上的一篇文章为例,边解读文献边给大家讲一下做了WES之后应该如何解读数据,找出突变基因,获得更有价值的结果,发高分文章。


摘要

· 胰腺导管腺癌(PDA)是一种预后较差的恶性疾病,需要了解它的病因才能进行靶向治疗。将109例显微切割的PDA病例进行全外显子组测序,通过分析发现环境的压力、DNA修复基因的变异与肿瘤突变图谱具有相关性。

· 拷贝数的改变会靶向多个肿瘤抑制/致癌基因位点,但是只有MYC的扩增与不良预后和腺癌亚型是相关的。在PDA疾病中鉴定出多个新的突变基因,其中一部分基因对疾病的预后具有重要意义。

· 尽管具有侵袭性疾病的特征,发现RBM10突变与较长的生存期相关。在超过90%的病例中观察到KRAS突变,且编码Q61密码子基因与生存率增加相关。致癌基因BRAF突变与KRAS相互排斥,并对vemurafenib治疗PDA模型具有敏感性。

· 在Wnt信号通路、染色质重塑、Hedgehog 信号通路、DNA修复和细胞周期过程中有一些相关基因是高频突变。这些数据共同反应了PDA的基因突变多样性,为预后决定因素和治疗靶点提供了重要信息。

研究思路

作者对109例PDA/正常样本进行全外显子组测序,而后对数据进行解析,同时做了验证实验和功能研究。

整篇文章主要讲的内容都是生信分析,亮点也是在分析方法上的创新,所以特地选择此篇文章来讲高级生信分析。来学习一下作者的分析流程。

研究结果

TMB突变负荷

为了得到PDA患者样品中的肿瘤细胞,排除非肿瘤组织的影响,对109例手术切除的PDA病例采用针切法显著富集到来自周围微环境中的PDA肿瘤细胞后,进行了全外显子测序,这些样本具有相应的临床信息以及病理学特征。

在先前的测序PDA中,每个样本检测到的平均突变负荷是26个,与大多数实体瘤相比,突变负荷相对较低。在研究者的样本中观察到的平均突变负荷是每个样本为67个非同义突变,与多个其他实体瘤类型相似。

图1  109例临床信息以及病理学特征

图2 测序样本中的突变负荷。25%的突变负荷的样本的相关突变基因。通过超几何检验确定基因与突变负荷的关联性。

突变负荷和突变图谱的决定因素分析

与其它实体恶性肿瘤的相一致,具有最高突变负荷的样本在错配修复基因中有缺陷,与G>A,C>T碱基变化相关。

图3 不同程度突变的碱基变化的比较

根据样本的突变情况、肿瘤的分期、临床上的分级、吸烟与否进行分析,发现吸烟是一个重要的危险因素。吸烟者一般预后差,中位生存率为不吸烟者的一半,通过分析得到吸烟因素主要与碱基变换C>A颠换相关。

图4 吸烟与否的碱基变化比较

拷贝数变异与MYC的作用

通过对PDA的CNV进行AP算法聚类揭示了几个不同的变异模式(图5a、左),发现第5类群和第6类群相对于其它群体具有更多的扩增/缺失(图5a,右)。第5,6群的病例发现DNA修复缺失基因中除了TP53这个基因,其他基因在这两群中突变特异(超几何检验)(图5b),而且5,6两群的预后较差(图5c)。

图5 PDA中的拷贝数变异

通过GISTIC分析CNV的显著性区域,发现大量的癌基因(例如,MYC和CCND1)和肿瘤抑制基因(例如Smad4和CDKN2A)都具有显著性的扩增和缺失区域(图6d)。对这些区域与预后信息进行分析,发现只有MYC癌基因的8q24的扩增与预后相关(图6e)。虽然MYC过表达已被证明有助于胰腺癌在小鼠模型中的发生,但很少在患者标本中进行研究。MYC的扩增通过原位杂交法进行了验证(图6F)。虽然MYC扩增的病例不具有较高的突变负荷或与PDA的其他标志突变相关,但是在胰腺癌的腺鳞状亚型中扩增非常显著。

图6 PDA中的拷贝数变异

驱动基因分析与突变预后分析

MutSigCV分析109对PDA/正常组织样本,显示在超过3.5%的病例中有24个显著突变的基因(图7)。

图7  使用MutSigCV从109个测序的病例中确定SNV和INDELS的突变显著性

为了比较,研究者对先前测序的数据也进行了类似分析,显示仅有四个非同义突变。其中KRAS、TP53、CDKN2A和Smad4在之前多个研究中证实了促进PDA肿瘤发生的改变。大多数GNAS突变在热点密码子201(R201C和R201H),而且所有GNAS突变的浸润性癌病例来自一个共同的前体,导管内胰腺肿瘤(IPMN),从中还发现六个包含GNAS改变的PDA中,四个样本中有KRAS共同突变。

6例和4例常规PDA病例中分别检测到两个突变基因(RNF43、RBM10),这两个基因在IPMN中同样是突变的。对这些基因进行预后分析发现RBM10基因发生突变会使预后变好,而ARID1A则相反。另外296个PDA病例的免疫组化分析结果表明,ARID1A蛋白的缺失与不良预后显著相关(图8)

 图8  驱动基因分析以及相关基因的预后分析 

KRAS通路的遗传多样性

PDA样本主要是以KRAS突变为主,可在92%的病例中检测到(图9a)。与其他测序研究一致, KRAS突变虽然有发生在密码子13和61中,但大多数发生在密码子12中(图9b和c)。密码子61处突变的样本相比较密码子12处突变的样本有更好的预后(图9d)。

图9 PDA中的KRAS / BRAF-Pathway

在RBM10突变肿瘤中观察到密码子61处KRAS突变的病例也表现出不良预后。当评估PERK染色时,密码子61的KRAS突变与其他突变相比ERK活性降低(图10)。这表明,在PDA中KRAS突变影响RAS通路激活和疾病的预后。

图10 PDA中的KRAS / BRAF-Pathway

在野生型KRAS的样本中发生的PIK3CA突变和BRAF突变被激活,富集在其他肿瘤类型中(图11)。在KRAS、BRAF和PIK3CA野生型的样本中也发现一些癌症相关基因(例如,STK11,GNAS, CHEK2 and 和RB1)。BRAF V600 E突变发生频率为3%且与KRAS突变互斥。虽然通过PDA的基因分析只能确定一小部分患者,但是可以进行KRAS/BRAF靶向治疗。

图11 PDA中的BRAF突变与所有癌症病例的分析结果比较

胰腺癌中经常发生突变的通路

除了核心KRAS通路,我们还发现在PDA中高频率(>20%)遗传变异的多种其他通路(图12)。除了Smad4的影响很大之外,TGF-通路也受其他基因的干扰,比如TGFBR2/TGFBR1 的缺失,以及ACVR1B的突变,这都是新的肿瘤相关基因。

图12 PDA中的通路

类似地,在RB通路中,CDKN2A和CDKN2B频繁缺失的同时, 也观察到CDK4和CCND1扩增和RB1缺失。在信号通路中,根据每个pathway的基因突变情况计算PDA样本中通路之间的相互关系来揭示通路之间的相互作用。(图13b)。

基于这些异常调节的通路中的CNA,用随机森林和AP聚类方法将PDA的样本分为多个亚型,从中发现异常调节的通路各种组合的多样性(图13c)。虽然单独的或与TP53联合的KRAS通路改变的肿瘤预后较差,但更复杂的通路异常调节的肿瘤趋向于更差的结果(图13d)。

图13  PDA中的通路

研究者通过数据分析表明PDA是一种遗传多样性疾病,包含与其他实体恶性肿瘤类似的突变负荷。

通过临床信息与突变信息的关联分析,以及聚类的方法将病人分成各种亚型找出多个之前在PDA中没有报道过的突变基因,这将有助于疾病建模和患者分类做个性化的治疗。

生信小知识

30秒知识点

AP聚类算法

(Affinity propagation Clustering Algorithm )

AP聚类算法是基于数据点间的'信息传递'的一种聚类算法。与k-均值算法或k中心点算法不同,AP算法不需要在运行算法之前确定聚类的个数。AP算法寻找的'examplars'即聚类中心点是数据集合中实际存在的点,作为每类的代表。

精神食粮还嫌不够足?〣( ºΔº )〣

明信社前两期关于高级生信分析的解读了解一下(直接戳链接就能进)

Cell文献解读丨同是研究三阴乳腺癌,为何偏偏它有28分?

Nature子刊文献解读丨少做实验,还能发高分文章的新思路!你来不来?

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多