分享

肿瘤大作战之——击破肿瘤发病机制

 昵称41082923 2018-06-21

2018年2月,国家癌症中心发布了最新一期的全国癌症统计数据,记载了全国肿瘤登记中心统计的2014年登记资料:2014年全国恶性肿瘤估计新发病例380.4万例,平均每天超过1万人被确诊为癌症,每分钟有7人被确诊为癌症[1]。面对这可怕的数据,肿瘤无疑已成为人类健康的“大敌”。

“知己知彼,百战不殆”,面对肿瘤这一“大敌”,研究其发病机制,是了解、治疗、消灭它的第一步。微分基因现推出系列肿瘤研究产品,其中针对肿瘤发病机制研究,微分基因成熟稳定全面的“杀敌”工具,能够全方位、多角度“一网打尽”致病突变,击破肿瘤发病机制

图1微分基因肿瘤致病机制研究产品分析条目

当然,小编也不能光顾着吹牛,总要给各位提供些干货,如何利用这些名称各异的分析条目解决生物学问题,才是各位看官最关心的。

下面和小编一起来看看,这些“杀敌利器”都是如何work的。

易感基因筛查

根据医学统计发现,部分肿瘤的发生并不是完全随机的,存在一定的家族聚集性,如乳腺癌、子宫内膜癌、结直肠癌等。携带遗传性肿瘤致病突变家系中的成员,可能会通过生殖细胞中携带的突变信息将患有该类肿瘤的“宿命”传递给下一代。医学上将携带生殖细胞突变、引起癌症发生风险增加的基因称为易感基因(Susceptibility gene)。通过对肿瘤患者外周血进行测序分析,可得到该患者正常组织中的胚系突变(Germline mutation),再将此类突变与包括CGC(Cancer Gene Census)[2]、intOGen[3]在内的不同数据库进行比较,得到该患者的癌症易感基因。表1中,记录了检测到的易感基因名称,同时也记载了位于该基因上的突变信息以及同哪些癌症发病相关。

表1易感基因筛查结果

已知驱动基因分析

体细胞突变是导致癌变的重要因素,但在癌变过程中不同体细胞突变所发挥的作用却不尽相同,能够直接导致癌变的体细胞突变为'司机突变'(Driver Mutation),而与癌症发生相关,但不起主导作用的突变,为'乘客突变'(Passenger Mutation)。对于肿瘤配对样本数较少的研究者,一般寻找每个癌组织中驱动基因的手段,是对检测到的体细胞突变通过数据库的信息进行注释与筛选,寻找在数据库或者文献中已经记载的驱动基因。主要参考的数据库、文献信息包括:SMG127,CGC513[2],IntOGen[3]

,Comprehensive435[4]。表2展示了该肿瘤中分析得到的已知驱动基因信息,包括具体突变类型以及在不同数据库中记载它“驱动”了哪些癌症的相关信息。

表2已知驱动基因分析结果

肿瘤突变负荷

肿瘤突变负荷(Tumor Mutation Burden, TMB)是基因组上每百万碱基中,发生在体细胞编码区碱基的替换或者缺失、增加的事件数。不同的肿瘤细胞由于基因组上存在的变异位点密度不同,导致不同肿瘤细胞呈递在细胞表面异常的免疫系统识别物密度不同,而人体内的免疫细胞可以有效识别、杀死异常的肿瘤细胞,因此使用TMB可以有效预测某特定肿瘤患者使用细胞免疫治疗的效果。参照下图结果,患有黑色素瘤的群体相对于患有成神经管细胞瘤的群体TMB较高,指示着黑色素瘤患者可能在接受细胞免疫治疗后会有相对较好的疗效。

图2不同类别肿瘤突变负荷统计

突变特征谱

根据体细胞突变碱基的种类以及该碱基上、下游1 bp的种类,我们可以将SNV的类型分成96种。例如,假设某个位置发生了C>A的突变,C的上游碱基类别可以是A、T、G、C的任意一种,下游也是,将三个位置的碱基类型进行排列组合,共4×1×4=16种可能性。而中间位置的突变,根据C>A、C>G、C>T、T>A、T>C、T>G划分共6种不同的突变形式,所以综合考虑SNV上下游碱基的类型,SNV共有96种不同形式。

通过Maftools[5],Emu[6]等软件,对肿瘤样本中每一种SNV突变类型发生的频率进行统计,绘制此类肿瘤所有的突变特征谱(Mutational signature)。COSMIC[7](Catalogue of Somatic Mutations in Cancer)网站总结了30种肿瘤中常见的突变频谱,并对每一种突变频谱的肿瘤致病因素给出了解释。如下图的Signature 1在所有的癌症中都存在,导致此类突变出现的原因可能与自发的5-甲基胞嘧啶脱氨基作用相关。一般来说,同一种肿瘤样本可能会检测到不止一种突变特征谱,如若分析得到的突变特征谱为COSMIC数据库中已经记载的,可借鉴数据库中记录的导致该突变特征谱产生的致癌因素。

图3 COSMIC网站上记录的Signature 1肿瘤突变特征谱

高频突变基因

当我们能够获得的肿瘤配对样本较多时,可以采用非数据库注释的方法依据肿瘤样本本身各种体细胞突变发生的频率去预测可能的Driver Gene。高频突变基因(Significantly mutated genes)综合考虑了所有肿瘤样本体细胞中的SNV和InDel,寻找突变频率显著高于背景突变频率的基因。高频突变基因的分析采用MutSigCV[8]软件,在基因水平上分析大量肿瘤样本中的Somatic SNV/InDel丰度,并结合突变热点、功能以及进化保守性,筛选得到可能具有生物学意义的高频突变基因,进一步锁定Driver Gene范围。

图4位于胰腺神经内分泌肿瘤上的高频突变基因统计

[9]

通过Pathscan[10]软件进行Pathway显著性富集能确定高频突变基因参与的最主要生化代谢途径和信号转导途径,并与研究样本表型进行比较,找到与表型产生相关性最高的通路以及通路中的关键基因。

图5肝内胆管癌肿瘤样本中高频突变基因富集的通路

[11]

高频拷贝数变异分析

当然,肿瘤基因组上的变异肯定不仅限于上述的Somatic SNV/InDel,还存在影响基因组上更多碱基的体细胞拷贝数变异(Somatic CNA)以及结构变异(Somatic SV)。先就着体细胞拷贝数变异来说,我们知道拷贝数的变化一般分为Loss和Gain,假设在抑癌基因上出现了拷贝数的Loss,那该抑癌基因的功能也会随之“Loss”;假设在癌基因上出现了拷贝数的Gain,相当于癌基因的功能被激活,致癌效果更“佳”。因此,使用GISTIC软件[12]对大量同类癌组织进行发生频率较高的拷贝数变异事件统计,并对该变异事件区段所有基因进行注释以及功能分析,可以帮我们有效锁定哪些体细胞CNA可能与肿瘤的发生密切相关,同时也可以锁定哪些基因可能会因为CNA的发生影响了功能。下图展示了胰腺神经内分泌肿瘤不同染色体上出现的高频拷贝数Loss(左)和高频拷贝数Gain(右)。

图6位于胰腺神经内分泌肿瘤上的高频拷贝数变异

[9]

融合基因分析

基因融合(Gene Fusion)是指染色体上两个或者更多本来物理距离较远的基因通过某种原因首尾相连,形成一个嵌合基因(即融合基因)的现象,一般来说是由于染色体水平上发生了易位、缺失或者倒位引起的。融合基因在癌症的发生过程中扮演了重要的角色,尤其是在血液系统恶性肿瘤中,以慢性粒细胞白血病BCR-ABL基因融合最为经典[13],该融合事件导致蛋白激酶持续性激活,使得白细胞过分增殖而出现慢性淋巴白血病的症状。在后续的研究中发现,无论是血液肿瘤还是实体瘤中,都存在基因融合的现象。

通过人全基因组重测序技术,借助CREST[14]软件分析得到每个肿瘤样本中所有的Somatic SV,由于SV事件断点发生的位置多样,为了研究发生在基因编码区的融合基因,我们仅仅保留断点发生在基因编码区的SV事件。随后结合多个肿瘤样本的信息,得到该类癌种中的高频融合基因,并对涉及的基因信息进行注释(如下表3)。

表3融合基因分析结果

图7基于二代测序的reads CREST软件分析融合基因断点位置的示意图

介绍完了这满满一箩筐的“干货”,不知道大家有没有get到微分基因为大家提供的这款肿瘤致病机制研究产品的分析思路?

这还没完,最后再让小编简单整理一下微分基因肿瘤研究的优势吧:

全面

参考肿瘤经典研究,多角度探讨致病机制

快速

自动化核酸提取与建库平台,搭配5台NovaSeq 6000,保证项目周期与肿瘤研究大数据产出需求

专业

丰富的文库构建经验,外显子文库DNA起始量可低至20ng,FFPE样本核酸提取成功率高达80%+

高效

使用Sentieion软件进行变异挖掘,极大缩短分析周期,让GATK飞起来!

参考资料

[1] 2014年中国分地区恶性肿瘤发病和死亡分析,中华肿瘤杂志,2018年第27卷第1期

[2]数据库链接:https://cancer./census/

[3]数据库链接:https://www./search

[4]David T, Abel G P, Christian P L,et al. Comprehensive identification of mutational cancer driver genes across 12 tumor types[J]. Sci Rep, 2013, 3(10):2650.

[5]网页链接:

http://www./packages/release/bioc/vignettes/maftools/inst/doc/maftools.html

[6]Fischer A, Illingworth C J, Campbell P J,et al. EMu: probabilistic inference of mutational processes and their localization in the cancer genome[J]. Genome Biology, 2013, 14(4):R39-R39.

[7]数据库链接:

http://cancer./cosmic/signatures

[8]Lawrence M S, Stojanov P, Polak P,et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes[J]. Nature, 2013, 499(7457): 214-218.

[9] Scarpa A, Chang D K, Nones K,et al. Whole-genome landscape of pancreatic neuroendocrine tumours.[J]. Nature, 2017, 543(7643):65.

[10] Wendl M C, Wallis J W, Lin L,et al. PathScan: a tool for discerning mutational significance in groups of putative cancer genes. Bioinformatics, 2011, 27(12): 1595-1602.

[11] Zou S, Li J, Zhou H,et al. Mutational landscape of intrahepatic cholangiocarcinoma[J]. Nature Communications, 2014, 5:5696.

[12] Mermel C H, Schumacher S E, Hill B,et al. GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers. Genome biology, 2011, 12(4): R41.

[13] Tkachuk DC, Westbrook CA, Andreeff M,et al. Detection of bcr-abl fusion in chronic myelogeneous leukemia by in situ hybridization[J]. Science, 1990, 250(4980):559-562.

[14] Jianmin Wang, Charles G Mullighan, John Easton,et al.CREST maps somatic structural variation in cancer genomes with base-pair resolution[J]. Nature Methods, 2011, 8(8):652-654.

微分基因为国家大基因中心“基因检测平台”运营方,专注于高通量测序技术,公司凭借国际领先的高通量测序平台,依托独具优势的高通量基因测序和大数据挖掘技术,为各大高校、医院、科研单位以及第三方健康管理服务平台,提供专业的基因检测和数据分析解读服务。2017年,微分基因在国家大基因中心建成2133平方米的洁净分子生物实验室,公司科研团队汇聚了一批国内外优秀的基因组学实验和生物信息分析研究人员。

科技服务部依托公司先进的自动化建库仪、高通量测序仪等实验设备,提供多种测序服务;凭借强大的科研团队,为高校、科研院所等研究单位提供领先的生物信息分析服务。主营业务包括DNA测序、RNA测序、表观组学测序、单细胞测序、ICELL8单细胞表达谱测序、芯片服务、三代全长转录组测序等。

健康|医疗|基因|科普

微分基因科技服务

记得这是一个有温度的公众号

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多