分享

Nature|人类癌症基因组的体细胞结构变异模式

 生物_医药_科研 2020-03-31
Patterns of somatic structural variation in human cancer genomes
 
结构变异是比单核苷酸变异更有影响的,无论是对于生物的性状改变和基因表达调控还是在癌症的发生和变异中,本文从来自38个癌症组织的2559个癌症基因组测序数据出发,对癌症细胞中的结构变异进行全面的分类分析和特征描述。
 
1.癌症基因组中结构变异的检测和分类
数据处理方法:文章采用的数据是来自38个肿瘤类型的2658个癌症的全基因组测序数据,使用的参考基因组是hs37d5.使用了四种结构变异检测软件,分别是:SvABADELLYBRASSdRanger。然后通过使用基于图论的算法来识别不同软件之间的重叠断点连接,将它们合并到最后的变异集合之中。继而作者开发了一个基于断点的新的模型去对检测到的结构变异进行分类。文中形象的将结构变异定义为基因组中两个断点(breakpoint)之间的连接(junction,根据连接处的两个片段的方向和相关的拷贝数变化可将结构变异分为图1中的几种类型。

 1结构变异的分类
 
2.不同类别结构变异的分布情况
文中最后的分析采用了经过了严厉筛选(2429个肿瘤中至少检测到一个体细胞结构变异)来自38个肿瘤类型的2559个癌症基因组。图2展示了不同的结构变异在不同的肿瘤类型之中分布。可以看出,在简单(simple)结构变异之中,删除是最为常见的,其次是串联重复,接下来是不平衡易位;而相互易位和相互倒位是最不常见的。在不同肿瘤类型和同一肿瘤类型的不同患者之间,各种结构变异的总数量和分布存在相当大的差异例如,食管腺癌的特征是大量的缺失和大量的复杂的簇状重排(2b),而卵巢癌通常具有大量的串联重复和缺失,其不平衡易位的数量适中(2c)

2不同肿瘤类型的结构变异类的频率
 
3.在结构变异簇中模板的插入模式
作者接下来对包含2-10个结构变异簇进行了详细研究。这样的变异簇的插入片段会来自不同的染色体模板。作者根据插入的这段“染色体片段”是否会返回到原来的染色体(模板链)定义了三种基本类别:①不返回模板链的插入片段称为“chains”(可理解为转移插入);②返回模板连但是会留下空缺的称为“bridges”;③在原染色体留下一个复制片段称为“cycles”(可理解为先复制,继而复制片段插入到别的染色体)。
在数据集中,一共观察到了1467cycle,1275bridge285chain.

3:三种基本类型的变异模式并以TERT基因进行举例说明
 
4.单一染色体的本地结构变异嵌套簇和跨越染色体的结构变异嵌套簇
在包含2-10个结构变异的变异簇中经常存在着多个结构变异嵌套的情况。在本文中,作者将只在局部(一条染色体内)重排的嵌套簇称为“local n-jumps”n代表结构变异的个数),而跨越了染色体重排的嵌套集称为”local-distance clusters”. 癌症中存在各种各样的重排过程,这些重排过程会产生复杂的基因组构型。

图4:不同嵌套集和的变异模式
 
5.结构变异的特征
为了探究不同结构变异类型的具体特征,作者对于每一类变异类型根据变异大小、变异时间等指标又进行了详细的划分。并对每一小类进行了关于12个特征的比例分析吗,这12个特征是根据贝叶斯算法从全部的变异中提取出的。结果如图5

图5:人类癌症基因组中结构变异的特征
 
本文通过多组织多样本的测序技术对癌症基因组结构变异的模式进行了比之前所有的研究更为详尽的划分和研究,尤其是复杂的结构变异上分类的突破.。并对这些结构变异进行了特征提取和划分,为以后的研究打下了坚实的基础。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多