分享

Science | 泛基因组分析优化结构变异识别

 昵称32772025 2021-12-28

图片

Giraffe,由加州大学(UC)Santa Cruz分校基因组学研究所的科学家开发的一种新的制图算法,可以有效地将单个测序读数映射到代表数千个人类基因组的泛基因组参考,其速度与当前将测序数据映射到单个参考基因组的标准方法相当。

流行且廉价的短读DNA测序会产生个体的基因组序列片段,这些片段必须映射到参考基因组序列,以确定其染色体位置,并识别其中与参考不同并可能影响健康的变化。完全依赖单个线性参考序列来识别基因多样的人类亚群中的遗传变异不可避免地会引入偏差——即错误地绘制与参考基因组不同的序列的倾向。

Giraffe是一种泛基因组短读映射器,可以有效地将测序数据映射到序列图中的单倍型集合,它的使用提供了一种实用的解决方案,可以消除偏见并进行更好的基因组分析。一个单一的参考基因组选择代表一个遗传变异的一个版本,而不代表其他版本。通过使更具广泛代表性的泛基因组参考文献实用化,Giraffe可以使基因组学更具包容性。使用数学图来表示不同序列之间的关系,可以将不同的基因组组合成具有代表性的泛基因组参考。

在近期发表在《Science》杂志上的一篇论文中(“Pangenomics enables genotyping of known structural variants in 5202 diverse genomes”),作者评估了Giraffe的效率,并表明它能够更全面地描述遗传变异,在生物医学研究和精确临床实践中,需求日益增加。

图片

加州大学Santa Cruz分校生物分子工程副教授、基因组学研究所副所长、论文通讯作者Benedict Paten博士说,“我们多年来一直在努力实现这一目标,现在我们第一次找到了比单一参考基因组更快、更好的实用方法。基因组学对生物医学的未来非常重要,它能平等地帮助每一个人,因此我们需要能够解释人类群体多样性且不存在偏见的工具。”

图片

尽管人类基因组序列在所有人类中几乎99%相同,但在代码的单个字母(单核苷酸变体,SNV)、短片段的添加(插入)或遗漏(删除)方面存在分散的差异,统称为“indels”,以及更大、更复杂的结构变化,包括重新排列五十个或更多的代码字母。人类基因组中约0.001%的这些不同类型的变化不仅解释了我们独特的外表,还可能解释健康和疾病之间的差异。

图片

使用单一参考基因组很难找到结构变异,但它们在某些疾病中起着重要作用。普通人拥有数百万个SNV和indels以及数万个较大的结构变异,但结构变异影响基因组的比例比SNV和indels加在一起还要大。

图片

“基因组学的主力是SNV和短indels,因为结构变异已经被隐藏起来。”研究人员说,“泛基因组学正在使结构变异变得可见,这样我们就可以像研究SNV和短indels一样对其进行研究。有很多结构变异,它们会产生很大的影响,因此这对疾病遗传研究的未来至关重要。”

图片

在这项新的研究中,在这项新的研究中,研究人员利用公开的基因组数据构建了两张人类基因组参考图,以评估新工具Giraffe。基因组学研究所的研究科学家、该研究的共同第一作者Jouni Sirén博士开创了Giraffe的许多关键算法创新。评估表明,Giraffe可以准确地将新的序列数据映射到一个泛基因组参考中的数千个基因组,就像现有工具映射到一个参考基因组一样快,同时减少了映射偏差。

图片

“不仅分析效果更好,而且速度也和目前使用线性参考基因组的方法一样快。”基因组学研究所的博士后研究员、该论文的共同第一作者Jean Monlong博士说。

图片

研究人员利用Giraffe绘制了来自5202人的不同群体的序列读数,并确定了他们最近发现的167000个结构变异的基因型。他们估计了这些结构变异的不同版本在整个人群和亚群中的频率。作者表明,某些变异的频率在不同亚群之间存在很大差异,如果只对一个祖先的个体进行分析,可能会被误解。

图片

研究人员发现,与使用针对单个参考基因组的比对相比,Google Health的深度学习变异调用程序(DeepVariant)可以使用Giraffe对泛基因组的比对更准确地识别SNV和indels。

图片

“最近通过长读测序发现了许多结构变异。”研究人员说,“通过泛基因组,我们可以在短读测序的大型数据集中寻找这些结构变异。这是令人兴奋的,因为这将使我们能够在许多人中研究这些新的结构变异,并就其功能影响、与疾病的关联或在进化中的作用提出问题。”

与加州大学Santa Cruz分校基因组学研究所的其他人一起,Paten目前正在研究由国家人类基因组研究所资助的全面人类泛基因组参考。研究人员预计明年将向科学界提供这一资源。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多