分享

Hifiasm-meta | 你没看错!基于宏基因组的完成图!!

 凌恩生物 2022-11-29 发布于陕西
哈佛大学医学院Dana-Farber癌症研究所李恒课题组重磅推三代HiFi宏基因组组装软件——hifiasm-meta。研究论文“Metagenome assembly of high-fidelity long reads with hifiasm-meta”预印本在线发布。
图片

宏基因组样本的do novo组装是研究微生物群落的常用方法。与单个物种的组装相比,宏基因组组装存在PacBio HiFi 数据中读取长度分布的较大差异,以及某些单倍型的高倍性和低覆盖率等难点挑战本文针对这些难点问题,对hifiasm-meta进行了几项重大更改以应对这些挑战。

hifiasm-meta是基于hifiasm的宏基因组组装工具:
  • 改善了一些宏基因组数据中比单样本测序更突出的问题(例如contained reads);
  • 优先于获得连贯的contigs,过程不需要手工干预,和hifiasm相同是一个binary和一行命令;对于回收variantsSV,可能对read-contigalignment+variant calling比处理assembly graph更实用)
  • (可选)丢弃冗余reads的模块,不过实际数据通常测序深度没有饱和,尝试丢弃reads的话通常有害且对运行速度没有太大帮助,所以目前只用在深度过高的mock community中。

图片

hifiasm-meta软件组装原理

作者首先在两个模拟菌群ATCCzymo评估了hifiasm-meta软件组装效果(表 1)。ATCC20个不同的物种组成通过组装对14丰富的物种重建为完成图contigs,比metaFlyeHicanu软件效果更好,未组装到的菌发现组装gaps都是由于覆盖率不足造成的。

zymo数据集包含17个物种的21个菌株,包括5大肠杆菌,每个菌株丰度为8%hifiasm-meta软件都获得了很好的组装效果(表1)。

图片

作者接着测试了三个样本HiFi 宏基因组hifiasm-meta组装使用CheckM检测完整性和污染。从sheepA肠道样本中,hifiasm-meta 重建了328个长度>1Mbcontigs2a),总长度为656Mb。根据CheckM检测173个接近完成(图2b其中125个是环状contigs(图2b),相比于HiCanu64个)和metaFlye31软件有显著改善。这表明 hifiasm-meta能够完全重建宏样本中更多的物种或菌株。

对比MetaBAT2软件,hifiasm-meta可以找到更多质量的MAGs(图2c作者 hifiasm-meta应用于数据量更大的sheepB 数据集并获得了438 个接近完整的MAGs245contigs
图片
2 经验数据集的宏基因组hifiasm-meta组装结果
对来源于人的杂食和素食者肠道样本进行测试,组装的contigs能够很好的区分杂食样本和素食样本,但是在进化树上MAGs没有明显的聚集倾向:19个属中有至少3MAGs,其中16个属既有来自杂食者,也有来自素食者MAGs3这表明 hifiasm-meta更擅长解决细微的组分差异

图片

3 人肠道样本宏基因组hifiasm-meta组装结果

最后,作者比较了软件的性能hifiasm-meta组装sheepA和鸡数据集需要48CPU大约18个小时,而人类肠道样本花费了大约3个小时metaFlye速度相当,并且始终比HiCanu软件几倍。

综上,hifiasm-meta软件将进一步推动宏基因组组装。hifiasm-meta能够在无需人工干预的情况下,从一个深度测序的样本中组装出更多的环状MAGs。这种高质量的宏基因组组装可能会从根本上改变宏基因组分析,并揭示微生物群落的生物学和生物医学意义。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多