NBT：宏基因组''读云''建库雅典娜算法组装获得微生物高质量基因组

生物_医药_科研 2018-12-07

展开全文

读云(read clouds)组装高质量末培养的微生物基因序列

High-quality genome sequences of uncultured microbes by assembly of read clouds

Nature Biotechnology, [35.724]

链接: http://dx./10.1038/nbt.4266

第一作者：Alex Bishara

通讯作者：Serafim Batzoglou, Ami S Bhatt

主要单位：加州，斯坦福大学，计算机系，医学与遗传学系

其它作者：Eli L Moss, Mikhail Kolmogorov, Alma E Parada, Ziming Weng, Arend Sidow, Anne E Dekas

PDF：https://www./articles/nbt.4266.pdf

热心肠日报导读

Nature子刊：新技术“读云”可获得高质量宏基因组序列

新技术“读云”可获得不可培养微生物的高质量基因组序列

① 读云（read clouds）技术建库分为两步，先将宏基因组封装在大量含有一条或多条长DNA序列的微液滴中，再从这些子集构建带条码的短序列文库测序；

② 配套的“雅典娜(Athena)”组装算法则先结合条码对子集进行组装，然后在子集之上组装得到宏基因组序列；

③ 通过对人粪便样本和海洋沉积物样本测序，评估了读云技术相较于长读长三代测序和短读长二代测序策略的优势；

④ 发现读云在低丰度物种发现、宏基因组分箱、基因组完整性等各项指标上均明显占优。

主编评语：“读云”的核心是采用了微液滴封装技术降低了宏基因组复杂性，之后再结合现有方法测序和新算法组装。这相当于对宏基因组展开了一场“降维攻击”。

关键字：宏基因组，新一代测序技术，宏基因组算法，微液滴封装

摘要

尽量宏基因组测序微生物组样本可以部分重建群体菌株水平结果，但仅获得分离难培养微生物的高质量基因组草图。

这里，我们呈现了一个“读云(read clouds”新方法，对微生物样本短序列标签化结合长序列来源的信息。

我们开发Athena组装软件，可以使用读云方式的标签化序列从头组装，以改进宏基因组组装。

使用此方法应用于两个健康人粪便样本，与现有的短读长和合成长读长的宏基因组测序技术比较，即使细菌丰度小于20X下，读云方法宏基因组测序和Athena组装结果有最好的基因组草图(N50> 200kb，小于10个重叠群)。

我们也测序复杂的海洋沉积物，产生24个中等质量的基因组草图(完整度 > 70%，污染率 < 10%)，其中9个达到完整的水平(完整度=""> 90%，污染率 <>

本方法可基于单个样本的宏基因组测序，无须微生物分离培养，即可获得高质量的微生物基因组草图。

图1. 读云鸟枪测序和组装方法技术路线

(a) 微生物组样本DNA提取，片段选择富集长片段。将长片段稀释，松散的分隔在上百万个小液滴中。变性扩增这些长片段，获得有标签的短序列文库，每个空间的标签是唯一的。然后文库混合并使用Illumina测序。

(b) 雅典娜组装工具使用读云产生更全面的草稿，如基因组重复可以正确放置。图中显示为正确识别重复序列的例子。
(i) 读云采用标准短读长技术获得种子重又不群，再利用序列比对，双端序列扩展重叠群为支架(scaffold)，现在包括无法确定的分枝。
(ii) 在每个边，雅典娜基于相同标准的小范围内数据组装解决分枝问题。例如红、蓝进行子集组装支持了准确的分枝选择。
(iii) 亚组装的重叠群与起始重叠群进一步基于DB图组装。这样宏基因组草图信息更准确，可组装出正确的重复序列。