分享

科研 | Nature Communications: 宏基因组测序组装牛瘤胃微生物序列中913个微生物基因组

 微生态 2021-04-13


译:Mushroom,编辑:小菌菌、江舜尧。

原创微文,欢迎转发转载。

导读

瘤胃是牛的主要消化器官,可以将植物性饲料分解成能量和营养物质,这是通过瘤胃微生物系统所编码的酶实现的。研究人员以43头苏格兰牛瘤胃内容物为实验材料,经宏基因组测序获得超过800 Gb的数据,利用binningHi-C技术,从宏基因组数据中组装得到基因组草图,获得的913个基因组大部分是首次发现。基因组草图中预计有超过69,000种蛋白质参与碳水化合物的代谢,其中90%以上在公共数据库中没有相应的所信息。获得的913个基因组使宏基因组阅读分类数据库库容扩大了7倍,比其他可查阅的基因组数据库扩大了5倍。因此,本实验牛瘤胃微生物微生物基因组的数据大大提高了公共数据库中瘤胃微生物基因组的覆盖率,也是生物质降解酶和研究瘤胃微生物群的宝贵数据资源。

论文ID

原名:Assembly of 913 microbial genomes from metagenomic sequencing of thecow rumen

译名:宏基因组测序组装牛瘤胃微生物序列中913个微生物基因组

期刊:Nature Communications

IF:11.878

发表时间:2018.02

通讯作者:米克·沃森

作者单位:英国爱丁堡大学罗斯林研究所

实验设计


结果与讨论


1.基因预测及物种注释结果

42个从苏格兰牛的瘤胃微生物宏基因组测序提取了768Gb数据,分析得到850MAGs,同时利用Illumina平台对第43个样品进行HI-C分析,得到了63个完整的基因组。图1中的系统发育树主要由两大类群组成,分别代表梭状芽孢杆菌和类杆菌,后者的一个重要类群代表普氏菌科。913RUGs中,有7RUGs对应到种,至少有158RUGs对应到属,至少416RUGs到科,841RUGs到目,845RUGs到纲,895RUGs到门,906RUGs到界。28RUGsRUG代表古菌,并根据古菌在树中的位置推测它们都是产甲烷菌。在可解析到门水平的RUGs中,厚壁菌占优势(50%),其次是拟杆菌(36%),放线菌(3.5%),变形菌(3.1%),广古菌(3.1%)和螺旋体(1%),代表在瘤胃中发现的最主要的微生物门。整个MAGsHi-C基因组中门的分布非常相似,因此数据可靠。

1:来自牛瘤胃的913个基因组草图与所选公共基因组和来自Hess等人的15个入库基因组共同构建的同源发生树。彩色圆圈代表RUG。白色圆圈代表公共基因组,并有对应标注。

2. CAZys数据库注释结果

913RUGs含有1,979,391种预测蛋白质。使用dbCANcazy数据库中搜索这些数据,并使用建议的删除方法进行筛选,发现共有69,678个序列预测至少有一个碳水化合物活性功能。在69,678种蛋白质中,经过与数据库比对、基因新颖性(补充数据8)、结构域的比较以及低蛋白质的匹配度,只有6061(8.7%)在数据库中有高度相似的匹配(95%的同源性),表明我们预测的碳水化合物活性蛋白中有63,617种是新的,从RUGs分析得63,617个新蛋白质序列。结果显示,RUG中包含的GHsGTs的蛋白质序列最多。RUGs中的酶丰度热图显示(2)GHsGTs在普氏杆菌和其他类杆菌、纤维菌和梭菌中含量丰富,而在古生菌和变形杆菌中大量缺失。六种CAZy酶类与最高命中率氨基酸的同一性百分比箱线图显示(图3),除AAs类同源性为85%,其余五种蛋白在氨基酸水平上与目前公开的序列有65%72%的同源性。

蛋白结构域检测结果显示有15RUGs包含内聚蛋白结构域的蛋白(补充数据9),根据系统发育树(1和补充数据3)显示, 15RUGs中有9个有可能与黄链球菌紧密结合,然而这些RUGs的平均蛋白质相似度只有黄色瘤胃球菌70%-80%。表明这些基因组在蛋白质水平上与黄色瘤胃球菌存在显著差异。

2: 碳水化合物活性酶类在913RUG的分布热图。GH糖苷水解酶,GT糖基转移酶,PL多糖酶,CE糖酯酶,AA辅助活性酶,CB糖结合酶。白色=缺乏,深红色=丰富。

3.PUL分析

203RUGs中鉴定出1743PUL,其中187含有多个PUL,每个基因组的PUL数在37~1之间。RUG 144RUG 423分别含有3735PUL,在系统发育树中有密切的关系。在反刍动物肠道培养的最丰富的微生物之一--Prevotella rumicola周围有多个PUL簇,与多糖类聚在一起的RUGs具有较少的PUL,表明多糖的降解潜力较低。与多糖酵解相关的酶包括葡萄糖苷酶、岩藻糖苷酶、半乳糖苷酶、木聚糖酶、阿拉伯酶、纤维素酶、左旋糖苷酶和甘露糖苷酶;与反刍动物相关的酶有果胶裂解酶、果胶酯酶、葡萄糖苷酶、阿拉伯糖苷酶、半乳糖苷酶和甘露糖苷酶。这些结果表明,这两类化合物都利用了多种底物,具有较大的重叠,但又有其特殊性。

统计了特殊酶的发生和与之相关的PUL的数目,发现与PUL最密切的的两种酶是β-葡萄糖苷酶和α-葡萄糖苷酶,它们都参与纤维素和淀粉分解,其次是β-半乳糖苷酶,后者参与乳糖分解成单糖。此外,补充图1还展示了PLU的七种结构。本研究预测的526PUl都有PUL41这种简单的结构,PUL416106011182240(补充Figure1B-E)都表现出与木聚糖降解有关的结构,但有表现出轻微的差异,因此预测它们为优化的木聚糖降解结构。PUL2240包含一个果胶酶和一个果胶酯酶蛋白被鉴定为参与了果胶降解。

3: RUG蛋白的6类碳水化合物活性酶在5个公共数据库中的最大百分含量分布。GH糖苷水解酶,GT糖基转移酶,PL多糖裂解酶,CE碳水化合物酯酶,AA辅助活性酶,CB碳水化合物结合酶。

4.31MAG被归为丹毒丝菌目

   在分析过程中,研究者发现有31MAG与丹毒思菌目的成员SolobacteriumCoproacillusKandleriagenera属都有大量的蛋白质匹配,而后使用PhyloPhlAn(补充数据14)31MAG放入系统发育树(补充数据15,补充数据16)。基于树和低平均蛋白质鉴定的基础上,研究者认为其中16MAG属于Solobacterium Moorei10MAG属于Coproacillus5MAG属于Kandleriagenera,且均为新型的未被培养的菌株基因型。

5.不同数据分析方法的优化

在三个数据集中,RefSeq基础数据库只能对不到10%reads分类,而增加GEBA基因组只能稍加改善。添加 Hungate1000基因组增加了两倍左右的分类;然而,添加RUGs大大提高了分类率,数据显示增加了大约7倍,在另外两个公布的瘤胃宏基因组数据中增加了大约5倍;资料显示添加Hi-C基因组就只产生轻微的影响,但在我们分析数据中发生了更明显的影响。本研究和410 Hungate 1000试验中添加瘤胃特异性细菌和古菌后,总体分类率提高了5-7倍,在某些情况下,与我们自己的数据相比,分类率接近80%(4)。由此可见,添加瘤胃特有的RUGsHungate 1000 基因组效果最显著。

4:三个数据集对不同Kraken数据库的分类率。来自RefSeqBFAP细菌、古菌、真菌和原生动物基因组,BGEBBFAP+1003 GEBA基因组,BHICBFAP +63hRUG基因组,BHUNBFAP+来自Hungate1000 project410个基因组,BRUGBFAP+ 850RUG MAGsBRHIBFAP+913基因组,BRHH BFAP+913 RUGS +来自Hungate 1000 project410个基因组。添加rumen-specificRUGsHungate 1000 基因组的效果最显著。

6Hi-C聚类分析的优势

Hi-C聚类方法分析优于单样本宏基因组binning。如前所述,Hi-C分析产生了63个基因组,完整性≥80%,污染率≤10%Hi-CSPAdes/MetaBAT集群之间的中间覆盖统计数据没有总体差异;然而,在范围上有非常明显的差异,Hi-C集群显示的覆盖值范围要大得多。在多拷贝数质粒查找方面,Hi-C也有显著优势(补充数据18)

结论

瘤胃微生物宏基因组测序提取了768Gb数据,组装得到牛瘤胃微生物基因组草图,所获得的913个基因组大部分是首次发现。这些基因组的发现使宏基因组阅读分类数据库库容扩大了7倍,比其他可查阅的基因组数据库扩大了5倍。添加瘤胃特有的RUGsHungate 1000 基因组效果最显著。Hi-C聚类方法分析优于单样本宏基因组binning,适用于特定的数量少的样本或环境。

结论

瘤胃微生物群可以从饲喂给养殖反刍动物的各种饲料中提取能量和营养,了解这个重要微生物群的结构和功能是必要的。然而,公共数据库中瘤胃微生物基因组数量少,瘤胃微生物组仍然没有得到充分的研究。因此,找到合适的数据处理方法得到高质量的瘤胃微生物基因,扩充数据库从而改变其分类方式就显得至关重要。宏基因组binning可以在不需要培养的情况下组装接近完整的微生物基因组,但它的完整性仍然不能达到100%Hi-C聚类方法分析优于单样本宏基因组binning,但它仅适用于特定的数量少的样本或环境。本研究采用上述两种方法处理得到的913MAG虽然使分类率由10%提高到80%,但我们需要让分类率就要达到100%,以此实现reads与基因组和功能的完全对应。此外,样本采集与处理也十分关键,因为它是一切研究的基础。综上所述,我们还需要优化研究方法。



你可能还喜欢

  1. 2019年度回顾 | 微生态环境微生物类微文大合辑

  2. 2019年度回顾 | 微生态人体/动物微生物类微文大合辑

  3. 2019年度回顾 | 技术贴合辑大放送



    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多