分享

Microbiome | 海洋三所邵宗泽组揭示深海热液区病毒多样性及其与宿主相互作用

 宏基因组 2023-01-13 发布于北京

深海热液区病毒多样性及其与宿主相互作用

Virus diversity and interactions with hosts in deep-sea hydrothermal vents

Research,2022-12-24,Microbiome, [IF 16.837]

DOI:https:///10.1186/s40168-022-01441-6

第一作者:Ruolin Cheng(程若琳)

通讯作者:Zongze Shao(邵宗泽)

主要单位:自然资源部第三海洋研究所(Key Laboratory of Marine Genetic Resources, Third Institute of Oceanography, Ministry of Natural Resources, Xiamen, China.)

- 摘要 -

背景:深海中蕴藏着大量的病毒,但热液生态系统中病毒的多样性及其与宿主的相互作用关系在很大程度上是未知的。本文分析了全球热液喷口不同生境(热液羽流、背景海水、弥散流和沉积物)中病毒的组成、分布、宿主偏好和代谢潜能。

结果:通过生物信息学方法,从来自全球8个热液喷口的34个宏基因组数据集中鉴定了4,662个病毒分类单元(vOTU)。这些病毒具有高度的遗传多样性,形成了许多特有的进化分支。除了大量未知病毒以外,有尾噬菌体在全球热液喷口中占主导地位,而单链DNA病毒——包括微病毒科和小型真核病毒——也是病毒群落的重要组成部分。基因共享网络分析发现热液病毒在属水平上聚类为大量新的病毒簇,其分布呈现出高度的地域特异性。利用多种方法预测了大约11%的vOTU的宿主,其中很多是热液区的关键微生物类群,如GammaproteobacteriaCampylobacterota。有趣的是,不同热液区来源的病毒存在一些共同的代谢特征,其编码的辅助代谢基因广泛参与碳水化合物、氨基酸、辅因子和维生素等的代谢。与其他生境相比,热液羽流中的病毒辅助代谢基因具有更高的多样性和丰度,特别是与甲烷、氮和硫代谢相关的辅助基因,它们可以帮助宿主在黑暗的深海中获得能量。此外,硫中继系统基因的普遍存在表明,热液噬菌体可能在稳定tRNA结构方面发挥重要作用,从而促进宿主对环境梯度的适应。

结论:深海热液病毒具有尚未揭示的多样性和新颖性。它们影响热液生态系统中原核与真核生物群落的组成,调控与环境适应性相关的宿主代谢过程。为了全面认识病毒在这一独特生态系统中的作用,未来还需开展进一步的探索和研究。

关键词:深海热液区;病毒;宏基因组;病毒生态学

- 引言 -

深海热液喷口是地球上最极端的环境之一。在这个黑暗的世界里,还原性的热液流体和含氧的低温海水混合产生了急剧变化的温度和化学梯度,为热液生态系统提供了能量来源。与大多数由光合作用驱动的生态系统不同,深海热液喷口的生产力主要由化能自养微生物贡献,它们利用硫、氢、甲烷、氨或铁氧化产生的能量来固定碳。热液流体是深海初级生产力的热点,是我们认识深部生物圈的一个窗口。在羽流中热液流体被海水高度稀释,这些羽状流可以上升数百米,扩散到数百公里以外,从而在更广的范围内影响深海微生物群落和生物地球化学。在过去的十几年里,人们对深海热液喷口微生物的来源、多样性和功能进行了大量的探索。这些研究表明,热液羽流中的原核生物群落与弥散流或热液沉积物中的原核生物群落存在显著的差异。病毒作为热液喷口微生物群落的重要组成部分,其研究相对较少。

病毒是地球上数量最多、分布最广、基因最多样化的生物学实体。它们在海洋生态系统中发挥着关键作用,不仅可以裂解宿主,还可以通过水平基因转移和表达辅助代谢基因(auxiliary metabolic genes,AMGs)来影响宿主。在深海热液区,由于采样、样品处理手段等限制,我们对病毒多样性及其参与的生物地球化学过程了解还很不足,它们与宿主及环境之间的相互作用仍有待阐明。

在这项研究中,我们利用蛟龙号在西北印度洋Carlsberg洋中脊(CR)的卧蚕和天休热液区采集了羽流和背景海水样品开展宏基因组测序研究,同时整合了来自全球三大洋的其他七个热液区的宏基因组数据进行分析,全面探讨了深海热液病毒的群落结构、生态分布、宿主偏好和辅助代谢潜能。这些结果将加深我们对极端海洋生态系统中病毒的多样性及其生态功能的理解。

- 结果与讨论 -

深海热液区微生物群落概况

Overview of deep‑sea hydrothermal vent microbial communities

对来自全球分布的八个热液区(图1)的宏基因组数据进行分析,涵盖了弥散流、羽流、海水和沉积物等不同生境。

图1 用于研究的34个热液宏基因组的采样点。

从原始数据中提取16S核糖体RNA序列(16S miTags)用于物种组成分析。从门水平上看(Proteobacteria为纲水平),Gammaproteobacteria在几乎所有的热液区样品中都是最优势的类群,其次是DeltaproteobacteriaAlphaproteobacteriaBacteroidetes,Campylobacterota(即之前的Epsilonproteobacteria)主要存在于弥散流及羽流中。丰度最高的古菌是Thaumarchaeota,主要分布在热液羽流及海水中。不同生境来源的样品呈现出不同的群落结构模式,而同一热液区的样品其物种组成更为相似。为了评估多重置换扩增(multiple displacement amplifcation,MDA)对物种组成分析的影响,我们比较了宏基因组与16S扩增子测序结果,发现MDA并未使各类群的相对丰度产生显著偏倚。

通过宏基因组拼接和分箱共获得581个高质量或中等质量的(大于50%完整度,小于10%污染率)微生物宏基因组组装基因组(Metagenome-assembled genomes,MAGs)。这些MAG按照95%ANI聚类,代表了物种水平的分类单元,包括分布在54个门的515个细菌和66个古菌。多数细菌MAG属于优势类群,例如Gammaproteobacteria(n = 138),Bacteroidetes (n = 54),Deltaproteobacteria (n = 53)和Campylobacterota (n = 41),而古菌MAG主要来自CandidatusThermoplasmatota (n = 25)和 Thaumarchaeota (n = 18)。这些MAG再加上440个高质量的来源于CR热液区羽流样品的单细胞基因组,以及分离自热液区的单菌基因组,为研究病毒和宿主的相互作用关系奠定了良好的基础。

液区病毒的多样性和系统进化分析

Diversity and phylogeny of hydrothermal vent viruses

利用VirSorter和VIBRANT 识别宏基因组中的病毒contig,再对这些序列进行人工筛选。将5 kb以上的contig以及2-5 kb的环状contig合并,共得到8847条假定的病毒序列。我们保留了小分子环状contig,因为它们可能代表了小的单链DNA (ssDNA)病毒基因组。这些序列以95%ANI,80%覆盖度聚类,得到4662个种水平的病毒操作分类单元(vOTU)。这些vOTU长度从2000到226341 bp不等,最大的contig长度超过200 kb,可能属于巨大噬菌体。CheckV评估表明,近一半的vOTU代表中等及以上质量的病毒基因组,包括1731个完整的病毒基因组。

在这些vOTU中很大一部分属于有尾噬菌体目Caudovirales(45%),特别是肌尾噬菌体科Myoviridae的病毒。对于这类双链DNA噬菌体来说,末端酶大亚基基因(terL)在所有种类中都是保守的,不同类型的terL反映了不同的病毒包装策略。因此,我们利用terL基因构建了系统发育树,以评估有尾噬菌体的多样性和遗传距离。在所有病毒vOTU中,共有638个ORF编码了完整的terL基因。系统发育分析显示,热液区的有尾噬菌体序列除了分布在已知的14个不同支系中,还形成了许多未知的、独特的分支(图2)。

图2 基于terL序列的Caudovirales系统发育分析。

蓝色圆点标记序列为参考序列,其他为本研究中获得的热液区噬菌体terL序列。

ssDNA病毒约占vOTU总数的36%,主要属于微小噬菌体科Microviridae。这个类群是最小的DNA病毒之一,其环状基因组大小约4.2 - 6.5 kb。我们从宏基因组数据中组装了872个完整或接近完整的Microviridae,并以主要衣壳蛋白VP1为标记基因分析了它们的系统进化关系(图3A)。大部分VP1序列与NCBI数据库中的已知序列相似性小于70%,反映了Microviridae高度的多样性。系统发育分析表明,大部分热液区Microviridae属于Gokushovirinae亚科,其次是group D,还有22个基因组不属于任何已知的类群。有趣的是,新的分支似乎由一些具有小基因组(约等于或小于4 kb)的病毒组成。其中一个噬菌体基因组大小仅为3559 bp,编码三个假定的ORF,包括衣壳蛋白、复制起始蛋白和一个未知功能蛋白。这是我们数据集中基因组最小的噬菌体,也是迄今为止报道的ORF最少的ssDNA噬菌体之一。

CRESS-DNA(circular rep. encoding single-stranded DNA)病毒约占vOTU总数的15%。这是一类具有环状基因组的小型真核病毒,通常只编码2个蛋白,其中复制起始蛋白(Rep)是唯一的保守基因。基于Rep蛋白序列的系统发育分析表明,694条热液区来源的CRESS-DNA病毒序列分布在13个已知的类群中,而其余的145条序列则形成了几个新的分支(图3B)。

图3 热液区单链DNA病毒系统发育分析。

蓝色圆点标记序列为参考序列,其他为本研究中获得的热液病毒序列。(A)基于VP1序列的Microviridae最大似然树;(B)基于Rep蛋白序列的CRESS-DNA病毒最大似然树。

在热液宏基因组数据中还发现了另一类真核病毒——核质大DNA病毒(nucleocytoplasmic large DNA viruses,NCLDVs)。共有27个vOTU被注释为NCLDV,但其序列长度在6112 bp到24611 bp之间,仅代表了很小的基因组片段。此外,还有约19%的vOTU不与任何已知病毒相似,目前还无法对它们进行分类。

值得注意的是,本研究中涉及的羽流、弥散流和海水样品经过了0.22 μm滤膜过滤,这些样品中的病毒主要包括整合的/染色体外的前噬菌体序列、在细胞内复制的病毒、保留在滤膜上的大病毒粒子以及吸附在滤膜上的小病毒粒子等,但大部分尺寸较小的游离病毒粒子都被过滤掉了。为了评估它们能在多大程度上代表病毒多样性,我们对来自西南印度洋中脊热液区的沉积物样品的细胞组分和病毒样颗粒(virus-like particle,VLP)富集部分的宏基因组进行了比较。结果表明,从两组数据中识别的病毒序列数量大致相当。VLP组分中发现的CRESS-DNA病毒是细胞组分中的两倍,但细胞组分中的Microviridae数量却比VLP组分中更多。一种可能的解释是,在细胞内复制的Microviridae随着宿主菌被保留在了滤膜上,而大部分CRESS-DNA病毒的真核宿主在取样时并未包括在内。其他类群病毒的数量在两个组分中没有观察到显著的差异。鉴于溶原性噬菌体在热液区广泛存在,我们认为细胞组分的宏基因组可以在很大程度上反映热液病毒的多样性。当然,为了更全面地认识深海热液区的病毒群落组成,有必要采用更多类型的样品,包括富集的VLP样品、RNA样品等。

不同热液区病毒群落特征

Viral communities across different zones of hydrothermal vents

与原核生物群落相似,不同热液区、不同生境来源的样品显示出不同的vOTU分布模式。羽流与背景海水的病毒群落结构较为相似,表明羽流生态系统受周围海水影响较大。在科水平上对病毒丰度进行统计,发现热液喷口病毒群落中大部分是未分类的病毒(高达病毒总reads的69%,图4)。Myoviridae(在羽流、弥散流和沉积物样本中分别占约9.2%、7.8%和1.5%)是多数样本中dsDNA病毒的最主要类群,其次是Siphoviridae (9.1%、4.6%和2.4%)和Podoviridae(7.6%、4.8%和0.7%)。

ssDNA病毒也是热液病毒群落的重要组成部分。在所有的沉积物宏基因组中,Microviridae的相对丰度比其他任何dsDNA病毒科更高。CRESS-DNA病毒存在于大多数羽流样品和三个沉积物样品中,约占病毒总reads的2.2%(图4)。这些数据集中ssDNA病毒的富集可能是由于MDA扩增引起的,这一过程中使用的phi29 DNA聚合酶偏好性地扩增环状ssDNA分子。然而,一项对病毒DNA进行的非扩增性量化分析也揭示了ssDNA病毒在深海沉积物病毒组中的主导地位。因此,即使考虑到定量偏差,可以预见在热液生态环境中确实存在丰富的ssDNA病毒。

图4 不同样品中各个病毒类群的相对丰度。

在热液羽流样品中,真核NCLDV平均占病毒总reads的0.4%,丰度最高的是MimiviridaePhycodnaviridae。相比之下,弥散流和沉积物样品中的NCLDV较少。这些宏基因组数据集中的NCLDV序列可能来自海洋单细胞真核生物或游离的巨型病毒,但它们在热液生态系统中的角色在很大程度上是未知的。

热液区病毒新颖性高且分布具有局限性

Hydrothermal vent viruses are novel and endemic

为了进一步认识这些病毒的多样性和分布特征,我们基于蛋白质共享网络对鉴定的4662个vOTU和已知的病毒基因组(NCBI RefSeq)、全球大洋海水病毒组(GOV 2.0)以及冷泉病毒vOTU进行了聚类分析。vConTACT2将这些vOTU划分为16618个属水平的病毒簇(viral cluster,VC),反映了海洋病毒巨大的多样性(图5A)。不同生态环境的病毒组成差异很大,仅有30个VC是三种海洋生态系统所共有的。4662个热液区vOTU聚类为1138个VC,其中只有32个VC包含RefSeq中已知病毒的基因组。超过一半的VC(51%)完全由热液病毒构成,可能代表了全新的分类单元(图5A),它们之中大部分属于ssDNA病毒。

热液病毒的生物地理分布呈现高度的区域性,其中大部分VC(71.9%)只存在于特定的热液喷口(图5B)。热液羽流中VC的丰富度高于沉积物及弥散流,表明热液羽流病毒具有更高的多样性。尽管各热液区的羽流病毒群落在科水平上存在一定的相似性,但从属水平上看,仅有一小部分VC的分布跨越了不同的热液区。不同生境之间,特别是沉积物和弥散流之间共有的VC数量非常少,反映了病毒有限的流动性。

图5 基因共享网络分析揭示的Viral Cluster分布。

(A)不同海洋生态系统共有的Viral Cluster;(B)不同热液区样品间共有的Viral Cluster。

热液喷口病毒-宿主关联分析

Virus-host connections in hydrothermal vents

通过CRISPR spacer序列比对,tRNA比对,序列同源性分析以及寡核苷酸频率分析等多种方法,对深海热液区的噬菌体进行宿主预测。最终,约有11%(494 个vOTU)的病毒能够对应到宿主,其中230 个vOTU与热液区来源的MAG和SAG相关联。这些vOTU中的大多数(~89%)被预测感染某个特定的宿主,只有31个vOTU的潜在宿主跨越了多个不同的门。这与人们的普遍认识和以往的研究结果一致,即大多数病毒具有较窄的宿主范围。

热液噬菌体的预测宿主包括来自39个门的细菌和古菌(图6)。79个vOTU可能感染古菌,其中最经常被预测为宿主的是Candidatus Thermoplasmatota(与33个vOTU相关)。这个候选门包含Marine Group II和Marine Group III的古菌,MG II在海洋表层水域占主导地位,可能在海洋碳循环中发挥重要作用,而MG III的成员则生活在中层海水和深海环境中,丰度相对较低。

最常见的细菌宿主是Gammaproteobacteria(144个vOTU),其次是Actinobacteria(39个vOTU)、Alphaproterobacteria(37个vOTU)、Bacteroidetes (34个vOTU)、Firmicutes(27个vOTU)以及Campylobacterota(26个vOTU),这些都是热液生态系统中丰度最高、最活跃的微生物类群。例如,Gammaproteobacteria是一个具有代谢多样性的细菌类群,在热液喷口周围的各种生境广泛存在。在Gammaproteobacteria中最常被预测的宿主是Acinetobacter(15个vOTU),Alteromonas(15个vOTU),Pseudomonas(14个vOTU)和Alcanivorax(8个vOTU)属的细菌,它们在本研究的大多数样本中都是优势属。相应地,与优势微生物类群相关的病毒具有较高的丰度,可能在调控热液微生物群落中发挥重要作用。

弯曲杆菌Campylobacterota也是热液环境中丰度较高且普遍存在的类群,然而迄今为止,在深海弯曲杆菌中仅报道了少数潜在的前噬菌体区域,其中仅有一个被诱导分离。本研究中共有26个vOTU被预测可能感染弯曲杆菌门的成员,特别是Sulfurimonas属(14个vOTU)。这些病毒主要来自Myoviridae、Podoviridae、Siphoviridae、Herelleviridae和Microviridae还有8个vOTU在科水平上未被分类,表明热液弯曲杆菌病毒的多样性仍有待阐明。对这些病毒基因组的进一步分析将为弯曲杆菌与噬菌体的相互作用机制提供新的见解。

已知的CRESS-DNA病毒可以感染各种真核生物,包括植物、真菌和动物。而我们的研究结果揭示了CRESS-DNA病毒与细菌/古菌宿主之间的一些潜在联系,表明这一群体可能具有更广的宿主范围。目前,能够确定宿主的CRESS-DNA病毒来自五个病毒科,而大多数已知的CRESS-DNA病毒是在宏基因组研究中发现的。考虑到CRESS-DNA病毒的多样性以及它们和细菌质粒间的密切联系,不能排除它们侵染原核生物的可能性。

图6 预测的深海热液区病毒-宿主关系。

热液病毒AMG参与多种代谢途径

AMGs of vent viruses are involved in various metabolic pathways

病毒可通过表达AMG而影响宿主代谢。为了进一步了解病毒在深海热液系统中的生态作用,我们对热液病毒基因组中的AMG进行了预测,并统计它们的相对丰度。根据基因注释结果,共有608个基因被认为是潜在的AMG,其中很大一部分可能来源于Proteobacteria,尤其是AlphaproteobacteriaBetaproteobacteria,而约有21%的AMG来自未知物种(图7B)。AMGs的来源从另一方面反映了病毒与宿主的关联,因为噬菌体的AMG通常是从宿主基因组中获取的。KEGG注释表明,热液病毒编码的AMG参与了多种代谢途径,包括碳水化合物代谢、氨基酸代谢、辅因子和维生素代谢相关的通路(图7A)。这一结果与之前研究揭示的AMG分布模式一致,表明热液病毒具有某些共同的代谢特征。

AMG丰度分析表明,热液羽流中的病毒编码了大量功能多样的AMG(图7C)。与弥散流或沉积物相比,大多数AMG在羽流样品中的相对丰度较高。一些与能量代谢相关的AMG仅在羽流样品中发现,包括甲烷、氮和硫代谢相关的AMG。多种AMG参与硫代谢途径,如编码磷酸腺苷磷酸硫酸盐还原酶(cysH)、腺苷酸硫酸盐激酶(cysC)和异化硫酸盐还原酶(dsrA)的基因。cysHcysC基因参与同化硫酸盐还原,而dsrA基因与异化硫还原/氧化相关。硫氧化和硫酸盐还原都是热液喷口生态系统中硫循环的重要组成部分,相关AMGs的存在表明噬菌体广泛参与了这些代谢途径。

图7 病毒AMG的功能及其分布模式。

(A)AMG参与的代谢通路;(B)预测的AMG来源物种;(C)不同生境中AMG的相对丰度。

热液宏基因组中丰度最高的AMG是 DNA胞嘧啶甲基转移酶(DNMT1, dcm)。然而,之前的一项研究发现,病毒编码的dcm基因和其他13个AMG广泛存在于不同环境来源的宏基因组中,它们更有可能在病毒生命周期中发挥核心功能。除了这些普遍存在的AMG以外,与硫中继系统相关的硫脲合成酶亚基E (tusE, dsrC的同源基因)在热液宏基因组中也具有较高的丰度。该基因编码的硫转移蛋白参与tRNA硫醇化修饰,而这是蛋白质合成机制所必需的。tusE基因的表达可增加tRNA结构的稳定性,对于细菌在高温下的存活至关重要。此外,有研究表明硫中继系统与微生物对酸度、重金属和有机溶剂的耐受性相关。因此,这类AMG的表达能够增强宿主对各种胁迫条件的适应性,从而在温度和化学梯度波动较大的热液环境中获得生长优势。

值得注意的是,一些预测的AMG并不一定真正具有辅助代谢功能。首先,很难完全避免病毒预测中的假阳性,因为这些宏基因组数据来自细胞组分。虽然候选AMG的两侧至少存在一个病毒marker基因,但它们也可能来自宿主部分的基因组,又或者实际上参与了病毒的生命周期而不是宿主代谢。因此,需要更进一步的研究,例如基因组背景评估和蛋白表达分析等,来确定它们的真正功能。- 结果与-

- 结论 -

在这项研究中,我们基于宏基因组数据研究了全球深海热液喷口的病毒群落特征。深海热液区蕴藏着大量未知的病毒,这些病毒侵染不同类群的宿主并调控它们的代谢,影响着环境中的原核与真核生物群落。这些相互作用塑造了深海热液区微生物组的结构和功能,并且随着热液流体的循环和羽流的扩散而对更广阔的海洋产生深远的影响。本研究强调了全球热液病毒的多样性和新颖性,揭示了它们在深海极端环境中的潜在生态功能。随着深海采样技术以及培养和未培养研究方法的改进,我们将会对热液生态系统中病毒与宿主的相互作用有更全面的了解。

参考文献

Cheng, R., Li, X., Jiang, L., Gong, L., Geslin, C., and Shao, Z. (2022). Virus diversity and interactions with hosts in deep-sea hydrothermal vents. Microbiome 10, 235. doi: https:///10.1186/s40168-022-01441-6

- 作者简介 -

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多