作者:王硕,南京农业大学博士在读。主要研究利用噬菌体防治土传病害。 从宏转录组数据共鉴定出2658344个RNA病毒contigs,并补充了27984个来自公开数据库的序列(图1A)。RNA病毒序列簇按大小呈幂律分布,以小簇为主,大簇有长尾巴,最大的包括429个contig。根据累积曲线,在RvANI90(RNA病毒ANI90簇)水平上评估RNA病毒的全球多样性没有饱和迹象(图1B),并且在土壤环境中的丰富度最高(图1B)。约5.8%编码RdRP的contig显示了使用替代遗传密码(图2),约0.5%显示了RdRP内保守基序(结构域排列)的重新排列(图2)。 图1 RNA病毒发现方法 02 RdRP系统发育与RNA病毒多样性扩展 得到的RdRP树包含77520个代表性序列(图2)。在大多数样本中,5个门基本上保持单系。倾向于打破门水平单系的序列形成了一个明显偏倚的亚群,其中Flasuviricetes是最常见的“罪魁祸首”。Flasuviricetes位于Pisuviricota内部,而在先前的分析中,它是Kitrinoviricota的基础分支。然而,Flasuviricetes在亚样本树中的位置不一致表明它们的系统发育位置仍然不确定。Reoviridae、Picobilnaviridae、Cystofiridae和几个候选科也经常脱离各自的门,当亚样本树被减少到只有五个门中每一个门的最低共同祖先时(图2 右上),发现最深的分支顺序是稳健的,Pisuviricota和Kitrinoviricota在共同的发育树中形成树冠组,Lenarviricota和Negarnaviricotta占据基础位置。 图2 全球RNA病毒圈的系统发育重建 03 与细菌相关RNA病毒范围的主要扩展 Cystofiridae的多样性从8个已发布的RCR90簇扩展到132个RCR90簇。Levivirus多样性从1940个RCR90簇增加到13512个RCR90簇。扩展的Lenarviricota门现在占RNA病毒RCR90簇的三分之一以上,包括四个最大的科(图2),其中第一个和第四个分别是Steitzviridae和Fiersviridae,它们是真正的Leviviricetes噬菌体。除了Lenarviricota的扩张外,汇集的证据表明,以前被认为只侵染真核生物的几组病毒重新分配到细菌宿主(图3B)。在当前的RdRP系统发育中,Cystoviridae从Duplornaviricota迁移到Pisuviricota,与picobirnaviruses和partitiviruses形成分支。在Durnavarles中,有几个分支在5’非翻译区(UTR)中显示出核糖体结合位点(SD)基序的意外保护,表明这些病毒侵染了细菌。来自23个RvANI90簇的161个RNA病毒的间隔区匹配结果跨越两个分支:Leviviricetes和genPartiti.0019(图3B)。其中genPartiti.0019病毒的配对与Roseiflexus sp. RS-1的群体特异性相关。在16个宏基因组的编译间隔子中,每个CRISPR阵列可以与1000–40000个间隔子相关联,但在编码逆转录酶(RT)的III-B阵列中检测到与genPartiti.0019序列匹配的所有间隔子,表明这些间隔子是从RNA模板获得的(图3C)。在跨越9年的样本中观察到这些CRISPR间隔子匹配,并显示出间隔子随时间的动态增加或损失,表明了病毒与宿主的关联。因为所有genPartiti.0019 contigs单独编码RdRP,而相关的partitiviruses具有被分开的基因组(其中衣壳和其他蛋白质在单独的片段中编码),所以在Mushroom Spring宏转录组中搜索编码相应衣壳蛋白(CPs)的contig。共鉴定了88个潜在的编码衣壳的contigs(图3D),其中86个编码的蛋白质与已知的partitiviruses衣壳的HMM图谱最为一致。因此,genPartiti.0019成员最有可能是侵染Roseiflexus sp. RS-1的分段RNA噬菌体。在由原核宿主主导的数据集中,在广泛的生物群落中检测到了大多数潜在的RNA噬菌体,其中Leviviricetes是迄今为止最丰富的原核RNA病毒群,但一些由genPartiti.0019主导的黄石温泉除外(图3E)。 图3 原核RNA病毒的多样性和丰度 04 RNA病毒在样品和生境中的差异分布 RNA病毒调查覆盖了全球,反映了RNA病毒在地球上的普遍性(图4A)。分析的大多数数据集都是缺失rRNA的(67%)。尽管poly(A)富集和总RNA数据集主要由真核生物序列组成,但rRNA缺失数据集主要是由原核生物序列组成。根据非病毒contig的分类组成,数据集被分为三组:“真核生物(E)主导”(811)、“原核生物(P)主导”(2706)和“混合”(452)。大多数RNA病毒类别在不同数据集类型和环境中显示出清晰的分布模式,可能反映了其主要宿主群体的分布(图4B)。 图4 全球RNA病毒的分布 05 RNA病毒基因组的模块化进化 首先确定了这些家族的成员,其中RdRP和CP位于同一段。检测到多个由非同源对应物引起的结构基因模块移位案例。例如,虽然Potyviridae、Benyviridae和Matonaviridae的成员分别编码3个不相关的CP,并形成螺旋丝状 、杆状或被包裹的病毒颗粒,但在这些病毒附近分支的一些谱系编码single jelly roll(SJR)CP,预计形成非包膜二十面体病毒。在f.0226.base-Beny组中,几种病毒同时编码SJR和烟草花叶病毒(TMV)样CP,可预测它们分别形成二十面体和螺旋衣壳,表明这些病毒可能获得了第二个CP,但保留了祖先的CP。在Togaviridae的基础谱系中也发现了非同源CP,其中典型的Togaviridae二十面体形成CP被TMV样CP取代,很可能形成杆状螺旋病毒,表明TMV样CP出现在Hepelivirales和Martellivirale的共同祖先中。相反,在两个已鉴定的Virgaviridae contig中,TMV样CP被Kitaviridae的结构蛋白取代。在f.0268.base-Toga中,典型的Togaviridae结构模块(包括CP和II类融合蛋白[CIIF]基因)被一种I类融合蛋白和一种nidoviruse M蛋白(图5)替换。膜融合糖蛋白的类似替换也在Xinmoviridae contig中发现,其中CIIF蛋白取代了典型的III类融合蛋白,但保留了典型的单核病毒核衣壳蛋白。接下来鉴定了几种以Hypoviridae(无衣壳真菌病毒)为基础的病毒群,其编码的CP与柔性螺旋病毒或二十面体病毒的SJR CP同源,表明这些科的祖先可能是衣壳编码。进一步鉴定了编码SJR CP的Deltaflexiviridae近亲,与Tymovirus相似,表明Deltafluxivirida是从Tymovir科的一个成员进化而来的,之后转移到真菌宿主。最后,研究了RdRP结构域中存在的一种独特的重排(称为“结构域置换”),发现2.9%的RCR90 RdRP集合(2241)被鉴定为置换。分析表明,基序交换起源于两个类(图2),即Pisuviricota(包括Permutotetraviridae、Birnaviridae和其他14个暂定科)的候选类c.0017和Kitrinoviricota(覆盖8个假定科,包括Yangshan集合的许多病毒)的候选类c.0032。 图5 RNA病毒中蛋白结构域的多样性 论文信息 原名:Expansion of the global RNA virome reveals diverse clades of bacteriophages 译名:全球RNA病毒组的扩展揭示了噬菌体的多样分支 期刊:Cell DOI:https:///10.1016/j.cell.2022.08.023 发表时间:2022.10 通讯作者:Uri Neri 通讯作者单位:特拉维夫大学 |
|