分享

丰度-占有率分布来确定植物核心微生物组成员的优先次序

 长乐社_1 2023-05-24 发布于江苏

心微生物组成员是假设反映与宿主潜在功能关系的数据集的一致特征。对最近的植物-微生物组文献的回顾揭示了用于定义核心的各种具体研究方法,这对建立一个通用的植物-微生物组框架提出了挑战。在宏观生态学中用于描述空间上群落多样性变化的丰度-占有率分布,为在空间和时间研究中优先考虑核心成员提供了一种生态学方法。此外,适合于丰度占有率分布的中性模型可以提供对确定性选择的核心成员的见解。我们提供的例子和代码,从丰度占有率分布系统地探索了核心植物微生物组。虽然我们侧重于来自植物微生物组的例子和相关的讨论,但是丰度占有率方法可以广泛和普遍地应用于任何微生物组的核心成员的优先次序确定。

核心微生物群落是微生物群落的共同特征。[1,2,3].从2011年关于食肉猪笼草植物中“与动物肠道微生物群组成相似”的核心微生物组的报告开始[4] ,在对拟南芥根系进行开创性研究之后,鉴定核心植物微生物组的科学兴趣增加了科学兴趣[5··]。自那时以来,核心微生物组的概念已经应用于在许多情况下生长的许多植物物种,并且以各种生物学或统计学动机的方式定义(表1,支持表 S1及其中的参考文献)。由于它们的一致性,推断核心微生物组成员对宿主适应性有一定的重要性(例如 Ref。[6]) ,因此有可能管理植物微生物群落,以实现预期的结果[7,8,9,10,11,12]。然而,每项研究的设计都是不同的,定义核心微生物群的方法几乎和研究一样多。因此,一般微生物组研究,特别是植物微生物组研究的剩余挑战是在不同研究之间协同增效,以普遍了解可用于支持微生物组预测和管理的核心微生物组,跨越植物物种和背景,并在不断变化的地球上。

想要定义一个核心微生物组有不同的动机(支持表 S1)。有些研究只是想知道宿主身上哪个分类群最丰富。这个核心定义可以通过排序丰度曲线得到。然而,许多对植物有功能性影响的微生物菌株往往是罕见的(例如许多植物病原体) ,而且丰度定义的核心缺少在群落中不占主导地位的重要成员。其他研究想知道哪些分类群总是在宿主身上或在某种情况下(例如存在/不存在)被检测到。这个核心定义可以通过一个维恩图来说明。然而,在微生物组数据集中罕见类群的优势将膨胀在特定生长条件或基因型中检测到的类群数量。因此,检测定义的核心成员可能包括许多不重要的成员,这些成员在感兴趣的条件下是暂时的。最后,一些研究通过在特定条件下富集来定义核心微生物群(例如 Ref。[13]).因此,核心成员是那些在震源条件下比在相对条件下一贯检测到较高丰度的成员。这一核心定义纳入了检测和丰度的各个方面,可以提供生态学见解,以优先考虑由东道国选定或适应东道国环境的成员。

定义最近应用于植物微生物群落的核心的方法之间有一些直观的共同点: 它们通常包括一些分类单元比例贡献的阈值和/或跨样品的最小检测。在生态学中,这些直观属性分别被称为丰富性和占有性。丰度-占有率分布提供了一个一致的,生态动机的方法优先考虑核心成员。在宏观生态学中,物种丰度-占有率分布经常被用来探索分类群分布的大规模模式([14] ,图1)。一个分类群的平均相对丰度被 log10转换,然后绘制出它发生的离散样本的比例(在所有样本中占有1)。丰度和占有率一起为解释人口和社区层面的多样性模式提供了丰富的信息。

丰度-占有率分布可用于从任何类型的社区数据集中生成核心微生物组成员的支持假设,然后优先考虑这些核心分类群用于随后的后续研究,以测试其功能重要性。在这里,我们首先讨论如何类似地应用和解释丰度占用分布,以优先考虑核心成员的空间和时间(图1)。我们通过量化顶级成员(在占有率方面)对贝塔多样性的贡献,为核心成员设定一个门槛。然后,我们讨论了利用微生物群落组装的中性模型,通过群落组装过程来区分它们的分布。通过丰度-占有率数据拟合一个中性模型对于解释和讨论核心成员关系以及建立假设都是有用的。最后,我们以警告和限制结束。

将核心微生物群优先于空间

在宏观生态学中,丰度占有分布通常用于考虑空间多样性的变化[15· ,16,17] ,尽管它并不经常被用于考虑“核心”分类群,这一概念在微生物生态学中得到了更积极的应用和研究[5·· ,18]。在微生物群落生态学中,有几种研究类型具有明确的空间成分,并允许将丰度占有率方法直接转移到数据集中。特别是对于植物-微生物组研究,空间组分是固有的,因为高度的环境异质性有时是宿主施加的(例如土壤化学,根区)[9,19]。在一些植物-微生物组实验设计中,努力使盆到盆,行到行或田到田的变异性最小化,以便可以分离出感兴趣因素的有趣属性(例如植物基因型,管理)[20·]。在其他研究中,表征空间环境梯度的植物-微生物组变化提供了一个生物地理学问题,其中空间本身是感兴趣的因素[21·· ,22]。核心微生物群可以从这些空间研究设计使用丰度-占有率分布通知。

然而,空间研究设计对于分类群占有率的计算具有重要意义。计算入住率的最简单方法是让所有离散样本对总数贡献相等,以1的比例(或100% 的百分比)表示。这种方法是最保守的,将核心仅限于那些在每个样本中检测到的分类群,因此也将偏向于更丰富的分类群(见下面的中性模型讨论)。然而,对于空间上的复制,有时从生态学的角度考虑共同的复制并消除不一致的分类群是相关的。或者,占用可以被视为位置/处理内的检测,例如只要分类群在每个位置中都有代表(尽管不一定在该位置内的所有重复中有代表) ,它就被视为在那里发生。这种方法不那么保守,因此可能存在假阳性分类群,在功能测试之后,这些分类群将从核心集中删除。然而,根据群落结构的不同,这种方法也更有可能包括平均中等到低丰度的分类群。

建议对核心进行系统的探索,以确定生态支持的核心成员和阈值[23] ,但应结合从实验设计和研究问题提出的生态洞察力。我们建议进行迭代探索,量化核心成员对 β 多样性的解释价值(方框1,图1-5)。这个过程包括按占有率对分类群进行排序,连续确定排名分类群对贝塔多样性的集体贡献,以及在添加下一个排名分类群时应用一个提示报酬递减的阈值。

根据研究设计,分类群首先根据占有率进行排序,还有一个选项是也包括分类群丰度的权重。然后,通过计算核心分类群的群落相似性比例,量化核心分类群子集对 β 多样性的贡献。我们使用 Bray-Curtis (Eq。(1)另见参考文献。[40]) ,但其他相似之处是可以互换的,不同的相似之处强调 β 多样性的不同方面,应该仔细考虑。

最后,为了确定核心纳入阈值的增加将提供解释价值的边际回报的点,我们提供了两种方法: 更严格的“肘”方法(一阶差异,见下面的解释)β 多样性的最终增加百分比(我们建议2% 或更多)。

将下一个分类单元添加到核心(如图1第5部分)的累积解释值显示在图 i 中的每个数据集中。红线以一级差异区分核心类群,绿线、蓝线或橙线以 Bray-Curtis 相似性增加最后2% 的解释值区分核心类群。在方程1中,C 是一组排名分类群(按占有率/丰度)对总 Bray-Curtis 相似性的贡献,BC 是 Bray-Curtis,被指定为包括所有 OTU 或仅包括假设的核心集。

鉴于土壤之间的高度环境异质性,另一个空间考虑因素是研究所包括的生物地理区域的范围。一个全球性的研究应该期望比使用标准盆栽土壤混合物的温室研究拥有更多的多样性和更少的分类群,占用1。因此,虽然不存在一刀切的核心包含阈值,但是从丰度占有率分布中使用和系统探索核心集合可以提供一种一致的方法,优先考虑生态上重要的分类群而不是空间和时间。

随着时间的推移对核心微生物群进行优先排序

微生物组生态学的纵向研究正变得越来越普遍,并且由于植物发育过程中已知的植物激素和根分泌物产生的变化,微生物组对植物特别感兴趣[24,25,26]。另一个有趣的时间组成部分是具有多年生或半年生生命历史的植物如何以不同的方式从具有年度策略的植物中招募和维持核心微生物群成员[27]。此外,一些植物区室,如附生叶际表面,可能会经历更大的环境波动随着时间(季节)比其他区室,如根内生菌[21··]。然而,要了解生活在这些隔室中的微生物群如何在时间上发生变化还有很多工作要做,并且由于通常需要破坏性采样,因此在研究设计中执行时间复制可能存在后勤挑战。因此,核心植物-微生物群落的定量时间研究才刚刚起步,研究领域相对开放。

随着时间的推移,丰度-占有率分布已经应用于其他系统,以识别核心微生物群。“持久性”和“暂时性”被用来根据人类肠道中每日时间序列的占有箱对微生物组成员进行分类[28]。一个中性模型被应用于丰度-占有率分布,这是根据斑马鱼发育过程中离散时间点收集的数据计算的[29]。鉴于需要了解植物发育过程中微生物组的变化或季节性变化,这些方法在概念上符合植物-微生物组研究的目标。

至于计算占用空间,有考虑到折叠占用轴,只包括最生态相关系列的问题,而不是整个样本集。可以说,随着时间的推移,这对于定义核心微生物组更为重要,因为占有率表明持久性: 即使随着时间的推移环境发生变化,与植物相关的哪些分类群最一致地被检测到。持久性是维持系统稳定性的一个关键的生态考虑因素,这往往是理解核心微生物群落所期望的转化结果。此外,核心植物微生物群落的时间动态提供了重要的基线序列,可以用来比较干扰(如作物、洪水、干旱或其他管理变化的生长季节)。

我们最近使用丰度占用分布来优先考虑多年生柳枝稷叶层(附生植物)的核心,在复制的区块设计中在田间生长长达两个季节[20·]。我们详细讨论了这项工作,以说明如何可以入住率计算生态信息。由于我们对微生物组结构的季节性趋势感兴趣,所以重复图对于确定一致的核心成员是至关重要的,并且保守地定义了占用率以包括在给定时间点在所有重复场中检测到的分类群。将核心集定义为在任何时间点的占用率为1,这解释了数据集的季节性方面,然后我们能够观察哪些成员在生长季节和两年期间也持续存在。我们发现,大多数核心成员具有高平均丰度,并且季节性持续存在,正是这些核心成员的集体动力学定义了研究的 β 多样性的时间模式(方框1)。总之,当环境发生变化时,将追踪研究的核心微生物组占有率阈值设定为1可能过于保守,但是复制的时间序列可以为优先选择在特定时间和特定季节条件下关键的核心分类群提供支持。

中性模型,通知核心分类群是确定性组装

丰度-占有率分布的一般形状预计是一个“ S”,其中最丰富的分类群表现出最高的占有率,而罕见的分类群表现出最低的占有率(图1)。这是数据的“中性”期望,假设微生物细胞无限扩散,分类群之间没有适应性差异。Sloan 和 Curtis 对这个中性模型进行了详细的讨论,并引起了许多微生物生态学家对废水处理微生物群落丰度占有率分布的理论探索和应用的关注[30,31]。

中立模型被用作社区集会的无效假设,经常与确定性模型并行检验,以确定哪种模型最能描述整个社区集会。然而,中性模型可以为优先考虑核心微生物群提供有趣的扩展,因为它可以区分预期从预期为中性的分类群中确定性选择的分类群(例如预期的占有率,给定平均丰度)。落在置信区间之外的分类群满足确定性期望(图1)。特别是,低于中性模型预测的分类群在数据集中的平均丰度高于预期,而低于预测的分类群的丰度高于预期。对于植物微生物群落,我们可以解释为形成一个假设,在前一种情况下,植物环境选择这些分类群,而在后一种情况下,这些分类群的扩散受到限制。平行解释以前应用于发育中的斑马肠道,人类肺部和皮肤,以及更广泛的宿主和环境[32·· ,33,34,35,36,37,38]。在通过丰度和占有率选择的核心分类群中,那些在模型拟合(由植物环境选择)之上确定选择的分类群可以被赋予更高的优先级,以获得稳健的定殖效率和/或与植物相互作用的潜力。因此,我们建议探索核心类群的组装机制,以收集更深入的生态学见解,其分布和指导功能的后续研究。

考虑因素和局限性

我们的重点是应用丰度占有率分布来检测核心微生物群从标记基因扩增子数据集,如16S rRNA 基因或 ITS 区域。这一焦点的动机是因为标记基因在大规模和跨系统分析中的持续效用,以告知核心植物微生物组的一般性(方框2)。然而,在使用这种方法时,需要考虑的是在没有功能数据的情况下对核心给定的包含标准进行知情解释。例如,位于核心包含物丰度占有阈值之外的分类群可能在以后证明在功能上很重要。研究人员将最有信心纳入具有最高丰度或占有率的核心分类群,仅仅是因为有更强大的模式明显的分类群,被观察更频繁。有条件地有助于系统的分类群可能不符合基于其丰度占据的“核心”的纳入标准,但我们建议使用补充方法来鉴定这些响应性分类群[39,40] ,特别是对于纵向研究或压力之后。

此外,高占有率的分类群可能是在取样或加工过程中引入的污染物。适当的控制,特别是对于低生物量样品,如叶内生菌,花和种子,需要区分核心分类群和污染物[41,42·]。此外,高占有率的核心类群应与散装土壤中发现的类群进行比较。可以预期,块状(bulk)土壤是植物微生物群落多样性的储存库,因此,在块状土壤中发现潜在的核心植物类群并不意味着它们对植物的潜在重要性无效。统计分析区分大块土壤和植物环境之间高占有率类群的相对丰度的差异,可以提供更深入的洞察,以了解它们对植物的特异性。判别分析(例如:。指示分类群分析和许多其他统计方法可以用来评估大块土壤和植物之间的分类群丰度差异。

操作分类单元的定义方式将最终影响核心的大小。以100% 的序列同一性而不是97% 的序列同一性定义分类群的流行程度有所提高[45,46]。为简单起见,我们将这些称为零半径 OTU (zOTU) ,但是还有其他术语适用于这些集群(扩增子序列变体,精确序列变体)。一方面,使用 zOTU 可能会减少在完全占据1时观察到的分类群的数量,但另一方面,它也可能允许核心内的冗余分类群来自测序错误; 这些 zOTU 本来会以97% 的同一性与亲本序列聚集。在不影响原始测序数据的严格质量控制的情况下,我们建议对第一个聚类(例如97% 序列同一性)使用较低的同一性阈值,并初步探索丰度占用分布。然后,那些被发现对 β 多样性有重要贡献的核心分类群可以被子集和100% 重新聚类,以确定每个核心分类群的潜在应变水平变异及其分布。这种方法的好处是,从相同的97% OTU 派生出来并表现出相同动态的 zOTU 可以作为一个生态型一起折叠起来。这并不意味着折叠的 zOTU 是相同的,也不证实一个 zOTU 是亲本 zOTU 的测序错误,但这确实意味着这些分类群与植物有冗余的生态模式。折叠它们可以减少数据集中的冗余,并支持将重点放在生态核心成员身上。因为已经表明,使用97% 序列同一性定义的 zOTU 或 OTU 通常揭示相对多样性中相同的总体模式[47] ,所以预计任一分类定义都将充分告知可以优先用于功能研究的核心子集。

在我们对支持表 S1的文献进行回顾时,我们注意到一些研究没有将核心微生物组的分析作为统计方法描述的一部分,通常在结果部分中几乎将纳入标准作为一个旁白。应用丰度-占用率分布来发现一个核心,强调需要对纳入标准的基础数据结构进行仔细的统计考虑和透明度,并可能导致改进方法的监督和严格性。使代码和统计工作流程可用于确切如何定义核心(方框1) ,并将这些细节包括在手稿的统计方法部分中,将提高跨研究的可重复性,并支持对核心微生物群的一般理解。

结论

核心微生物组的成员可以从扩增子测序数据集中发现并优先使用从宏观生态学借鉴的丰度占有率分布。这些分布可以类似地应用于空间和时间研究设计,然后结合中性模型来改善关于核心微生物组装的驱动因素的假设,解释选择核心分类群的机制,并为核心的讨论和解释提供信息。丰度-占有分布允许研究人员发现和优先考虑的核心微生物组成员的基础上的生态学。他们可以提供一个系统的第一步,以了解功能的核心的重要性的工厂。更一般地说,这个来自宏观生态学的框架可以提供预测和理解核心微生物群落的策略[15· -17]。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多