分享

综述| Plant Communications :植物物种形成的基因组学

 kibcat 2023-09-16

生科云网址:https://www./


编译:微科盟雪芋竹,编辑:微科盟悄咪咪、江舜尧。

微科盟原创微文,欢迎转发转载,转载须注明来源《基因组Genome》公众号

导读
植物研究有助于揭示新物种是如何起源的。几十年来,植物研究对通过其他生物研究提出的物种形成概念进行完善,但在某些情况下对这些概念提出挑战,同时也揭示了物种形成的其他方式。如今,基因组测序技术发展的空前速度和规模使生物学家能够解决长达数十年的争论并应对物种形成研究中新出现的挑战。因此,此文章回顾了最近在植物物种形成方面的基因组发展。通过对基因组进化分析,讨论了与生殖隔离(reproductive isolation,RI)基因座鉴定相关的问题,并强调了结构变异在物种形成中的重要作用。另外,此文章回顾了基因组学是如何推进我们所熟知的一些新物种形成途径(如杂交或全基因组复制),同时对其他途径提出质疑,如种群瓶颈和基因漂移。虽然基因组学可以快速识别导致RI的基因和突变,但后续的分子和实地验证仍至关重要。尽管如此,基因组学可以阐明古老变异而非新突变在物种形成早期发挥巨大作用。最后,此文章强调了未来研究的前景,包括加深我们对表观遗传学和结构变化在物种形成过程中发挥作用的了解,扩大植物物种形成基因组学研究的范围和分类广度,以及整合由植物物种形成产生的广泛基因组数据信息。


论文ID

原名:Genomics of plant speciation
译名:植物物种形成的基因组学
期刊:Plant Communications
IF:10.5
发表时间:2023年4月
通讯作者:Loren H. Rieseberg
通讯作者单位:加拿大不列颠哥伦比亚大学
DOI号:10.1016/j.xplc.2023.100599

研究进展


1859年,查尔斯·达尔文发表了《物种起源论》,他提出了自然选择进化这一极其重要的概念,理解新物种是如何产生这一问题迈出了第一步。当时人们认为物种是一个远离正常种群的棘手问题,达尔文则认为生物多样性在不同尺度上是动态和连续的:种内自然选择产生差异(如不同品种之间观察到的差异)最终导致种间分离。自1859年以来,基于达尔文超前的预言性观点,大家对物种形成的理解取得了极大进展。这得益于几个里程碑式的发现,包括孟德尔遗传原理以及20世纪30年代和40年代将群体遗传学与达尔文进化论相协调,建立了现代统一的进化论。
在这段时间里,对植物的研究不断地塑造我们对新物种起源的理解。例如,早期植物物种研究认为,物种间杂交频繁且具有进化意义。然而,动物学同行则倾向于物种之间存在严格的生殖独立性,认为杂交是隔离机制偶然失效导致的异常。与达尔文几十年前提出的观点一致的是早期的植物学者倾向于自然选择导致生态隔离和物种形成这一理论,或许是因为他们研究的生物具有固着习性。例如,植物学家依靠育种实验和大规模移植,指出地方适应种群和生态型是物种形成的初始阶段。然而,动物学同行认为如果没有初步的地理隔离是不可能形成物种的,导致适应性形态分化与导致生殖隔离的遗传变化有根本不同。最后,植物生物学的其他方面为揭示物种形成的其他途径提供了独特优势。例如,全基因组复制(whole-genome duplicationWGD)在植物中比在动物中更常见,因此在植物中发现多倍体也就不足为奇;尽管动物多倍体也已存在很长时间,但我们所熟知的多倍体物种大多来自植物系统。
基因组革命为当代进化生物学家提供了解决这些争论所需的工具,并将早期观点作为物种形成研究领域取得新进展的基础。例如,现在人们普遍认为,物种之间的杂交很常见且有助于多样化的形成,这一观点逐渐被一系列基因组学证明。此外,除了能够解析杂交,基因组研究还可以阐明物种适应、物种形成时间、染色体倒位或其他重组位点,这在基因表征时代变得至关重要。基因组研究也支持自然选择在筛选有利于适应和生殖隔离的基因从而直接或间接驱动物种形成中发挥的不成比例的重要作用。然而,基因组数据集不仅给出答案,还提出了物种形成研究中的新问题,包括相对于生殖障碍建立重组抑制的时间点,以及适应和受精后隔离之间的联系。
此文章回顾了基因组测序的最新进展,重点是植物物种形成。因此,尽管依赖早期基础文献,但此文章并不会详细阐述这些研究。相反,此文章从基因组学的角度来看植物物种形成,并提问大家对植物物种形成的理解是如何被现在的基因组测序技术所影响的。此文章强调,在一定情况下,植物物种形成问题仍具有挑战性,需要进一步研究。

1.基因组分化格局

物种形成基因组学的一个基本问题是,在物种形成期间和之后,基因组之间的差异是如何积累的。许多早期进化论者将他们的想法建立在生物物种概念上,并将物种形成视为一个涉及许多共适应基因的多基因过程。在这个模型中,RI首先出现在存在地理隔离的种群之间,然后通过对杂交种的选择来加强。优良物种之间不会出现渗入现象,因为共适应程度会使种间组合变得不适应。因此,基因组作为一个单元,物种之间的差异在基因间会相对均匀。
虽然生物物种的概念在动物界很流行,但植物学家早就意识到物种间杂交和渗入的普遍性。例如,在表现为“杂婚”的物种中,表型和生态均有差异的分类群仍经常杂交和渗入。此外,早期的植物学研究发现,物种形成似乎是由少数基因座的变化驱动的。这一证据,加上表明生殖屏障渗透性的杂交带理论和实证研究,有助于物种形成成因模型的发展。该模型认为物种形成是由少数导致RI的基因座引发的如果不同的种群不存在地理隔离,那么这些基因座周围的基因流动将减少,但基因组的其他地方则不受影响。物种形成过程中,基因流动减少的区域通过一个被称为“分化便车”的过程扩大,导致更大程度的RI,RI积累从而使整个基因组免受种间基因流动的影响,物种便形成了。
令人开心的是,该基因模型在物种形成的早期阶段,可以根据基因分化来鉴定参与RI或生态特化的基因。对物种间的全基因组等位基因频率进行比较时,这些基因的FSTfixation index)很高,表现为所谓的“基因岛”有学者意识到,其他过程也可能会产生遗传分化峰值。因为FST是遗传分化的相对衡量标准,当多样性较低时,FST就会变大。这意味着FST峰值可能代表普遍适应性等位基因而非RI等位基因。通过净化选择去除有害突变的背景选择也会降低多样性,因此净化选择的地方基因组变异也可解释FST峰值的产生。另一方面,与正选择等位基因连锁可能以类似的方式影响中性位点,导致重组率低的基因组区域的多样性降低。
为了探索这种驱动力在产生FST峰值中的相对重要性,Stankowski等人对9个沟酸浆属(Mimulus)进行了比较研究。他们发现FST与遗传多样性以及树一致性呈负相关。这证实了连锁选择的作用,其导致伴随基因组的有效种群规模(Ne)的局部减少,从而影响FST。这是来自背景选择还是适应正选择?为了验证这一点,作者比较了基因组因素间的相关性和物种间分化,以检验Burri提出的几个关于连锁选择效应的假设。虽然观察到了功能元件密度和重组率的相关性,但仅使用背景选择的模拟显示分化差异不大,这表明背景选择不是导致分化的主要驱动因素。这与最近的研究发现FST异常值不太可能由背景选择驱动的结果一致。
但问题是,如何才能知道FST异常值是否真的是与RI相关的等位基因,而不是与RI无关的自然选择的影响?解决这一问题的一种方法是在这些比较中纳入DXY(组间核苷酸差异),这是基因组分化的绝对衡量标准在一个有基因流动的分化模型中,对RI有贡献的基因应该具有高的FSTDXY,而单个物种中的选择性清除中FST会增加但DXY不会。
几项植物研究发现,FST高的区域DXY也高,但关键是,这也可能发生在异株分化的分类群中。在物种之间没有任何基因流动的情况下,这些FST峰值不是由局部减少的基因流动引起的。一种解释是FST峰值是由祖先变异的差分排序引起的。祖先变异比物种形成更古老,因此当不同的单倍型分为两个物种时,它们会导致FSTDXY增加。在报春苣苔属(Primulina中,土壤物种<50万年前分化,但姐妹物种间的FST峰值包含10倍以上(540万年前)的单倍型。祖先变异的选择也可能在RI中发挥作用。在夏威夷铁心木属(Metrosideros适应性辐射中,FST异常值富集在相关物种间差异固定的基因座中。Choi等人将其描述为祖先的不相容性,并假设物种形成可能是由已存在的不相容池促进的。
最终,对于所有的FST峰值来说不太可能都是单一因素Shang等人探索了五对杨属分类群的基因组差异。他们根据DXY是否升高将FST异常值表征为基因流分化或异地选择。他们发现,无论物种是否有基因流动史,符合异地选择特征的区域大约是基因流分化的10倍。然而,对RI有贡献的区域在解释近期分化的分类群的分化模式方面更为重要。可能是FST峰完全源RI基因的可能性很小。草原向日葵的沙丘和非沙丘种群存在生殖隔离,但可能只分化了5000年。当比较它们的基因组时,FST峰几乎只出现在少数与RI性状相关的非重组模块中。未来随着进化,其他过程也将产生FST峰,而目前可见的RI基因座将变得模糊(图1)。因此,相比于物种形成较久的物种来说,在早期通过基因组分化格局来识别有助于RI的基因组区域容易实现。此外,从鉴定有助于RI基因的角度来看,对基因组分化的分析通常需要检验,例如精细定位。这是因为,即使在物种早期,也可能因为FST峰值太大而无法鉴定出关键候选基因。

目前基因组差异分析几乎完全基于short-read测序和单个参考基因组比对。该方法的一个缺点是,复杂的基因组变异(包括结构重排和大的插入或缺失)都不是基因分型的。例如,Liu和Dawe最近创建了一个26个不同玉米品系的泛基因组,每个品系都是使用long-read技术从头组装的。他们发现,泛基因组的总长度是独立基因组的3.7倍,所有个体中只有4.9%的泛基因组是保守的。这强调了隐藏于基因组重复区域和重排中的巨大变化,下一节将对此进行更详细的讨论。

 Image

1| 物种形成不同阶段(早期、中期、晚期)的全基因组序列差异模式在物种形成的早期阶段,RI位点是唯一的FST峰。随着分化的进行,其他过程(例如,祖先变异的排序、Ne的局部减少、连锁选择等)会产生另外的FST峰。在物种形成后期,FST的整体升高进一步模糊了峰值辨别度。

2. 结构变异

结构变异(Structural variantsSV),如倒位、易位、分裂/融合、插入/缺失和重复,是物种之间经常发生的重要遗传差异。植物结构变异于100多年前在玉米中首次发现,当时细胞学研究发现栽培玉米和野生玉米的染色体长度存在差异。后来的细胞遗传学研究证明了玉米和类玉米中存在染色体结和倒位,并将染色体结作为标记来确定玉米及其野生亲缘的起源、进化和关系。另一种重要的结构变化类型—转座子(transposable elementsTEs)也是首次在玉米中发现。然而,由于技术限制,20世纪对植物中SVs的全面探索进展缓慢。即使在基因组时代,由于缺乏高质量的参考基因组组装以及群体基因组研究对SNPs的关注阻碍了结构变异及其进化作用的研究进展。由于第三代测序的快速发展,最近出现了大量高质量基因组。有了这些基因组,再加上检测SVs的加强算法和工具,可以详细了解模式物种和非模式物种的染色体结构变化。
这项基因组工作揭示了亲缘关系密切的物种之间普遍存在的各种结构变异,是过去细胞遗传学和比较遗传图谱研究无法完成的。尽管一些(如开花时间)也可能有助于物种形成,但大多数植物SVs的研究都集中于其对表型特别是重要农艺性状的直接影响上其他研究通过染色体重排对杂交不育或重组抑制的影响,表明了其在物种形成中的作用。然而,尽管已鉴定一定量的SVs很少有与物种形成有关SVs。
虽然染色体倒位是研究最多的SVs,但此文章仅简要讨论,因为最近一篇综述全面阐述了它们对植物物种形成的作用。倒位可能直接影响杂交育性导致RI,细胞遗传学研究中也偶尔报道倒位引发的减数分裂异常。更常见的情况是,倒位杂合的杂交种(尤其是物种内多态性的倒位)的生育性并没有明显下降。然而,倒位也可以通过减少分化选择下的基因座与RI基因座之间的重组间接促进物种形成,这是植物中常见的一种遗传结构。重组减少有利于倒位的建立,或者有助于倒位建立后表型差异和杂交不相容性的积累。虽然通常不知道与倒位相关的性状是出现于倒位建立之前还是之后,但在一些情况下发现了地方适应等位基因的预先存在组合。

易位是另一类研究充分的SVs。比较基因组学经常报道关系较近的植物物种之间的易位,RI的遗传研究经常将隔离特性归因于易位。由于减数分裂过程中的错误分离,大的易位直接导致杂交不育。虽然这种强大的劣势有效地促进了RI,但它是易位初次建立的主要障碍。因此,染色体物种形成的早期模型表明,劣势重排是通过遗传漂移建立的。然而,这只适用于自交物种或经历过极端种群瓶颈的物种。在种群规模非常大的物种中观察到的高易位率也与遗传漂移在易位建立中的作用不一致。或者,它们对重组抑制的影响可以建立易位。然而,重组抑制通常仅限于易位断点附近的基因组区域(图2),这限制了该机制的适用性。第三种可能性是减数分裂驱动。从对小鼠的研究中,现在有充分的分子证据表明,罗伯逊易位(Robertsonian translocations)的雌性减数分裂能够通过影响着丝粒强度来驱动核型进化。迄今为止,在植物中发现的两个雌性减数分裂驱动的例子(玉米和沟酸浆属)与易位无关。然而,最近在香蕉中报道了优先递送的易位,也有一些研究将易位断点与着丝粒联系起来,这说明雌性减数分裂驱动可能发挥作用,但还需要进一步的研究。

Image2| 染色体易位对重组抑制的影响。(A)两条非同源染色体之间的相互易位。(B-D)在不同的情况下,(B)仅在易位断点周围,(C)在一条染色体的断点周围和另一条染色体易位片段,或(D)在一条染色体的断点附近和另一条除易位片段外的整个染色体中,杂合个体的重组率降低。灰色线表示原始核型纯合个体的重组率,蓝色、绿色和橙色线表示杂合个体的重组率。x轴指示原始染色体。黑色圆圈表示着丝粒的位置,红色三角形表示原始染色体上的断点位置。注意,着丝粒周围的重组也受到抑制。

由插入和缺失多态性导致的半合子性以类似于倒位的方式有效抑制重组,从而为基因流动的物种形成提供进化优势。据报道,在克隆繁殖的葡萄基因组中存在高半合子性,表明这种类型的SVs可能在植物中很常见,并可能导致RI。一个典型的例子来自向日葵,其FLOWERING LOCUS T基因同源物的半合性或完全丧失是银叶向日葵同域生态型之间开花时间不同的基础。
TE插入和缺失也会导致大的多基因的SVs。TEs是植物基因组突变的重要来源,是可能导致RI性状变异的原因。例如,拟南芥和玉米开花时间的差异;牵牛花、金鱼草和玫瑰中的花色模型,以及野生大麦的地方适应。据推测,可能由非生物胁迫诱导TE活性激活可促进快速适应和物种形成。除了TE活性对基因表达和功能的影响外,DNA甲基化沉默TE是物种内部和物种之间重组率不同的重要原因。然而,在基因流动的情况下,表观遗传学修饰在维持适应等位基因簇和促进物种形成方面的潜在作用仍有待证明。
最后,如上所述,其他类型的SVs,如分裂/融合以及片段重复,也能在物种形成中发挥作用。染色体分裂/融合比易位通常具有较弱的劣势效应,对重组的影响比倒位弱。一般来说,分裂会降低重组率,而融合会增加重组率。染色体融合是伴随WGD二倍体和多样化的重要组成部分。需要做更多的研究来了解这些类型的SVs对物种形成的贡献。随着long-read测序和相关方法的应用,高质量基因组的组装和比较基因组学领域将快速发展。

3. 伴随基因流动、渗入和杂交的物种形成

基因流动在介导物种形成过程中起着关键作用。物种内的基因流动通过阻碍分化和促进有利突变传播从而将种群维系在一起。物种之间的基因流动可能会产生不同的结果。一方面,它可能会减弱生殖隔离促进物种合并。另一方面,通过加强杂交种选择增强RI。然而,正如理论研究所示,更常见的是不同谱系之间的交流会产生稳定的杂交带。杂交和渗入的创造性结果也是可能的,包括适应性状的转移和新杂交谱系的形成(图3)。

 Image3| 基因流动(或它的缺失)对谱系分化、物种形成或灭绝的潜在影响。基因流动水平由虚线的粗细表示,较粗的线表示较大的基因流动。在异地物种形成中,由于物理隔离,分化谱系(A和B)被隔离,如图中的山脉所示。生殖隔离会随着时间的推移而进化,如红色“X”所示。在基因流动存在的物种形成中,由于适应性分化,随着RI的增强,基因流动随着时间的推移而减少。在同源杂交种形成中,当杂交种与亲本谱系产生生殖隔离时,可能形成一个独立的谱系(C)。这可能是因为生态差异以及遗传和染色体的不相容性(或两者兼有)。然而,如果选择适应度低的杂交种,随着时间的推移,亲代谱系之间的受精前屏障可能会加强,如变暗的红色“X”所示。渗入可能发生在亲缘关系密切的物种(A和C)之间。渗入速率的增加可能会通过基因清除导致物种灭绝,在这种情况下,物种A与物种C在表型上无法区分,用CA表示。

分析基因组数据可检测物种形成前后的基因流动。可用于此类分析的许多不同方法及其优势和局限性在其他地方已有叙述。此文章讨论了此类分析用于植物所学到的东西,重点是测试不同谱系间基因流动的研究,而不是此综述前两节中描述的关于基因组分化模式的报道。

3.1 伴随基因流动的物种形成

地理隔离被认为是通过减少不同谱系之间的基因流动来促进物种形成。如果地理隔离对物种形成很重要,那么姐妹物种比一个属中亲缘关系较远的物种更有可能是异地物种,这种模式在鸟类、昆虫、鱼类和哺乳动物等高度迁徙生物中可见。这与一些植物属的系统发育形成了对比,在这些植物属中,姐妹分类群在地理分布上比亲缘关系较远的物种重叠性更高。同样,对偏远海岛植物的系统发育分析发现,一些原生适应物种在岛屿上很常见,表明物种形成与基因流动有关,但是这种模式并不普遍。总之,这些结果表明,地理隔离可能在许多植物物种形成中没有发挥关键作用,其通过对不同生存环境的不同适应驱动物种形成。在这种物种形成的情景下,不同谱系之间的基因流动很常见。
有许多研究提出了所谓“物种形成的灰色地带”中的基因流动或渗入,在该地带,不同的谱系是可以区分的,但RI不完全。如Dagilis等人报告了724项真核生物的此类研究,其中包括230项植物研究。虽然这些研究表明基因混合是常见的(特别是在植物界),但大多数研究并没有对基因流动的时间做出推断。因此,并不清楚谱系的最初分化是否发生在基因流动(初次基因流动)出现时,或者在二次接触(二次基因流动)后是否存在伴随基因流动的隔离和分化的初始时期。然而,在一组研究中,种群模型拟合已被用于检测不同谱系进化史中基因流动模式的变化,虽然应极其谨慎地解释此类分析的结果,但在许多情况下是支持原始基因流动的,其中包括这样的例子:基因流动是连续的,但随着时间推移而下降。其他案例代表了物种形成早期的例子,其中广泛分布的祖先物种产生了分布更窄的衍生物种。后者中研究充分的例子包括一种来自美国科罗拉多州的适应沙丘的向日葵,它在过去10000年中产生于分布广泛的草原向日葵;以及西西里岛埃特纳山上的一种适应高海拔的千里光属源于低海拔分布更广泛的物种分化(约150000年前),时间上和使埃特纳山海拔增加2000米以上的火山活动相吻合。这两个系统都以不同的生态选择和持续的基因流动为特征Andrew等人认为向日葵生态型之间的基因交换每代不止一个有效迁移,这足以阻止中性位点的分化。相比之下,千里光属系统中每代的有效迁移只有不到一个,这表明中性的全基因组分化是可以发生的。需要注意的是,这种估计对混合种群很敏感,这可能也是两个系统之间基因流动率差异明显的原因。
更常见的是,伴随二次接触后基因流动的物种形成至少部分是异地的(尽管有自然选择的重要贡献)。由于气候周期,这种基因流动可能是间歇性的。印度-马来亚海岸的红树林为这种混合-隔离-混合循环提供了一个特别好的例子。He等人将基因组分析与地理相结合,发现海平面的变化与太平洋和印度海岸之间的间歇性基因流动有关,他们认为这使得物种形成率高于单纯的异地模式。

3.2 基因渗入

除了确定植物非异地物种形成的重要性外,基因组分析还可以解析种间基因交换模式和结果。Dagilis等人在对真核生物渗入的调查中发现,植物的渗入率(平均)高于动物,弱隔离谱系的渗入率高于强隔离谱系,这与文献中普遍持有的观点一致。正如早期文献预测,受人类干扰的生物的基因渗入也显著增加。
跨基因组的渗入模式也提供了对物种形成的见解,特别是RI的基因组结构。根据杂交带理论,渗入率与重组率呈正相关同样,RI基因或基因组区域的渗入减少。
基因组分析也提供了基因渗入的其他结果的例子,例如适应转移和基因清除,其中稀有的分类群会被杂交种取代。适应性渗入在植物中很常见,但到目前为止,从基因组数据中只发现了相对较少的例子,一个例子是胡杨,它的渗入已被证明有助于适应欧洲和北美气候;另一个例子是向日葵,一个关键开花调节因子的功能拷贝的渗入导致银叶向日葵的开花时间提前77天。后一项研究不仅表明了渗入如何取代受损或丢失的基因,还说明了其在RI进化中的潜在作用。此外,在橡树、柏树和拟南芥等系统中也报道了适应性渗入的其他实例。
关于基因清除的基因组研究较少,但最近对新南威尔士州(澳大利亚)一种罕见铁树皮(桉树)物种的分析表明,许多被归类为罕见物种的种群实际上是与更广泛物种杂交而来。对混合基因组研究表明,现存的动植物物种基因组通常含有现已灭绝物种的“幽灵渗入”。这些渗入的供体是否因基因清除而灭绝尚不清楚,但这些残余基因组的存在为通过选择性育种重建已灭绝的类群提供了可能性。

3.3 杂交物种形成

与多倍体杂交物种形成相反,同源杂交物种是罕见的,因为来自亲本群体的进化RI是一个挑战。同源杂交物种形成也很难证明,Schumer等人提出建立同源杂交物种需要以下三个标准:1)来自亲本分类群的RI,(2)先前混合的证据,以及(3)生殖隔离是通过杂交产生的证明。基因组分析有助于评估第二个标准,并且能够提供基因组嵌合的证据。然而,此文章强调,基因组嵌合只能证明杂交发生,且这种分析只能间接证明标准1和标准3,需要包括来自RI研究的其他信息。至今,基因组研究已经证实了牛津千里光(Senecio squalidus)的杂交源自上述埃特纳山上的两个千里光物种,并确定了几个同源杂交物种形成的潜在新案例,这表明三个研究充分的向日葵同源杂交物种中的两个杂交祖先存在差异,并且不能支持先前假设的同源杂交物种形成的几个例子,包括鸢尾(Iris hexagona)和丛生福禄考(Phlox)的两个例子。
基因组分析也可以帮助重建杂交物种形成场景,何时与表型连接,证明RI是如何进化的。例如,在S.squaridus中,种群规模模型表明,其起源的杂交事件可能发生在牛津植物园,而不是更早发生在埃特纳山。考虑到杂交物种形成的近期性,杂交基因组包含一个不同于亲本的独特基因组结构变化和遗传不相容性也就不足为奇了。据报道,一种表征较好的杂交种Ostryopsis intermedia有类似的模式,它遗传了一个亲本的开花时间隔离的等位基因,遗传了另一个亲本的耐铁性栖息地隔离的等位基因。Wang等人进一步强调了亲本等位基因的遗传参与受精前的生殖隔离,并认为这是同源杂交物种形成的一条特别容易的途径。紫皮云杉的起源有一个漫长的杂交物种形成过程,涉及大约600万年前形成的幽灵杂交谱系,约100万年前该幽灵谱系与其亲本物种之一发生渗入。

4. 多倍体物种形成

基因组学为我们理解多倍体物种形成(携带两套以上完整染色体的新物种起源)做出了重要突破。此文章回顾了基因组测序是如何被用来验证此类物种形成模式的基本概念。从多倍体的起源和WGD后发生的最早基因组响应开始,并讨论了逐渐发展的基因组变化。最后,讨论了多倍体物种形成的宏观进化意义。
多倍体的发生率是80多年来一直受到广泛研究的问题。从20世纪上半叶开始直到最近,进化生物学家已使用基本染色体数量、化石记录和系统发育来理解这种物种形成模式的进化意义。基因组学在某些重要方面对这些分析进行补充,最显著的是阐明了陆地植物进化史上古多倍体化的特征,包括苔藓植物,蕨类植物和石松植物,裸子植物和被子植物。这些古多倍体化事件第一次发生于所有种子植物的共同祖先(约3.19亿年前),再次发生于所有被子植物(约1.92亿年前。这些发现形成了多倍体研究的新问题,越来越关注祖先WGD作为进化多样化催化剂和生态创新的作用。

除了识别古多倍体化事件外,基因组学还成功地确定了最近的多倍体化(新多倍体化;图4),这对我们理解多倍体物种形成具有重要意义。当分类学分支模糊时,基因组分析通常能够辨析那些形态差异较小的新多倍体。隐性多倍体说明了为什么WGD的物种形成率被低估,并且它们可以提供多倍体物种形成模式的信息。例如,一般认为杂交多倍体(异多倍体)比非杂交多倍体(自多倍体)更频繁,后者通常在形态上不易分辨。来自系统发育学和细胞学的证据改变了这一观点,表明自多倍体和异多倍体一样常见。目前对新多倍体的了解是有价值的,因为它们的亲本物种可能仍然存在,允许实验重复。通过将已有的多倍体与最近或合成的多倍体进行比较,可以将生态和WGD的直接基因组效应与多倍体物种形成后的进化效应区分开来。

 Image4| 连续多倍体物种形成事件和相关的基因组大小动态。顶部的系统发育展示了一次古老的同源多倍体物种形成事件(1)和一次最近的异源多倍体物种形成事件(2)。偶尔发生的灭绝事件用“X”标记。注意,虽然古多倍体事件可能是自交或异源多倍体的结果,但对古多倍体来说,区分这两种往往是不可能的。图的中间部分显示了系统发育树中标为深红色物种的基因组大小动态。在基因组学数据的帮助下,可能取得的进展包括鉴定陆地植物的古多倍体化事件,了解多倍体化和长期多倍体进化机制,以及鉴定新多倍体并研究与WGD相关的早期减数分裂问题。
除了追溯多倍体外,基因组学还为回答20世纪初植物学研究人员几乎完全无法回答的问题奠定基础。例如,在多倍体形成早期,如何克服加倍染色体减数分裂正确的问题?虽然在一些系统中,营养繁殖或无融合生殖可以促进新多倍体的建立,但有性生殖需要稳定的减数分裂才能实现高可育性。直到最近,该领域的研究仍有限,最著名的例子莫过于小麦Ph1基因座。基因组数据可对WGD的适应进行更深入的研究。例如,在同源四倍体拟南芥中,通过基因组发现了八个增加二倍体和四倍体间等位基因频率差异的减数分裂基因。这些等位基因在二倍体中低频存在,因此在多倍体物种形成后很容易被选择,并且也可以通过适应性渗入在物种之间转移。
在基因组学应用之前,许多植物物种不被认为具有多倍体起源的原因之一是基因组大小。例如,在仅考虑被子植物内发生的事件的情况下,至少经历了三轮WGD的拟南芥,其小基因组仅为~135Mb。通过表征多倍体的长期进化及二倍体逆转,基因组学为这些明显矛盾的发现提供新见解。多倍体化的过程要经历数千或数百万年,即使是同一多倍体化的后代,发生速度不同,其机制也是多样的,包括基因组重排和通过丢失冗余基因和基因组区域而减小基因组。除了促进二倍体样细胞遗传学行为的转变外,二倍体还有助于倍性水平内的生态多样性和物种形成。例如,尤其当新的多倍体迅速分离成不同群体时,重复基因的不同分辨率(如不同拷贝的丢失)可能导致杂交不育和RI进化。
与直接由WGD引发的物种形成不同WGD后杂交不育的进化可在宏观进化尺度上促进物种形成和多样化。然而,包括对重复基因的选择力降低和更高的灭绝率在内的其他因素可能会抗衡这些影响。事实上,最近的多倍体与其同源二倍体之间的比较支持多倍体分类群的多样化率较低。这些发现表明,大多数多倍体物种形成事件并不是长期进化的驱动力。然而,当多倍体物种确实存在时,其结果显而易见,如菊科的WGD发生在大物种辐射前不久。

5. RI的遗传学

随着谱系的分化,遗传差异导致RI,这一过程最终中止基因流动。识别RI基因以及表征促进其分化的驱动力一直是物种形成研究的核心。基因组学在RI基因的鉴定中发挥着越来越重要的作用,对于解析相关进化,尤其是导致杂交不亲和的基因来说,基因组学是必不可少的。在本节中,此文章讨论了鉴定植物RI基因的方法,并说明了基因组学在其中发挥着愈发重要的作用;然后,重点阐述了基因组学被用来推断这些基因是如何进化的例子。需要注意的是,此处使用术语“RI基因”而不是“物种形成基因”,因为很难确定遗传多态性是否在两个谱系(lineages)分离过程中起作用,或者它们是否源于物种形成之后。
迄今为止,在植物中已经克隆了数十个参与RI的基因。这些基因参与控制授粉前(如花色或开花时间)、授粉后受精卵形成前(如排斥来自另一物种的花粉)或受精卵形成后(如杂交致死或杂交雄性不育)。这些基因中的大多数是使用正向遗传方法鉴定的,即通过定量性状基因座将已知参与RI的性状和特定的基因组区域相关联,随后通过精细作图、遗传转化和表达分析定位基因。原则上,这种方法不需要基因组,甚至不需要分子标记。例如,在植物中发现最早的RI基因之一anthocyanin2(牵牛花中促进传粉者转移的花色基因),使用表型标记进行定位,使用转座子标记进行克隆。然而,参考基因组序列极大提高了图谱绘制效率,因此,目前大多数已知的RI基因都来自具有完整基因组和分子资源的物种,主要是拟南芥、水稻沟酸浆属
除了提供高质量的参考序列外,基因组学为正向遗传学做出的主要贡献是使用高通量测序来鉴定遗传标记。包括测序分型、限制性位点相关DNA测序、RNA测序和全基因组重测序等方法,使标记鉴定和基因分型可在一步中完成。此外,标记物在全基因组范围内被频繁鉴定。总之,与更传统的遗传标记相比,这些优势提高了作图效率和准确性,从而大大加快了包括RI基因在内的作图工作。例如,Chae等人在一项研究中绘制的拟南芥杂交致死的七个基因座,主要使用F2群体测序的基因分型进行绘制。同样Wilkinson等人通过对不同生态型千里光F11杂交群体的向重力分布进行基因分型,确定了向重力(和相关杂交坏死)的候选基因。除了表征遗传变异外,RNA测序更适用于筛选正向遗传中获得的候选基因列表。如沟酸浆属,缺乏关键光合基因表达的杂交种是不育的。
尽管正向遗传学在识别RI基因方面取得进展,但在许多重要方面仍受到限制。首先,具有定位群体的种群多限于可以在温室或试验田中生长和开花的物种,而开花早的物种更受青睐。第二个,性状必须有明确的表型和已知或假设在RI中有作用。这种局限性使得发现的性状具有偏向性,如花色、开花时间、自交、杂交致死和部分杂交不育,而仅在某些条件下表达的不相容性(如涉及地方性适应的性状)通常会被遗漏,多基因性状也是如此。第三,F1完全不育或隐性基因也被遗漏了,因为在这种情况下,很难或不可能得到重组定位群体。虽然分类学上的偏向性会对我们理解植物中RI的遗传学产生一定的影响,但正向遗传学导致的选择性偏差更不利于解答重要问题,如RI是否真的通过具有大效应的基因座进化,或者具有多基因基础。
然而,基因组学可以弥补正向遗传学的局限性。如,拟南芥子叶期F1代杂交坏死的案例,Barragan等人通过全基因组关联分析克服了无法形成F2作图群体的问题;利用亲本材料的突变信息,发现拟南芥大量杂交F1代不育的发生与致病基因座有关。尽管仍然局限于表型明显的不亲和性,但全基因组关联研究在鉴定杂交不亲和性基因座方面有很大的前景,尤其是在天然杂交中。另一种基因组学方法是使用不同物种或群体之间的群体基因组来寻找具有自然选择信号的基因组区域(如分化增加、多样性降低、连锁不平衡增加和基因表达差异)。在沟酸浆属中,被鉴定为花色素沉着差异候选基因的R2R3-MYB转录因子MaMyb2已被证明位于基因组分化峰。使用群体基因组数据进行基于基因的Hudson-Kreitman-Aguade检验,通过亲本隔离基因的不同等位基因的遗传性发现了一个与亲本生殖隔离的Ostryopsis杂交种。在胡杨中,对胡杨和樱桃杨进行了基因组鉴定,发现了几种高度分化的蛋白,这些蛋白被认为参与了谱系间受精后的生殖隔离。与表型或环境数据相结合的全基因组关联分析,基因组功能更加强大。例如,通过开花时间的鉴定,FLOWERING LOCUS T的同源物已被证明有助于白杨和向日葵生态型的形成。
尽管基因组方法已成功鉴定了区分生态型或物种的候选RI区域,但在大多数情况下,潜在基因和突变尚未得到功能验证或与RI有关,原因有很多。首先,基因组中的异常基因座不一定与RI相关;其次,基因组数据很难预测等位基因或基因间的不相容性。因此,仍需功能分析来验证候选RI基因。即使在模式物种中,这也是耗时且具技术挑战性的,由于RI的多基因结构及RI潜在突变的多样性,从氨基酸取代到SVs的调节变化,会使其变得更加复杂。最后,即使RI基因得到功能验证,也很少进行实地实验来充分验证它们在RI中的作用。

虽然鉴定RI基因的纯基因组学方法仍有困难,但群体基因组学分析可以对已知RI基因座的进化史提供关键见解。例如,杂交坏死通常是由免疫系统基因之间的Bateson-Dobzhansky–Muller不兼容引起的,由于病原体不同,通过平衡选择形成免疫系统基因的进化动态。最有力的证据来自对一年生十字花科大花辣椒中两个免疫系统基因NPR1RPP5的群体基因组学研究。平衡选择在C.grandiflora(一种古杂交种)的NPR1上保留了相容和不相容的等位基因,而选择等位基因则固定在其自交衍生物Capsella rubellaCapsella orientalis中。在Mimulus guttatus中,一个杂交坏死等位基因由于遗传上与被当地选择的耐铜等位基因连锁而被鉴定出来(图5)。控制杂交坏死的基因座(Nec1)与耐铜基因座(Tol1)紧密相连,与两者相连的标记物相对于未连接的标记物表现出高FST(图5)。作用于杂交坏死的选择性相对明晰,但对于其他类别的RI基因(如导致杂交不育的基因)情况并非如此。例如,导致沟酸浆属杂交雄性不育的一个等位基因已经过一次选择性清除s=0.15),但其驱动力尚不清楚(尽管基本上排除了遗传冲突)。群体基因组学分析尚未进行其他几种杂交不育的情况(如水稻)。这些分析将提供重要证据,证明这些基因是否通过基因冲突或其他选择形式进化的。

Image5| 遗传连锁导致的Bateson-Dobzhansky–Muller杂交不亲和性的进化(A)自大约150年前加州铜矿开采以来,Tol1基因座上的一个耐铜等位基因(蓝色圆圈)已在该群体中几乎固定(>99%的频率)。相邻Nec1基因座的杂交致死等位基因(橙色正方形)与耐铜等位基因同时被发现。(B)Nec1等位基因导致铜矿种群植物和非铜矿种群植物的杂交坏死,与几个未知基因座互作导致坏死。

6. RI的遗传变异来源

可以用基因组学解决的物种形成中的另一个重要问题是RI的进化在多大程度上是由新突变引起的,而不是已有变异(即长期变异)。因为来自长期变异的进化速度比新突变更快。长期变异的另一个优点是等位基因较老,可以积累多个有利突变,或通过重组抑制(如倒位)将同时选择的等位基因结合在一起。此外,当起源于基因渗入时,这种等位基因可能已在祖先群体中经过筛选。需要注意的是,虽然适应性渗入的遗传变异不同于种内明显的长期变异,但此处没有区分两者。如果RI是不同自然选择的副产品,那么长期变异的进化可以通过缓解小或隐性效应突变建立所需的条件影响生殖隔离的遗传结构。最后,对长期变异的依赖有望增加进化的可重复性。
突变是遗传变异的最终来源,因此进化是来自长期变异还是新突变是一个时间和地理问题。Barrett和Schluter提出了三条支持从长期变异进化的证据:(1)等位基因存在于祖先或供体群体中,(2)该等位基因比其生态型或物种更古老,(3)该等位基因显示出一种从长期变异演变而来的选择特征。通常,(1)或(2)的推断比(3)更可靠,因为它们没有具体到等位基因的高频机制,并且在很大程度上不受群体结构或种群规模假设偏离的影响,后者可能会扰乱选择性清除信号。此外,只有在最近的物种形成事件中,才能从选择清除特征进行推断,因为选择的基因组足迹会被突变和重组迅速湮灭。
那么,我们从植物物种形成的基因组研究中了解到了哪些变异来源呢?正如预期,长期变异似乎在物种形成事件中发挥重要作用,至少当不同自然选择驱动物种形成时是这样。如美国西南部沙丘向日葵生态型的起源是古老和早期生态型差异,其中与沙丘适应和RI相关的性状与倒位有关。同样,整个夏威夷群岛Metrosideros的适应性辐射形成于祖先变体的反复利用。在拟南芥中,对高海拔和低海拔环境的适应在一定程度上是祖先长期变异重复利用的结果。另外,对适应性渗入或同源杂交物种形成的研究(见基因流动、渗入和杂交物种形成)中,在亲本群体中鉴定了对RI至关重要的等位基因或SVs。最后,长期变异通过产生新谱系间接促进物种形成。一个值得注意的例子是同源四倍体拟南芥对WGD的适应已被证明涉及长期遗传变异。
有充分证据表明RI的进化源自新的突变。最明显的例子是多倍体物种形成(见多倍体物种)的RI是宏观突变(即WGD)的结果。还有证据表明,由基因冲突导致的杂交不亲和障碍往往依赖于新的突变。例如,杂交坏死是由快速进化的抗病基因间的有害互作引起的。同样,遗传因素(如细胞质雄性不育)的传播导致的不相容性通常是新突变的结果。

在大多数情况下,物种形成涉及长期变异和新突变,早期阶段长期变异占主导地位,后期阶段新突变占主导地位(图6)。该现象在处于不同应激诱导物的酵母群体中得到验证:先前存在的变异在一些群体的前30代中已不复存在,这便增加了对后代新突变的依赖。在植物中,从进化的可重复性与遗传距离负相关的观察中推断出长期变异和新突变的相对重要性随着时间的推移而变化系统发育基因组学研究具有预估不同变异来源相对重要性的潜力。对野生番茄分支(茄科番茄)的分析表明了这一点,其祖先的长期变异、渗入和新突变对近期适应性辐射的贡献大致相同。而如果对一个更古老的群体进行类似分析,这些不同变异来源的相对重要性将偏向于新突变。

Image6| 时间和地理对渗入、长期变异的选择以及来自新突变的杂交不相容的影响的假设。几何图形代表遗传基因座。阴影/颜色代表等位基因。每个物种都由几个样本个体表示。每个个体都是基因有两个拷贝的二倍体。紧密相连的基因距离近,较远的基因用//分隔。星形和圆形基因座的祖先蓝色等位基因分别是重要的或有助于在高海拔地区生存。黄圈和红圈等位基因有利于低海拔生存但不能与蓝圈等位基因混合,阻碍了高海拔和低海拔物种之间的基因流动。渗入将黄色等位基因引入祖先群体。此处使用立体效果示例,但这可以用于相同或不同位置上任何类型的不同生态位。

7. 物种形成的种群规模

在20世纪,种群规模的减少对物种形成的影响一直是学者感兴趣和争论的焦点。这是基于以下观察:(1)地方或“萌芽”物种形成很常见,(2)海岛上的创立事件通常会产生惊人的多样性,以及(3)劣势染色体重排产生不同物种,小种群的遗传漂移可以建立这些重排。
在这一时期发展起来的基因漂移形成物种的模型认为,由于祖先种群的庞大规模,它们在进化上是静态的。然而,当少数个体建立了新的(后代)种群时,有人认为遗传多样性的减少可能会打破进化惯性,偶尔会导致RI。例如,Mayr的遗传革命模型假设遗传多样性的突然减少会引发全基因组连锁反应,转向那些在更纯合的背景下有利的共适应等位基因的新组合,并与祖先等位基因产生一定的隔离。其他涉及种群规模突然减少的模型包括灾难性物种形成模型、密切相关的量子物种形成模型,以及founder–flush–crash模型和瞬态模型。
利用理论和实验方法对遗传漂移促进物种形成进行验证。这些研究几乎没有支持种群规模缩小在物种形成中的因果作用。例如,理论研究提出大种群比小种群更能抵抗进化变化的假设此外,实验室内对种群的研究提供了RI可能是种群瓶颈副产品的有限证据。

基因组学可以通过系统发育学和长期种群规模重建的基因漂移来补充物种形成的理论和实验检测(图7)。例如,系统发育基因组学已被用于验证遗传漂移的物种形成预测:后代物种是并系祖先中的单系。在被认为是灾难性物种形成的经典案例Clarkia franciscana中,系统发育学不支持这种系统发育位置并驳斥了物种形成的出现,这与早期基于同工酶的怀疑是一致的。长期种群规模重建同样可以提供信息,尽管这些方法最常用于确定在有或没有基因流动的情况下是否发生分化。相对而言,尽管这种分析具有潜在的效用,但对从物种形成事件重叠的时间点推断有效种群规模(Ne)变化的作用相对较小(图7)。这可能是因为在超过数十万代的范围内获得Ne估值仍有挑战。种群规模模型也可以用来识别与物种形成一致的种群瓶颈。尽管如此,目前少数例子并不支持基因漂移促进形成物种。例如,来自M. guttatusMimulus nasutus或来自C. grandifloraC. rubella的物种形成萌芽期,后代物种中Ne的减少被归因于自交,然后促进物种形成。此外,在像Metrosideros这样的岛屿辐射中,有限的证据表明Ne的减少与岛屿多样化有关。在野生二粒小麦中,近期同域物种形成遵循种群瓶颈,但其他研究表明,RI是由破坏性生态选择驱动的。需要用一致的方法对来自多个系统的基因组数据进行广泛重分析,以表征在物种形成前不久或与物种形成同时发生的种群瓶颈出现的频率。

 Image

7| 基因组学可以通过系统发育和种群重建促进对遗传漂移引发物种形成的研究。此处两种假设,且都导致物种间范围大小和种群大小的同代差异。只有scenario1(左)与基因漂移引发的物种形成一致。在这种情况下,三个物种形成事件中的两个(即speciation 2和speciation 3)可能是漂移诱导遗传变化的直接结果,因为物种形成的时间(灰色阴影)与有效种群规模的急剧下降相吻合(顶部)。与基因漂移引发的物种形成一致,左边的系统发育也将物种A和C确定为并系。

8. 结束语

那么,人们从植物物种的基因组研究中学到了什么关于物种形成的内容呢?对不同种群和物种之间基因组差异的分析表明,无论物种形成的时期或地理位置如何,基因组分化是极其不同的。一些观察以及概念和理论进展,表明导致这种异质性的进化因素是复杂的,而且这种模式对RI基因和过程揭示的内容比预期少。然而,这些研究与高质量参考基因组比较相结合,发现物种间的基因组结构差异要丰富得多(见结构变异),并且在适应性分化和物种形成中发挥的作用比先前预期大得多,尤其对重组抑制的影响。
基因组学也被证明在记录基因流动和杂交方面非常有用。研究证实了植物中基因流动促进物种形成的重要性,证明了渗入的普遍性,并揭示了同源杂交物种形成的新例子,同时对早期的几个实例提出了质疑。同样,基因组研究证实了多倍体物种形成在整个植物历史上的普遍性,揭示了多倍体形成后的许多基因组变化,并对这些变化的时间、机制和结果提供见解。
如前所述,基因组研究并没有提供一种简单的方法来识别最初假设的RI基因和突变。相反,基因组主要是作为一种手段来加快RI基因鉴定的遗传学研究,并确定形成的进化机制(见RI的遗传学)。然而,基因组信息已被证实对阐明适应分化和物种形成的遗传变异的起源有直接作用。一个主要结论是,长期变异在植物物种形成早期发挥重要作用,并对物种形成的可重复性做出了重要贡献;在物种形成后期,新突变占据主导地位。最后,基于大型基因组数据集的物种形成过程的种群规模模型已被证明对物种形成的种群规模重建有巨大潜力,尽管应适当解决混杂变量(如纳入混合种群)估计的偏差。重要的是,迄今为止的种群规模重建研究很少支持早期提出的种群瓶颈和漂移在植物物种形成中发挥重要作用的理论。
此文章也提出了未来研究的几个有希望的途径。目前,从基因组学研究中了解到的关于物种形成的大部分信息来自于SNPs分析。然而,这类研究提供了一个不完整的物种形成过程,因为大部分可能涉及表观遗传和结构变化。如果将表观遗传和结构变异包括在内,未来对基因组分化格局的研究将是最有力的,尽管还需要其他理论、概念和计算技术来充分分析和理解这些数据集。这类研究有望评估可能由TE活性的抑制驱动的表观遗传学变化作为重组修饰因子的作用。
另一个正在迅速填补的空白是,目前对植物物种形成基因组学的了解来自少数几个实验系统。尤其是拟南芥、沟酸浆属和水稻,此外还有向日葵、白杨、千里光和茄的基因组学研究。显然,下一步要将此类工作延伸到其他系统。另外,少有例子表明RI基因得到功能验证,阐明其进化背后的驱动力,并证明它们对自然种群RI的影响。这种垂直研究可以说比文献中的许多水平研究更能帮助我们理解物种形成。拟南芥和水稻中已克隆和表征的许多杂交不相容的群体基因组学分析提供了一个方向,以最小的努力(至少在收集新数据方面,因为这两个分类群都有较大的基因组学数据集)最大限度地了解RI基因的进化。
最后,现已有许多不同植物物种的大量基因组学数据,且可以在NCBI和其他数据库上自由访问。这些数据中的许多还没有从基因组分化、结构变异、选择性清除、渗入、二倍体、变异来源、种群规模历史等方面进行充分分析。应优先对这些现有数据进行仔细和全面的分析,并将这些分析结果与自然种群中的基因流动和RI联系起来

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多