分享

中国科学院北京基因组研究所暨国家生物信息中心于军研究团队发现原核生物基因组重组在大肠杆菌物种形成中的决定作用

 医学abeycd 2020-12-21

物种起源一直是地球上芸芸众生多样化(Diversity)和变演(Evolution)的核心问题之一。基因的变异和基因组的重组是物种起源和变演的内因和原动力。一般说来,变异作为基因型的物质基础,发生于所有生命体的遗传物质——DNA或者RNA之中,作为“信息流”(Information Track)而在变化中代代传承,孕育着生命体的遗传多样性,或分流(趋异,Divergent Evolution),或汇聚(趋同,Convergent Evolution);自然选择,作为外因和环境的合力,以优胜劣汰为原则,展示出由基因型和环境共同塑造的各种表型,这些表型又会有不同的形式,有的持续遗传,有的跨代遗传,有的表现为某种可塑性,作为可塑流(Plasticity Track)的可观察部分。

基因组的重组是在基因变异的基础上更高层次的杂合性(Heterozygosity)组合,即将个别等位基因的变化“集体”迁移、集合、乃至剔除。这样的重组一般发生在有性繁殖的过程中,通过减数分裂和染色体的部分交换,利用创造杂合个体、扩大群体中的个体数量等途径创造更复杂的遗传多样性(Genetic Heterogeneity)。因此,染色体数量和多基因结构是遗传范畴中可塑性的突出案例。对于无性繁殖的单细胞原核生物,比如细菌(也包括基因组更小的病毒)而言,重组在物种起源和变演中的作用则一直模糊不清、争议不断。
传统观点认为,细菌在传代过程中(比如复制后尚未分离的染色体)的基因重组率极低,基因组的变化主要是通过横向基因转移来实现,比如利用与穿梭中的噬菌体和质粒的整合性重组来实现。这些偶然发生的基因组重组常常会打乱基因组趋异变演所形成的树形结构,导致系统分类的混乱。由于NGS技术的突飞猛进,近年来研究发现,细菌的基因重组率远高于预期,并达到一种类似于有性繁殖的高重组率状态。那么高重组率的作用是模糊还是清晰物种间的界限?在物种内的种群之间是促进还是阻遏新种的形成?新种形成的原动力是什么?地域隔离对无性繁殖的生物和有性繁殖的生物在新种形成中的贡献是一样的吗?

针对以上疑问,近日,北京基因组研究所于军团队利用二代、三代测序仪产生的综合性(利用二代测序的高覆盖度提高精准度,利用三代测序的长读长实现连续性)数据,完成了逾百株来自世界各地、不同脊椎动物宿主(包括人类在内)的大肠杆菌(E.coli)高精准度基因组完成图(Complete Genome)。通过基因组序列的详细比对,构建了真实可信的大肠杆菌种内种群的系统发生树,并结合生化检测验证了系统发生所形成的种群与种群间表型的差异,并定义了这些差异的生理学和分子生物学属性。该研究成果发表在生物信息学领域杂志Briefings in Bioinformatics上,题目为“A fine-scale map of genome-wide recombination in divergent Escherichia coli population”[1]

图片
文章发表在Briefings in Bioinformatics
研究者们将大肠杆菌分为活泼型(Vigorous, Vig)和懒惰型(Sluggish, Slu)两个种群,代表独立的种群分化,并指出种群对于营养来源的分工应该是初始分离的基础—包括由营养与代谢的分工导致基因组组织结构的分化和固化等—也可能是新物种形成的出发点和基础。这一假说挑战了传统的地域隔离理论,即地域隔离造成的基因交流的阻滞和新物种形成。研究者们通过基因组之间在单核苷酸分辨率的两两比较,确定基因组间重组片段的长度、数量,以及每个基因的可移动性,以高清晰度解析了种群内部和之间的重组频率,阐明了重组在大肠杆菌种群分化过程中的规律。
该研究的起点是获得了具有物种特征和代表性的104株前所未有的高质量大肠杆菌基因组序列完成图和系统变演树。同时,研究人员们还测量了这些菌株的特征性生理生化指标,包括生长速率、趋化特性、运动速度等,还结合其生存环境和基因组中基因和关键变异信息,发现大肠杆菌两大种群—活泼型(Vig)和懒惰型(Slu)的各自特征。比如Vig包括了传统大肠杆菌分群的phylotype A和B1,其特征为生长速度快、运动速度快、嗜氨基酸、不能分解双糖,宿主主要来自热、温带地区、多发现于肉食及杂食动物体内,可引起流行性及侵袭性肠道内感染,极少耐药。而Slu包括了传统大肠杆菌分群的phylotype B2,其特征为生长速度慢、运动速度慢、不嗜氨基酸、能分解双糖,宿主多为生活在寒、温带地区的草食及杂食动物,常引起耐药性及肠外感染,极少流行。从基因组组成上来看,Vig和Slu两个种群存在明显差异,包括大量稳定的核心基因以及特异变异,携带不同的代谢氨基酸及糖类代谢相关的基因、耐药基因、毒性基因等,这些基因组特征可以清楚区分两个分化了的种群,很有可能成为两个新物种发生的初始阶段。 
图片
图1. E.coli的Vig和Slu种群的系统发生关系和生存环境差异。
来源:Briefings in Bioinformatics
于军团队的研究手段主要是基因组序列的详细两两比较,确定重组片段的位置和大小,并获得每个基因组间、种群内基因组间和种群间基因组间重组片段的发生和规律(图2A)。首先是种群内的重组片段无论在长度上,还是在数量上都明显高于种群间的重组片段。两个种群内基因组之间的重组片段总长度在0.3~2 Mbp之间,最大可以达到基因组长度(4Mbp)的一半。即使在种群内正常寄生和致病性大肠杆菌之间的重组也非常活跃,重组片段长度与其它种群内重组情况相当,说明正常寄生和致病性之间没有明显的遗传界限。与之相反,种群间基因组重组片段平均长度只有种群内重组片段长度的1/10,且不超过250kbp(图2B)。进一步的分析发现,重组片段的长度与基因组之间的遗传距离显著成反比:遗传距越近的基因组之间,重组越活跃;遗传相距越远的基因组之间,重组越稀少,并在遗传距离跨种群时,重组率出现陡峭下滑趋势(图2C)。以往的模型研究发现,仅依靠该机制(遗传距离与重组率成反比)就可以使种群分开,因此,重组不但不会减缓物种形成的进程,反而会促进物种的分化。
图片
图2. E.coli种群内部和之间的重组情况。来源:Briefings in Bioinformatics
基于重组片段中每个基因的相应结构与功能性分析发现,大部分重组片段的长度约3000bp左右,恰好是典型原核生物操纵子(operon,可自我调控的基因表达单元)长度(图3A)。可见,这些片段其实可以在重组后完好地保存其功能,而它们的功能大多与营养吸收和代谢有关。当研究人员进一步计算每个参与重组基因在所有可能重组事件中真实概率(存在于重组片段中的次数除以在整个大肠杆菌群体中出现的次数)时,这个定义为基因的“可移动性”(0~1之间)在很多基因上数值为零,即这些基因从不参与重组事件。另一个极端是有些基因却永远存在于重组片段中。因此,基因的可移动性与其在大肠杆菌群体中的普及性成反比,对于普及性为100%的核心基因来说,几乎从不参与重组,而普及性相对较低的基因,如耐药基因等,移动性就很高(图3B)。这些现象说明近缘个体基因组之间虽然重组非常活跃,但很少涉及具有核心营养物代谢、运动调控功能等基因,从而保持供体和受体基因组之间整体功能的稳定性。这个现象验证了研究团队2014年提出的原核生物(尤其是真细菌)基因组组织框架(genome organization framework, GOF)的概念[2]在GOF概念中,基因组是由两部分基因组成:基因组组织框架基因(cGOF-associated genes,也称为clade-associated genes, CAG)和可移动基因(clade-associated-variation-containing genes, CAV genes)。前者的结构相对稳定,是由泛基因组研究产生的核心基因来界定,所以称为“核心基因界定的基因组组织框架(core-gene-defined genome organizational framework, cGOF)”;后者是指在cGOF框架中可以插入重组片段的特定位置和在这些位置上发现的基因,由于对它们种群特征性变异(相同的基因当时属于不同的种群)加以识别,所以也叫做CAV基因。研究者们发现,在Vig种群中显著富集的CAG基因在Vig群内部的移动性显著低于其在Slu群中的移动性;同样,在Slu种群中显著富集的CAG基因在Slu群内部的移动性显著低于其在Vig群中的移动性。这两个趋势说明在某个种群明显富集的CAG基因参与了该种群的核心生物学功能,因为受到功能选择而很少被重组,而当其处于其它种群基因组中时,因为生物学功能并非必需,受到的选择压力较小,而更易被宿主菌再次重组(图3C)。对于Vig和Slu种群都重要的框架基因(CAG基因)则在两个种群中的移动性都极低,且两群之间没有差异(图3D)。
图片

图3. 基因移动性收到基因功能重要性的影响。来源:Briefings in Bioinformatics

综上所述,研究者们通过系统性、精确序列定位研究描述了种群内部在物种分化初始阶段的基因组重组情况,阐述了基因组重组在物种形成中的核心作用。从基因型和变异出发,遗传距离是重组率的决定因素。遗传距离越近的基因组间重组越活跃,而不同种群间的重组率差是促进物种形成的关键动力。从表型和功能出发,基因是否被重组受到功能性的选择,功能越重要的基因重组概率越低,从而保障基因组整体营养代谢和运动等优势功能的稳定。这些发现系统地回答了重组在细菌进化中的作用,拓展了遗传学界对于物种形成机制的认知水平。
据悉,于军团队20多年前就开始对细菌抗性基因[3]、基因组(中国科学家发表的第一个细菌基因组完成图[4])、宏基因组[5]和泛基因组[6]研究,并长期从事原核生物基因组结构与变演原理和规律的研究[7],从理论创新到研究工具与方法[8]开发,建树颇丰。该研究的第一作者康禹副研究员耗时多年的研究成果推翻了人类宏基因组的永久性寄生特征,提出了环境微生物群落的固化性地域分布。其理论的进一步完善和验证,以及真正的实用价值有待于新的思考和发挥。比如,这一理论可以解释中国各种白酒、米酒香型的地域性、固化性,以及中药植物的道地性,也对于微生物群落的生态研究开辟了新的思路。

参考文献:

[1] Kang et al. (2020). A fine-scale map of genome-wide recombination in divergent Escherichia coli population. Briefings in Bioinformatics. Bbaa335. 2020. DOI 10.1093/bib/bbaa335.

[2] Kang et al. (2014). Flexibility and symmetry of prokaryotic genome rearrangement reveal lineage-associated core-gene-defined genome organizational frameworks. mBio.;5(6):e01867.

[3] Wang et al. (2014). Heteroresistance at the single-cell level: adapting to antibiotic stress through a population-based strategy and growth-controlled interphenotypic coordination. mBio 5(1):e00942-13. doi:10.1128/mBio.00942-13.

[4] Bao et al. (2002). A complete sequence of Thermoanaerobacter tengcongensis genome. Genome Res 12:689–700.

[5] Jia et al. (2013). The intestinal metagenome of red palm weevil (Rhynchophorus ferrugineus). Envir Microbiol  15(11):3020–3029.

[6] Zhao et al. (2012). PGAP: Pan-Genomes Analysis Pipeline. Bioinformatics. 28: 416–418.

[7] Wu et al. (2014) The quest for a unified view of bacterial land colonization. IMSEJ 8:1358–1369.

[8] Shi et al. (2019). Microfluidic-based enrichment and whole-genome amplification enable strain-level resolution for airway metagenomics. (2019) mSystems. 4 (4) e00198-19; DOI: 10.1128/mSystems.00198-19.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多