分享

一作解读 | 小麦品种科农9204基因组及氮高效分子解析

 洋溢九洲 2022-07-28 发布于河南
基因组序列信息对于小麦遗传学、基因组学及分子育种研究至关重要。伴随高通量测序技术及基因组组装技术的快速发展,多个高质量二倍体、四倍体及六倍体小麦基因组序列信息相继释放,基于重测序的小麦基因组变异数据库已经公开。利用氮效率相关基因组变异信息解析小麦氮高效分子机制对高产高效小麦品种分子设计具有重要意义。
科农9204是中科院遗传与发育生物学研究所利用八倍体小偃麦培育的高产小麦品种,其1B染色体携带了源于黑麦1RS的染色体短臂。1999年遗传发育所李振声研究员和童依平研究员比较了12个冬小麦品种的氮素利用效率和吸收效率,发现科农9204是唯一同时具有较高氮素吸收和利用效率的品种。目前以科农9204为亲本已经选育出了科农199 、冀5265 、科农2011和石麦28等主栽品种。
2022年7月21日,中国科学院遗传与发育生物学研究所小麦研究团队联合鲁东大学麦类分子育种创新团队、中国科学院计算科学研究中心在植物学领域顶级期刊Molecular Plant发表了题为 Comparative genomic and transcriptomic analyses uncover the molecular basis of high nitrogen use efficiency in the wheat cultivar Kenong 9204的研究论文。本研究完成了科农9204的全基因组测序和从头组装(图1),系统鉴定了一批氮吸收及氮代谢相关基因,在全基因组水平解析了科农9204氮高效分子调控机理。通过与对照品种京411比较,明确了科农9204氮胁迫关键时期及对应的关键代谢通路,从全基因组水平阐述了科农9204氮素高效吸收和利用的重要分子基础。
1、科农9204基因组组装、注释和分析
结合 DenovoMAGIC2 PacBio多种测序技术,获得了科农9204高质量基因组序列信息,基因组全长14.77Gb,包含0.11Gb(0.74%)未知碱基序列。scaffold N50 为21.87 Mb,contig N50为366 kb。基于Hi-C技术将14.24 Gb组装序列分配到小麦21条染色体上,利用前期构建的KJ-RIL群体高密度遗传图谱对组装序列进行评价,发现其具有良好的共线性关系。Hi-C结果分析表明,小麦科农9204染色体形成了与大麦和玉米相似的三维U型结构,即典型的“Rabl”构型,并对21条染色体的compartment进行了深入分析。
基因组注释共检测到3,821,926个转座子,占科农9204基因组的83.92%。共预测到110,326个高置信基因和103,601个低置信基因。根据基因序列及注释信息,鉴定到882个氮代谢相关基因(NMGs),涉及到硝酸盐转运蛋白家族基因、硝酸还原酶基因家族、氨转运蛋白家族、氨同化相关基因家族、氨基酸转运蛋白家族及一些氮代谢转录因子,相关NMGs基因主要位于染色体的长短臂的两端。
图片1:科农9204氮高效的大田表型及基因组结构
2、科农9204与中国春及其他禾本科植物的基因组比较分析
与中国春参考基因组进行比对分析,其中46%的科农9204高置信基因在三个亚基因组同源染色体呈现为1:1:1分布,其中34%是位于同源染色体上的共线性基因,这一比例显著低于中国春相关数据。检测到659个亚基因组内部各染色体之间的基因易位现象,其中将近一半发生在4A-5A染色体之间。此外,还鉴定到了646 (n:1:1)、758 (1:n:1)和786 (1:1:n) 个基因在A、B或D亚基因组内的染色体发生了复制,2,393 (0:1:1)、2,361 (1:0:1) 和1,845 (1:1:0)个基因在亚基因组内发生了丢失。三个亚基因组中,D基因组存在较多的基因复制事件和最少的基因丢失事件,进一步说明D基因组的保守性和重要性。基因组结构变异分析共检测到55个染色体内部倒位的变异事件,倒位染色体长度变异范围为1 Mb到132 Mb之间,其中A基因组倒位事件有22个,B基因组26个,D基因组最少,仅有7个,进一步说明了D基因组染色体结构最为稳定。
科农9204从其亲本冀麦38与绵阳75-18继承了1BS染色体上的黑麦易位系。与中国春、黑麦基因组进行序列同源性及共线性分析,发现科农9204的1BS的0-283 Mb组装序列与黑麦1RS存在较强的序列同源性,而之后的序列与中国春1BL存在更高的序列同源性和相似性,证明了科农9204为1BL/1RS易位系,也从基因组水平证实了1BL与1RS易位连接点在283 Mb到284 MB的区间内,该位置与着丝粒位置信息一致。
对1BS预测的高置信基因进行分析发现,486和308个基因在中国春1B中存在高度或中度的同源基因,214个基因在中国春1B染色体没有检测到其同源基因,其中71个基因在中国春中表现为提前终止变异,43个基因在中国春中表现为移码突变。对来自黑麦1RS的特异基因进一步分析发现,这些基因多富集在ATP酶活性GO分类,其与植物的免疫抗病调控有关,这也可能是1BL/1RS易位系被育种家广泛利用的原因之一。
将科农9204基因组与中国春、野生二粒小麦、乌拉尔图小麦、山羊草、大麦、短柄草、水稻、玉米、高粱基因组进行比较,发现10个基因组的491,979个基因被分为31,536个家族,其中11,400 (36.1%)个同源基因在10个基因组中均存在,218个基因家族仅存在于5个小麦族基因组中,其中一个基因家族包含12个高置信的硝酸盐外排转运蛋白(NAXT)基因,其主要功能是负责控制根柱鞘中硝酸盐的外排和木质部中硝酸盐运载。6个NAXT基因位于科农9204的7BS-4AL易位染色体,其中5个NAXT基因为1个原始NAXT基因复制形成,另外1个基因保留原始NAXT基因形式没有改变。上述6个NAXT基因在野生二粒小麦中均存在,说明NAXT基因的复制事件发生在野生二粒小麦形成过程中,并且在小麦的进化和育种过程中被得以选择保留。
3、科农9204氮高效分子调控机制解析
高亲和硝酸转运(NRT2)基因家族在低氮条件下的上调表达可提高氮素的有效吸收,对维持品种耐低氮胁迫至关重要。分析结果证明,二倍体和六倍体小麦基因组NRT2基因在进化过程中发生大量扩增,其基因数目分别是短柄草、水稻、高粱、玉米等禾本科植物NRT2基因家族数目的2倍和9倍,也间接证明NRT2基因家族的扩张是发生在小麦族进化时期。进而构建了NRT2基因家族在高等植物的进化树,分析了NRT2基因家族扩展事件及关键时间节点(图2)。利用qPCR技术研究NRT2基因在低氮及盐胁迫下的表达特征,发现后期扩增的NRT2基因对低氮及盐胁迫相应不同,发生了功能分化。NRT2基因家族在扩张过程中的功能分化可能与小麦族对低氮胁迫及其他非生物胁迫的适应性增强有关。
利用ATAC-seq技术,预测了44个NTR2家族成员顺势作用元件的开放区域,并比较了高低氮条件下20个低氮敏感响应NRT2及24个低氮不敏感响应NRT2转录起始位点开放性的差异。发现20个低氮敏感响应NRT2转录起始位点的开放性在低氮条件下显著提高,而低氮不敏感响应NRT2转录起始位点的开放性在低氮胁迫下没有发生变化,证明不同氮环境可通过影响NRT2转录起始位点的开放性进而调控NRT2基因的转录表达。同时还对低氮敏感响应的NRT2的顺式作用元件和反式作用因子进行了分析,发现G2-like转录因子 和 Nin-like (NLP) 转录因子参与了NRT2的低氮诱导表达。

图片

2NRT2基因家族在麦类作物基因组进化过程中的扩增及功能分化
低氮胁迫主要通过降低亩穗数、穗粒数来降低产量。与科农9204相比,京411的穗粒数在低氮条件下降幅显著,表现为较强的低氮胁迫敏感性。因此,他们在转录组水平上系统分析了科农9204和京411穗部基因在低氮和高氮条件下的时空表达特征。基因共表达网络分析显示,科农9204组织和发育阶段特异性高表达(TDHE)基因数目在高、低氮条件下无明显差异,而京411的TDHE基因数目在高低氮条件下存在较大变化(图3)。对TDHE基因进行了功能富集分析,发现不同发育时期TDHE基因功能基因富集存在差异,在穗发育阶段主要涉及细胞分裂和光合作用相关基因,在籽粒发育阶段主要富集的是氮代谢和碳代谢通路相关基因。同时发现细胞质定位的谷氨酰胺合成酶(GS1)在小麦籽粒发育过程中的氨同化作用比质体定位的谷氨酰胺合成酶(GS2)更重要,鉴定到了11个在共表达调控网络中与GS1(TaKNGS-4B2) 紧密连接的转录因子和4个氨基酸/多胺/组织定位(APC) 转运蛋白。
对高低氮大田环境下种植的科农9204和京411单株穗数及穗粒数的分析,结果表明科农9204的单株穗数及穗粒数受低氮胁迫的影响显著低于京411,表现为较强的低氮胁迫耐受性。对科农9204和京411在高低氮环境下拔节期穗部组织的各发育阶段特异性高表达(TDHE)基因数目进行比较,发现科农9204高低氮环境下TDHE基因数目没有发生显著变化,而89%的京411的TDHE基因在低氮条件下表达量显著降低(图3)。功能富集分析显示,拔节期穗部的TDHE基因主要与激素反应和生长素应答因子有关,并且京411中几乎所有的(21/24)生长素反应因子(ARF)基因在低氮胁迫下下调表达,但在科农9204中仅有7个ARF基因在低氮胁迫下下调表达,暗示低氮胁迫可能通过降低京411拔节期穗的生长素水平进而对穗发育产生不良影响,最终降低穗粒数。
进一步分析显示,组蛋白编码相关基因在拔节期穗部组织TDHE基因中发生富集。对科农9204和京411在高低氮条件下307个组蛋白相关基因的表达变化规律的分析显示,京411拔节期幼穗组蛋白基因在低氮条件下显著下调,而科农9204在高低氮条件下的表达没有表现显著变化。共表达网路分析结果显示,组蛋白基因在低氮条件下与生长素应答因子基因、细胞周期相关基因和编码转录因子基因的连接度显著降低。进一步分析证明,京411在低氮条件下可能因A-, B-, D-type细胞周期蛋白和B型细胞周期蛋白依赖性激酶的表达变化,影响到其细胞分裂,进而影响其幼穗发育及穗粒数。
对开花后14天、21天和28天籽粒中高低氮条件下差异表达基因进行分析,结果显示,京411在低氮条件下21天和28天籽粒中特异性高表达(TDHE)基因数目显著增加。进一步分析显示,低氮条件下科农9204籽粒高表达基因在京411中出现表达高峰前移的特征,而在高氮条件下则不存在相关现象。功能富集分析显示,这些表达高峰前移的基因在籽粒灌浆过程中细胞壁的形成和重构中发挥重要作用。

图片3:小麦响应缺氮的关键发育时期和相关的主要代谢途径

综合组学和氮素积累等生理学数据,显示在生殖发育阶段科农9204比京411具有更高的氮利用效率;发达强壮的根系,以及根系形态建成和营养吸收相关基因的高表达支持KN9204比J411具有更强的氮吸收效率。由此推断,KN9204氮高效应该是多方面调控的综合表现(图4)。

图片

4:科农9204氮高效的遗传及分子调控模型
总体而言,该研究中获得的数据为理解小麦氮高效的分子机制提供了新的观点,为培育氮高效的小麦新品种提供了有价值的基因组资源。此外,目前基因编辑的遗传转化和组织培养技术比较成熟的小麦品种'科农199’也是KN9204的衍生后代品种,科农系列小麦品种基因组的释放为相关的研究提供了近缘参考基因组。此外,团队成员长期围绕科农9204高产氮高效遗传机制开展相关研究,创制了包括科农9204×京411(KJ-RIL)群体在内的多套作图群体,挖掘了一批高产、氮高效QTL位点,本研究为相关QTL的克隆和分子调控机制解析奠定了良好的基础。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多