分享

?重磅||环境型鉴定解码环境对作物的影响(二)

 东远 2017-04-02


编辑 | 新锐恒丰研究院

来源 | 徐云碧

作者 | 徐云碧

翻译 | 桑志勤 许诚

校对 | 徐云碧


前言


本文是徐云碧老师的《环境型鉴定解码环境对作物的影响》文章的第二部分


4.  作物模拟和表现型预测


4.1 模型


作为第三种鉴定(分型)技术,环境型鉴定可应用于作物科学的许多领域(图2)。其应用之一就是作物模拟和表现型预测。通过将环境型效应作为一个新组分,表现型可以分解成基因型效应(G)、环境型效应(E)、GEIGE)和试验误差几个部分:P=G + E + GE + error。


在获取基因型和环境型数据后,G以及表现型可以进一步分解。 可以分解为几个主要组成部分,每个部分又包含若干重要的环境因子。除了作物管理(M),作物生长过程和社会经济因素同样可以作为 的一部分。对于杂交作物,可以依据自交系和杂种来预测它们的表现型。同样基于自交系和杂种对环境因子的反应,也可以估算E和一般配合力(GCA × E)和特殊配合力(SCA × E)之间的互作。


表现型预测可以以三种方式进行,即新基因型在已知环境中的表现,已知基因型在新环境中的表现,在新基因型在新环境中的表现(Bustos-Korts 2016)。通过引入协变量和条件变量,可以将表现型预测进行简化。例如,可以将已知的土壤性质和质地等作为协变量,管理措施作为条件变量,并通过改进建模和模拟方法来优化表现型预测。精细的栽培管理和精确的环境型鉴定可以提高预测的准确性。如果 和 GEI 对表现型贡献相对较小,则表现型可以主要由基因型来进行预测。在控制得比较理想的环境中,我们可以实现对主要环境因子均一且良好的控制,进而消除绝大部分的 和 GEI 。这种情况下,大部分的 和 GEI 可以从预测模型中去除。另一方面,在自然条件下对一致、同质的基因型进行表现型预测时,相应的 和 GEI 是可以估计的。在一些主要环境因子固定的情况下,其余环境因子的E效应很小,因此可以进行表现型预测。近等环境系可以用于估计主要的 和 GEI 。在目标环境的几个主要环境因子信息已知时,重要性状的预测结果就具有一定的可靠性。例如,通过研究100 多年间非洲玉米产量和季节性降水量数据,人们发现二者之间存在高度的正相关CIMMYT, internal comm.),因此可以通过季节性降水量数据预测非洲的玉米产量。


表现型预测需要针对单一性状,并依据其理论模型进行。现已提出小麦产量性状和温度适应性的理论模型(Cossani and Reynolds 2012): 产量 = LI × RUE × HI。


其中 LI 是光截获率,主要由即时的地面覆盖和功能持绿性决定; RUE 是光利用率; HI 是指同化产物的分配。 RUE 主要由三个部分构成,光保护、新陈代谢的效率和水分利用率。光保护涉及叶形态、色素组成和抗氧化剂。有效的新陈代谢主要由 CO固定、冠层光合作用、最大光合作用和呼吸作用决定。水分利用率主要与根系相关,而根系需要与植物的蒸发需求和蒸腾作用相匹配。同化产物的分配(HI)包括养分、胁迫信号、调节、灌浆和茎秆碳水化合物的贮藏和再分配(Reynolds 2011)。类似的模型也被用于研究干旱条件下的产量表现。


作为表现型预测领域的一项重要尝试,“从基因组到田间计划”(Genomes to FieldInitiative)利用基因型和环境型去预测性状,进而改良玉米生产(http://www.)。其中一个子课题,“基因组与环境互作”(Genomes by Environment)在加拿大和美国 14 个州的 22 个环境中进行了 31 个自交系和近 1000 份杂交种的表现型测试,以期对环境效应进行评估。同样,由佛罗里达大学与 CG 中心联合提出的“预测目标环境种质表现型的下一代作物育种平台项目”(Next-Generation CropBreeding Platform for Predicting Germplasm Performances in Target Environments),旨在建立一个能够整合基因型、表现型、环境和管理数据的育种平台以及能在不同环境中进行表现型预测的新一代作物模型(M. P. Reynolds 2015,presented at CIMMYT Science Week)。然而,我们还需要投入更多精力去建立一个综合性的预测模型,去揭示作物应对复杂气候灾难的生物学调控网络,这样一种模型可以被用来提高植物对气候变化的适应性(Ahuja等 2010)。


4.2 模型基因型与环境互作


近来,通过 QTL 定位和基因克隆,人们已经对 GEI 进行了相关研究。利用搜集自多点的表现型数据进行 QTL 定位,可以帮助我们理解 GEI 的机制及其重要性。具有加性效应的 QTL 主要有 种类型的 GEI 模式(Des Marais 2013):(a)拮抗多效性,即加性效应的符号或方向发生了改变;(b)条件中性,加性效应只限定于特定环境条件下表现,且具有环境依赖性;(c)差异敏感性,加性效应的大小因环境而发生变化;(d)没有GEI,即加性效应在不同环境下保持不变。最早有关 GEI 的研究简单地比较了 种不同环境下检测到的番茄 QTL Paterson 1991)。在一个只有一个环境因子存在显著差异的可比环境中进行 QTL 作图,可以比较接近真实地进行 GEI 研究。这类研究多与非生物逆境胁迫相关。有人从700多份研究报告中,筛选出与非生物逆境胁迫有关、且 QTL 信息比较完整的37项研究进行了综合分析(Des Marais 2013),结果表明近60%的 QTL 存在拮抗上位性或者由环境特定效应引起的GEI。通过计算不同环境中标准化加性效应间的差值,人们发现用该指标所定义的 QTL 效应可朔性受到上述两种 GEI 互作类型的强烈影响。


有两大类基于基因表达 QTL eQTL)的 GEI 互作分析方法。一种是表达 QTL eQTL)分析,即某一基因在两个不同的基因型中表现出不同的条件特异性表达模式。另一种是全基因组和全环境关联分析,即在许多环境下测定同一个物种许多个体所有基因的表达水平。尽管在一些植物基因定位中,对群体进行了非生物条件控制和性状表达的定量测定,但真正典型的 eQTL 作图依然很少。一个早期比较正式的 eQTL 作图研究是在两种不同磷(P)水平下采集白菜的叶片组织进行分析,一共鉴定出 3226 个与磷反应相关的转录本和几个富集磷代谢相关基因的重要热点区域,但作者并没有进行 GEI 的正式检验(Hammond 2011)。在拟南芥中,对一个RIL群体进行不同的土壤干旱处理,一共定位了几千个响应土壤干旱的基因和几百个主效 eQTL 。然而,只有很少的 eQTL 与土壤干旱处理存在显著的互作关系(Lowry 2013)。越来越多的证据表明,在酵母和果蝇等模式生物中, GEI 是普遍存在的,而且也许可以解释大部分的表现变异(Grishkevich and Yanai2013)。这种互作是由上游调节因子而不是启动子的局部变化所产生的结果;不同的基因表现出不同程度的 GEI 互作,而且启动子结构、表达水平、调节的复杂性等与环境造成的基因差异性调节有关。例如,在干旱或冷害条件下,一致性表达基因和在非生物胁迫条件下呈现差异表达的基因之间具有明显的差异。通常,一致性表达基因往往倾向与共享更多的成对单倍型,具有更低的启动子多样性和更低的非同义多态性(Lasky 2014)。


为了解 GEI 互作的起源、发展和进化过程,需要鉴定控制影响 GEI 表现型的特定基因和功能等位基因的突变体(Des Marais 2013)。我们要确定下列因素中什么是控制植物 GEI 互作的常见驱动因子:基因类型(编码环境感应、生物合成酶、或调节蛋白类型)、基因特性(具有物种内同源性或复杂的顺式调节特性)、突变类型(编码和非编码突变、转座子诱导的突变等)、分子机制(条件依赖性上位性、基因表达、酶活性)。鉴定 GEI 互作的基因还有助于对环境反应相关的平行和趋同进化进行跨世系和检验的比较分析。依赖于光周期、温度、生理信号等环境因子的驱动,植物已进化出控制复杂表现型的调控系统(Kim 2009)。 Des Marais 总结了一些已经被克隆的 GEI 互作基因,并以与开花期、土壤和水分利用相关的基因克隆为例,揭示了在分子水平上, GEI 涉及到的一系列自然变异和机制,包括受体蛋白的非同义改变、转录抑制子的功能缺失突变、合成酶的剪切变异和转录因子的基因重复( Des Marais  2013)。


最近为了预测 GEI,研究人员利用因子回归模型将环境协变量和作物模型整合到基因组选择的框架中(Heslot  2014)。预测作物发育阶段的逆境协变量源自于每天的天气数据,并且已经利用大量的小麦数据进行了模型测试。对那些虽然没有进行观测,但是有气象资料的环境,表现型预测的精确性平均增加了 11.1 %。随着对该模型中 GEI 遗传基础的深入研究,基因型的表现可以根据现有的环境资料(例如过去和未来的天气状况)进行预测。在另一研究中,基于高维度的分子标记和环境协变量之间的交互,研究人员使用协方差函数对 GEI 进行了建模(Jarquín 2014)。研究人员以 139 个小麦品种为研究材料,采用 2395 SNP标记进行基因型分析,并在法国北部的不同环境中进行了超过 年的谷物产量试验。与只包含主要效应的模型相比,包含互作在内的模型预测准确性显著提高(17-34%)。同样通过引入标记与环境互作,人们在全基因组选择中加入了 GEI ,该模型被用来对 CIMMYT 1000 个品系表现型和 GBS 数据的小麦数据库进行分析Lopez-Cruz 2015)。结果表明,与排除了 GEI 的多环境分析相比,该模型具有更高的预测准确度。


目前,在研究 GEI 和表现型的多环境模型中,环境信息都是被作为一个整体,并被看成为模型的一个分量,而没有考虑单个环境因素。这样的评价通常不涉及任何环境型信息,通过假设不同的环境具有不同的环境效应,将遗传和分子水平分析中揭示的差异都归因于 GEI 。随着人们对基因型信息更加全面的了解,我们现在已经可以精确的描述基因、等位基因、单倍型及其对表现型的综合贡献。根据环境型鉴定的结果,我们可以将E解剖为单个因素。将GE的精确测定与精准表型鉴定相结合,可以实现 GEI 的精确评估,并根据建立在GE基础上的理论模型进行 GEI 预测。


4.3 环境响应基因


对环境信号的各种反应可以发生在分子水平。为了开启信号级联反应,在细胞表面的受体细胞必须首先感受到外部刺激。环境响应基因可以分为两大类:一类响应中性环境,如光周期、正常温度和正常的养分水平,另外一种则是对非生物胁迫进行响应,这些非生物胁迫包括干旱、洪涝灾害、极端温度和基本营养元素的缺乏。Alvarez等人(2015)在综述中,用将近一半的篇幅分析了环境刺激是如何影响基因表达的,这种刺激包括非生物胁迫、时间和空间上的环境异质性、宿主-寄主的相互作用、以及潜在的选择性生物和非生物的相互作用。研究近十年来波动的自然环境中转录组的变化发现,胁迫响应对许多类基因都产生了显著影响,甚至微小的环境改变都会对基因及其转录产生影响。对环境变化的响应常常涉及信号通路组成部分的翻译后修饰(Nühse 2007),另外一种途径则是通过调节基因的转录对外部刺激做出广泛响应。表观遗传学可以实现基因的交替表达,进而造成基因表达的可塑性,这包括DNA甲基化、组蛋白修饰和转座子激活(Chinnusamy and Zhu 2009)。小 RNA 群体的变异可以导致转录后调控(RNAi)以及染色质修饰的改变。最后,基因的表达同样受到短重复序列扩张的影响(Nicotra 2010)。通过对大量的遗传样本进行表观遗传学分析,我们可以对家系或自交系产生的空间和时间效应进行分解,从而实现对遗传变异的优化以鉴定高频的表观等位基因。


在管理良好的环境或近等环境下,可以精准分析基因对气候灾难的响应(Izawa 2015)。在田间或自然环境下解码和预测植物的动态变化十分重要。人们已经克隆了许多基因,并在基因功能层面分析了它们对主要的中性和极端胁迫环境的响应机制。通过研究植物在逆境(水渍、干旱、低温、铝毒和盐分)中适应性的遗传机理,我们可以发现这些遗传位点通常与维持植物自身调节所需基因的特征性调节或功能、复制和/或新功能化有关(Mickelbart 2015)。同时,现已克隆了大量与生物逆境耐性相关的基因,包括数十个抗稻瘟病的基因(Chen 2015)。另外,人们已克隆了许多对中性或正常环境因子,如光照和温度等正常条件进行响应的基因,包括光敏色素和温敏色素基因(Matsubara 2014)。


野生植物受到多种波动的环境因素的影响,它们处于复杂的自然环境中,依赖其遗传调控网络发挥功能并不断进化。植物对环境胁迫的适应性是通过对植物生长发育、细胞和分子活性进行协调和精细调节而实现的。作物对胁迫的响应通常伴随着转录水平、蛋白质水平和代谢组水平的改变。植物通过代谢途径对环境胁迫进行适应,其中主要涉及到植物叶片、芽、根、花、苗、果实和结节中各种代谢产物的增加、减少或积累(Ahuja 2010)。作为非生物胁迫的重要调控者, miR156 的异构型可以被热激大量诱导,而 miR156-SPL 可以介导拟南芥中对热激的应答反应,进而在植物发育阶段的一系列逆境中进行应答(Stief. 2014)。植物对环境胁迫的适应性是由许多调节基因、蛋白、代谢产物及其相应的代谢途径或生物网络所控制的。表型在空间和时间上的的表达受到不一致的环境变异的影响,因此在任何统计模型中估计目标参数效应时都应该考虑这一因素(Cobb 2013 Arausand Cairns 2014)。通过对与特定刺激响应相关的基因组结构进行深入研究,可以帮助我们预测植物将采取何种方式对气候变化所导致的不利环境做出响应(Nicotra 2010)。


4.4 生物和非生物逆境胁迫的预测


根据环境因子及其对病害、虫害的显著影响,结合其他相关社会因素,我们可以对生物胁迫发生的时间、地点和分布进行预测(图2)。这种预测同样可用于预报由天气和气候变化所引起的新的非生物逆境。总之,生物和非生物胁迫都可以基于 Gb (生物逆境胁迫下生物因子的基因型), Gh(寄主作物基因型), 及其互作进行预测。E应该包括所有的环境因子(这些因子可以影响作物的生长和产量,并决定着病虫害的流行和结束),也包括这些因子对作物施加的非生物胁迫。


对生物逆境进行预测,主要包括对由天气变化和气候改变而引起的新病虫害种类和小种进行鉴定,并建立模型对新的病害和小种及其传播路径和速度进行预测。预测需要针对主要环境、主要试验站和重要的产区进行。如果能够获取详细的环境型信息,便可以对不同的试验区组、小区甚至个别单株中进行预测。为了预测非生物胁迫,应该事先对环境尤其是主要的环境因子进行特征鉴定。


对生物胁迫可以进行短期和长期预测。短期预测可以指导农民采取相应管理措施以减少由逆境造成的损失。基于现有的和预测的天气数据,再结合历史上病虫害与气候数据间的规律,我们可以对下一个季节或下一年的生物胁迫进行预测。在这类种植季前的预测中,人们更为关注病虫害流行和结束的周期。长期预测对科学家研发相关技术和选育品种从而为疾病、害虫的变化、进化或迁移提前做好准备十分重要。这种预测在很大程度上是基于:历史和目前的气候资料,结合当前的相关知识可以预知的对流行病/害虫、宿主-寄主相互作用(Gb×Gh)、GEIGh×EGb×EGb×Gh×E)方面的影响,再加上宿主植物抵御疾病和害虫的相关基因和基因型。大量的害虫和病原菌调查结果显示,自 1960 年以来病虫害以平均每年 2.7 公里的速度向两极点移动,而在不同的生物类群中这种趋势存在显著差异(Bebber 2013)。研究人员在许多种群中都观察到了这种随纬度的变化趋势,这就为全球变暖导致害虫移动的假说提供了证据。


首次在东非检测到的小麦锈病 Ug99 ,是病害预测的范例之一(Singh  2006)。决定小麦中 Ug99 流向的相关因子已被用于预测锈病的流行。这些因子包括 Ug99 的现状和分布、流行风向、适宜产孢的气候因子、小麦产区(地理分布和对应的人口数量)、历史上东非锈病小种的迁移模式以及现有品种的感病性。通过研发标准化的数据采集体系,建立能够及时鉴定病害的实验室,集中进行数据管理和信息传递,综合监控病原体和宿主并建立预警和预测体系,我们可以构建锈病的监测系统并对该系统进行优化。


因为相关环境是直接的影响因子,所以对非生物胁迫的预测往往更加直接。胁迫因素可能来自于气候(辐射、温度、降水量、空气等),土壤(养分、水分、pH 值、盐度)和水分(Deinlein 2014Lobell 2014L?pez-Arredondo 2014Hu and Xiong 2014)。由土壤因素引起的并且主要被生产活动改变的非生物胁迫,比生物胁迫更加容易预测和测量。气候因子很大程度上可以通过纬度、经度和海拔进行预测。相对于由气候改变引起的长期变化,天气的变化会造成短期的、难以预料的波动。气候和天气的变化都可能引起非生物因子的显著改变,从而给作物施加逆境胁迫。


通过对作物施加诸如臭氧和热这样的非生物胁迫,全球气候变化将对作物生产产生显著影响。依据种植区域的不同,一些作物显示出对单一胁迫诸如臭氧(如小麦)和热(如玉米)的敏感性(Tai 2014)。高温会造成作物减产,未来可以预见到的全球变暖已经越来越引起人们对农作物产量和粮食安全的担忧。在不考虑作物对逆境适应性的前提下,如果 种主要谷物(小麦、水稻和玉米)所处的温带和热带种植区域的温度升高 ,对高温的不适应就会造成作物减产(Challinor 2014)。由于受到全球变暖的影响,在大多数小麦产区,小麦的产量增速放缓,同时全球的小麦生产将依地点和时间的变化而更加波动,温度每上升 ,小麦产量将减少 6 %Asseng 2015)。随着气候变化,欧洲小麦产区将面临更频繁的不利天气。例如,相比于1981-2010年,到 2060 年时, 14 个具有代表性的欧洲小麦产区将会出现更多的不利条件,进而造成更频繁的作物歉收(Trnka 2014)。如果考虑到玉米对高温的适应性,那么在气温增加 的情况下,美国玉米的平均产量损失将从 14 %减少到 6 %Butler and Huybers 2013)。当温度高于 30 时,美国和其他地区(Schlenker and Roberts2009Lobell 2011Lobell 2013)的雨育玉米产量将表现出强烈的与气温的负相关关系。玉米产量同样表现出对由高气压不足所引起的干旱胁迫的敏感性。在大田层面,相较于降低作物对干旱的敏感性,提高作物的耐旱性是一种更容易被接受的农艺措施(Lobell 2014)。


由于生物胁迫和非生物胁迫常相伴发生,因此同时预测所有的相关胁迫十分必要。植物对复杂胁迫的响应在很大程度上是由一些不同的、甚至功能相反的、相互作用甚至相互抑制的信号通路所调控的。因此,不可能从单一胁迫直接推断出多个胁迫同时存在时的响应效应(Suzuki 2014Prasch and Sonnewald 2015Ramegowda andSenthil-Kumar 2015)。通过对基因组学和单个基因的功能分析,人们已揭示了一系列影响植物适应生物和非生物胁迫的信号通路。非生物胁迫可能会对诸如细胞外受体蛋白,R基因和系统获得抗性等抗性组成部分产生复杂的潜在效应,。这种复杂的逆境抗性间的相互对话也发生在激素、活性氧种类、和氧化还原信号的水平(Kissoudis 2014)。对可能存在的复杂胁迫的预测将有助于我们制定新的育种策略,从而实现对单个调控因子的操作和对非互作组分的聚合。


4.5 表现型鉴定和环境型鉴定的整合


精确的表现型鉴定可以对作物建模和表现型预测模型进行反馈校正。作物科学的新趋势是将高通量的精确表现型鉴定与大规模环境型鉴定相整合,并广泛地搜集、挖掘和利用这两套信息。目前,许多自动化、高通量的表现型鉴定系统都是在可控环境下建立的。在重要环境因素可控的生长箱中进行表现型鉴定的自动化平台已经建立(Jansen 2009 Massonnet 2010)。昂贵传感器也已经用于表现型测定,该装置既可以安装在某个固定位置来研究移动的植物,也可以将移动设备固定在植物上,或与植物共置。然而,要实现将理想表现组学研究与环境型鉴定结合起来依然困难重重,这是因为:(1)海量的基因型样本中的每个基因型都需要在一系列的环境下进行检测;(2)需要进行跨越整个生长发育空间和时间范围的、广泛而精细的表现型鉴定;(3)分析成本高。由于成本和表现型鉴定能力的限制,早期的表现型鉴定还没有一个能接近完整的表现组学的要求(Houle 2010)。更具有挑战性的是开发适合于生活周期长、植株高大的植物(比如玉米和高粱)的高通量表现型鉴定平台,这是因为建立适合于高大植株进行长时间生长发育的可控环境是比较困难的。


因为环境型鉴定在高质量的表现型数据获取并进而改进作物研究中发挥着重要作用,所以精确的表现型鉴定需要与精确的环境型鉴定相结合。在不考虑表现型鉴定平台成本和精度的前提下,大田中土壤、水分和肥力的变异会产生误差方差,从而掩盖重要性状的主要遗传变异并降低试验的可重复性(Masuka 2012)。一方面,高通量平台使在更大面积内种植大量基因型进行表现型鉴定成为可能,但另一方面这也增加了土壤的变异。一般来说,一个试验所需的土地越大,就越难找到土壤变异性最小的土地(Araus and Cairns 2014)。


对同一套基因型所产生的表现型和环境型信息进行互补和比较分析,将有助于我们进行作物建模和表现型预测。同步采集的环境型信息与表现型信息,可以互为控制条件,利用一类信息能对另一类信息进行补充和矫正。首先,因为具有显著差异的表现型是由显著差异的外界环境条件及其GE互作所产生的结果,所以在大规模环境中利用基因型同质的材料进行表现型鉴定,可以对试验点内和试验点间环境条件的变异进行检测。其次,在严格控制环境误差的试验条件下,基因型异质的材料间所存在的表现型变异可以归结于遗传因子的结果。第三,在人工创造的近等环境型条件下,或人为控制vs不控制的环境条件下,表现型变异就是基因型对单个目标环境因子的反应。第四,在表现型鉴定试验中,对各种环境因子进行综合鉴定,可以获得不同基因型在复杂但已知环境条件下的综合表现,由此可以确定基因型和环境型及其相互作用对表现型的贡献。第五,使用同质基因型进行长时间表现型鉴定可以揭示环境的动态变化。最近一项对玉米根系区域土壤成分的研究表明,在干旱条件下籽粒产量显著增加,而水分的总体吸收量并没有显著性增加(Reyes 2016)。因此,这种可以测量到的长时期内产量的遗传增益,一定是通过提高玉米对水分逆境的适应性(提高水分利用效率或是增加碳元素向籽粒的分配)来实现的。


4.6 单个测试小区和单株水平的环境型鉴定


对一些主要的环境因子,例如土壤湿度、养分和 pH 值,我们可以在单个小区、单行甚至单株水平进行环境型鉴定。然而,对大多数的环境因子进行真正的环境型鉴定,还有待技术和方法的重要革新和进步。一方面,某些环境因子的变异太小而不能检测,因此现有的设施需要改进以提高灵敏度、精度和分辨率。另一方面,利用精良设备进行环境型鉴定的过程本身可能会显著地打乱或干扰植物的生长发育进程,导致作物周围微环境的显著改变。可以预期的是,作物领域中能够提高测定精度和实现干扰最小化的技术创新,足以实现将环境型信息的搜集从现有的试验站和整个小区水平聚焦到单个测试小区甚至单株水平(图3)。最终我们可以获取基于小区或单株的环境型资料,从而与每个基因型样本的基因型和表现型资料对应起来。


以小区或单株为对象的环境型鉴定的主要瓶颈在于搜集海量数据的高昂成本。由于作物改良和生产涉及大量的品种(基因型),而每个品种又由大量的植株组成,因此环境型鉴定平台和设施的突破性进展对于获得与基因型鉴定和表现型鉴定相匹配的环境型鉴定是至关重要的。如果要进行大规模的测定,必须显著地降低成本,包括更加廉价的高通量精准环境型鉴定设备,人工劳动降低的鉴定程序和高效的信息管理平台。


对作物发育的不同阶段进行环境型鉴定会产生大量的图片和视频,这些数据的格式差异非常大,因此除了技术上的困难和潜在的高成本因素,跨越不同发育阶段和单个试验小区/植株的动态表现型鉴定所产生的海量数据,相比于基因型和表现型数据更加难以管理。此外,研究任何单一环境因素的效应往往意味着我们必须控制其他因子,这对于一些环境因子来说可能是非常困难的。另一方面,为了方便不同研究项目和不同实验室之间进行结果的相互比较,需要对单环境因子的环境设计进行标准化处理,而这种处理需要考虑主要环境因子对其他环境因子的屏蔽效应。


5. 环境型鉴定驱动的精准农业和精准育种


5.1 精准农业


长期以来,人类收集了海量的农业领域的相关数据,包括气候、土壤、病虫害爆发、产量和密度之间的相关性,以及农产品的市场价格等。通过数据整合和模拟分析,可以为规模化农作物生产提供决策上的帮助。在工业化国家,现代农业正在从机械化向信息化转变,特别是利用环境型鉴定为高精度高效的育种和作物生产提供服务(图2)。作为一种农场管理理念,精准农业是基于对田间变异、天气状况和其他外部环境因子的观察、测量和响应发展而来的。一般来讲,它应该包括气候智能农业和集约型农业,主要涉及灌溉、施肥、耕作制度和间作等。作物表现型的变异与空间和时间有关,而这些均与统计分析处理方法相关。精准农业真正的研究任务是开发信息和决策系统,用于农场管理优化投入回报率,同时实现对资源的保护。



(注:图3 环境型鉴定的聚焦过程。通过聚焦过程,将环境型鉴定从试验站和整个田间地块水平发展到对单个试验小区和植株的鉴定是十分重要的,这样搜集的环境信息可以和每个品种或目标植株的基因型和表现型数据相匹配。)


国际种业巨头纷纷投入巨资,将产品研发线延伸至大数据支持下的农业决策领域(Cooper等 2016)。孟山都近年来收购了 Precision Planting 和Climate Corporation两家公司。在这些专业服务公司的指导下,对每 4 英亩设 1 个取样点进行土壤分析测试,以获得各个地块详细的土壤成分数据,从而确定种植不同作物所需要的肥料、水分,并对产量进行预测。利用 Climate Corporation 的气象数据软件,他们可以获得农场范围内的实时天气信息,如温度、湿度、风力、雨水等,这些信息可以用于确定每个地块的播种、收获和耕作时间。


利用大数据支持下的移动设备,我们可以掌握实时的土壤湿度、环境温度和作物生长状况等信息,从而大幅度提高农场管理的精确性。 Precision Planting 专门研发的精准农业配套设备,可以固定在大马力拖拉机后部、同步运行的播种机和其他设备上。通过内置的应用软件,可以确定何时下地查看,何时打药、施肥,以及提供实时的和未来几天的天气数据。这些设备也可以实时采集土壤湿度数据,并用于灌溉决策的确定。面对日益严峻的气候变化,这种实时监控显得十分重要,尤其是在非生长季和人为控制的干旱表现型鉴定中(Araus and Cairns 2014)。大数据支持下的精准农业可以极大地节约化肥、水、农药等投入,对各种原料的使用实行非常准确的控制,从而实现精准高效的规模化经营。通过 GPS、自驾系统、计算机设备和必要的传感器,可以对由大数据软件所提供的信息进行评估、操纵和转移从而实现农业机械的智能化。根据土壤特性,这种智能系统可用调整种植,使播种深度保持一致。它们还可以提高农艺操作水平,例如,通过智能系统将单粒播种率增加到 90 %。


借助历年的气候数据, Climate Corporation 可以提供更加精确的小范围气象预测。其基本模式是将全球种质资源和海量的产量数据与 Climate Corporation 的数据库结合,描绘出信息丰富的美国农田地图,并在此基础上叠加一切可用的气候信息。然后,依靠大数据分析结果为农民提供农作物保险服务,农民也可以通过该农田地图查询农场所处的区域,了解应该种植什么作物和品种、什么条件下作物有好的收成等实用信息。


在公共部门中,由国际玉米小麦改良中心科学家与橡树岭国家实验室和GEOGLAM(马里兰大学)合作开发的一个基于云工具的景观尺度作物评估工具(LCAT),可用于作物土地识别、作物分类、物候学测试、作物状态测量和季节性投入预测。数据资源包括来自卫星(Landsat, Aster, MODIS,VIR, 等)、依靠卫星采集的土壤水分和其他产品以及天气等(Urs Schulthess, CIMMYT,personal comm.)。作为应用实例之一,SPOT卫星可以对N富集区域进行鉴定,产生NDVI地图,进而利用GreenSat计算N利用率。通过测量被作物捕获并用于光合作用的光照,可以直接对地表覆盖进行测量,由此可以对田地内部(而不是处理)的变异进行检测(Ortiz-Monasterio等 2013)。有关作物管理、规划、决策和田间操作的可行性建议可以通过移动手机发布给农民,以指导农民进行养分管理(与田块大小相适应的养分的来源、比例和施用时间,与可用水相适应的施N时间)、立苗(种子来源和播种量)、作物保护(杂草、疾虫管理)、灌溉(数量、时间和频率)和产量估算(收获前和收获后)。


5.2 农艺组学和伴生生物的改良


为了更好的理解农艺措施对作物生长和产量的影响,需要借鉴已经广泛应用于遗传学和作物改良中的基因组学方法以应用于农艺学。农艺组学(agronomic genomics)主要是利用各种组学技术和方法揭示环境因子对主要农艺性状相关基因表达的影响,在此基础上研发调控这些基因表达的高效、节约和环境友好的农艺措施(图 2)。利用 DNA、RNA 和蛋白质的测序技术来测定施肥、灌溉、病虫害防治等农艺措施所引起的基因表达模式和水平的变化,可以揭示这些农艺措施对作物生长发育的影响,也可以直接确定在生物生长所处的复杂波动环境下基因表达模式的各种驱动力。目前,影响转录组的环境因子具有复杂性、干扰性和多重性,这导致人们难于将所有作物管理数据整合起来进行有意义的数据挖掘。最终,农艺组学领域的研究将有助于培育对农艺措施反应良好的作物新品种。


与自然环境下作物在不同的生长发育阶段所经历的复杂环境相比,在人为管理或控制的试验条件下可以更为直接地确定基因表达变化的驱动力。利用从稻田植株叶片收集的转录组数据及其相应的气候资料,包括每分钟间隔所测定的风速、气温、降雨、太阳辐射、相对湿度、大气压力等数据,研究人员建立了由影响基因表达的外源和内源影响因子所构成统计模型。结果表明,转录组动力学主要由内源日照节律、周围温度、植物生长阶段、太阳辐射等几个关键因子所决定(Nagano 等 2012;图 2)。环境刺激的昼夜节点会影响基因的转录,也同时表明受昼夜节律和环境因子激发的不同代谢相关基因的相对影响。在拟南芥中,DNA微阵列被用来揭示基因表达如何随着发育而变化并对环境条件作出响应(Richards 等 2012)。实验品系和生长发育状态的差异可以同样解释两种拟南芥在野生条件下基因表达的变异,而基因的表达可用温度和降水量进行预测。采用相对简单的试验设计和若干环境因子,这两项研究确定了植物应对环境变化的分子基础,将作物发育和复杂环境变异的影响区别开来(Nagano 等 2012;Richards 等 2012),这同样适用于在其它作物中解码复杂环境对转录组波动的影响。


伴生生物主要存在于植物周围,特别是在根际土壤。作物产量、品质和胁迫耐性主要受土壤环境的影响,特别受根际微生物群落影响极大。因此,进行作物及其根际微生物群落的同步改良具有重要的遗传学、生态学和农学意义。通过改良根际微生物群落,可以为作物的健康生长创造更好的生长和发育条件。改良涉及无机和有机的环境条件。无机条件包括土壤保水保肥性的提升,土壤无机营养从无效向有效的转化,土壤有毒物质的毒性降解等;有机条件包括土壤中有害生物群落的遏制和有益微生物种群的提升。改良根系微生物群落与提高作物本身的耐受胁迫能力一样都有利于增加作物产量。因此,伴生生物应该在环境型鉴定的指导下进行改良。分子生物学可用于改造和优化作物生长的环境,作物改良应该由以作物为导向转变为以作物群落为导向。


5.3 作物育种的四维图像


环境信息迄今尚未被充分挖掘,并用于帮助我们了解植物对环境因素的响应。在大规模的环境型鉴定中,采用诸如 GIS 之类的信息系统进行大规模的环境型鉴定,环境特征性鉴定使环境信息得以丰富。环境信息可以多种方式应用于作物育种和生产,这包括但又不限于对影响作物特定发育过程或阶段的环境因素的精确测定;为特定试验确定目标环境;确定与表型变异有关的环境因子;将 GEI 剖分为特定组分;通过育种改进植物对特定环境、环境因素及各种环境综合因子的反应。最终,包括四维(4D)图像、优化的精准育种和作物生产系统得以建立,前三维(3D)就是由基因型、表现型、环境型所决定的空间,而第四维与时间相关,主要涉及作物生长发育的不同阶段(图4)。因此,我们实现对品种或基因型构成进行设计,以获得优化的表现型和对目标环境和作物管理制度的最佳适应性。随着环境对作物影响的全基因组理解——环境组学,与长期的实验数据和大气循环模型的结果相结合以形成气候变化为导向的育种,即设计育种。我们可以将基因型鉴定、不同发育阶段的表现型鉴定和环境型鉴定所产生的信息整合起来以推动设计育种。例如,借助于 3D(G-P-E)信息的支持,小麦锈病 Ug99 的管理可以帮助我们建立更有效的生物逆境 G-P-E 模式(Dave Hudson, CIMMYT,personal comm.)。根据 G-P-E 信息建立的应对生物胁迫的监测系统可以较好地应用于预测相关胁迫的时间变化,以支持 4D 信息化驱动的精准育种。


“可持续集约化”旨在通过更有效的利用资源增加作物产量,同时最大限度地减少对环境和发展潜力、自然资源和环境所造成的压力。在保护性农业系统下的育种可以帮助我们了解在保护性农业条件下进行的育种选择是否能使基因型出现更好的表现型,更强的活力/生长势,以及干旱条件下更好的表现。也可以帮助我们理解这种选择会否导致基因型因为株高过高而出现倒伏,或者晚熟。但是,很少有研究通过育种去全面认识新种质的产量潜力,例如在免耕条件下的产量潜力。另外,较低的 GEI(15%的变异)表明,保护性农业不需要采用单独的育种计划(Hlatywayo 等; Cairns and Thierfelder;CIMMYT, personal comm.)。如果可以获得保护性农业生产条件下所有因子的环境型信息,我们就可以设计和优化出一个基于 4D 概念的精准育种计划,这样育种者就可以处理这种复杂性而不会迷失其中(图4)。


(注:图4与从点发展到线、平面、和空间的精准育种和作物生产系统四维图像。早期的育种选择是以单一表现型为基础(点)。常规育种实现了对多种表现型的选择(线)。分子标记辅助育种则是基于多个表现型和基因型的选择(面)。未来的育种和作物生产系统将建立在基因型、表现型和环境型的基础上,形成三维系统(空间)。考虑到不同生长发育阶段的瞬时变化,还应该包括第四维(时间)。绿色箭头代表了植物育种的进化步骤;灰色箭头代表适应不同育种策略的选择目标。根据Xu 等(2012)修改。)


植物育种的 4D 概念可用于鉴定特定作物最佳的生长环境,并针对目标环境变化适时调整育种策略。作为作物生产带迁移的一个例子,伴随着生产足迹的重大改变,美国的玉米产量在 1879-2007 年间从 18 亿增长到 127 亿蒲式耳(Beddow and Pardey 2015)。在此期间,美国玉米种植区向北迁移了 279 公里,向西迁移了 342 公里。在美国过去 128 年的玉米生产中,新的空间产出指数表明这种空间上的迁移使产量增加了 16-21 %。这种长期视角为预测作物产量如何适应未来气候改变和技术创新提供了历史依据。

5.4 信息和支撑系统


我们观察到的表现型是持续变化的环境因子和一个特定基因型相互作用的最终结果。如何全面理解这一过程是一个巨大挑战,并且依赖于高通量的环境型鉴定平台和计算分析大数据的能力。除了目前基因型和表现型产生的大规模数据外,环境型鉴定也将产生大量的包括图像和视频在内的信息,这在不久的将来会引发一场数据海啸。因此, G-P-E 的数据空间将扩张到包括时间在内的四维空间,而时间将包括作物整个发育的所有时间(T)。在CIMMYT的基因库中有 148000 个小麦品种,而 IRRI 则有 113000 个水稻品种。利用 SNP 芯片对这些材料进行基因型鉴定,每个品种都可以产生成千上万的基因型数据,或者通过测序产生 Tb 级别的 DNA 、 RNA 和蛋白质数据。为了应对日益增长的环境信息的挑战,同时也为了防止农学家和生物学家被数据海啸所吞噬,我们应该建立标准化的信息产生和搜集流程,信息采集工具、抽样方法、标准的词汇和术语,可以相互关联的查询系统。一个综合的信息系统需要一个通用的数据库,对基因型、表现型和环境型信息进行整合,这对于比较和整合不同作物物种间的信息特别重要。一般来说,我们需要开发一个通用数据库和一个信息系统来处理不同 G-P-E-T 来源的所有数据。就像在基因型鉴定和表现型鉴定中那样,词汇术语的标准化已经取得了显著进展(Xu 2010),我们需要遵循相似的方法去开发相似的系统用于环境型鉴定。与环境型鉴定概念相关联的独特识别符应该开发出来并用于连接和查询数据库。


数据分析需要高性能的计算机群、硬件和软件。考虑到 G–P–E–T 数据的产生和储存主要由不同的研究项目和团队来完成,因此建立类似一站式购物系统的数据查询系统,使现有的所有数据可以连接到所有相关的科学家和用户就显得十分重要。信息驱动的系统生物学方法已经证明,最终我们可以产生有益的生物学模型,通过建立应对气候变化灾难的植物-“组学”框架,来解释不同信号通路的贡献(Ahuja 等 2010)。


为了面对数据海啸的挑战,一个成功的作物科学研究项目需要合适的决策支持工具支持。整合育种平台(IBP)可以为育种者提供决策支持工具,以帮助他们设计和管理试验、搜集储存信息、同时进行相关分析。与它连通的育种管理系统(BMS)是专门为育种家设计的,用于管理育种过程中的日常活动。然而,现有或开发中的数据库和工具主要是针对基因型和表现型的,很少关注到环境信息。显然,将所有的环境信息与数据库和工具整合起来,值得特别关注。将缩小的大气循环模型的结果与大环境定义、作物生产区域、特定区域和地点、社会经济数据进行整合,可以帮助我们预测长期育种方向的未来变化。通过数据挖掘来借鉴最优的和过去的经验,可以帮助我们开发能够优化作物生产的综合方法。


6. 未来展望


未来,环境型鉴定将面临基因型鉴定和表现型鉴定从未面对过的诸多挑战。人力资源和资金投入需要在基因型、表现型和环境型中进行合理分配以实现其均衡发展。随着基于高通量和测序的基因型鉴定技术更为广泛地应用于实践,以及高通量和精确的表现型鉴定成为可能,一整套下一代高通量的精确环境型鉴定技术也即将出现。正如在许多情况下,生物学家提出了所面临的挑战,而计算机科学家提供解决方案一样,研发环境型鉴定的工具和方法需要多学科间的通力合作并站在前人的肩膀上才能实现。相比于其他环境因子,伴生生物同寄主植物具有更复杂的相互作用。随着越来越多表现型信息的获取,预测表型组学将成为可能。理解作物管理对于基因表达的影响,将帮助我们设计出更高效、可持续和多功能的作物生产系统。环境型鉴定将帮助我们确定最优的作物管理措施去优化产量和产量组成要素,例如种植密度等。环境型鉴定对育种和作物生产的巨大贡献就在于由环境型信息和降低人工劳动所驱动的精准农业。由于土壤和水污染日益严重,人们需要更健康的营养食物,这在发展中国家变得越来越重要,而这也将促使人们建立土壤-人类健康的关系,同时开发新的工具和方法用于整个环境的动态和持续性监测。在 2050 年之前通过生物强化将儿童死亡率减少一半(FAO 2008),这意味着我们需要开发具有更优良的品质性状并适应不断变化的土壤养分状况的新品种。通过遗传研究、基因型重建、品种开发、生物/非生物逆境预测、精准农业和精准育种,环境型指导下作物科学将帮助我们面对所有的挑战。将环境型鉴定作为第三种鉴定(分型)技术应用于作物科学,可以帮助我们解码所有的环境因子对于作物生长、繁殖和生存的影响。伴随着大规模环境型鉴定的进行,结合已知的基因型信息,可以实现对作物生长环境的优化并对特异环境下作物的表现型进行预测,这将大大提高精准育种和作物生产的成本效益。


致谢:在CIMMYT-China和中国农科院作物科学研究所进行的研究得到中国国家自然科学基金(31271736)、中国国家973项目(2014 CB138206)、中国国际科学和技术合作计划(2012DFA32290)、中国农业科学院农业科学技术创新项目(ASTIP)、比尔和梅林达·盖茨基金会和CGIAR MAIZE研究计划的支持。


(完)


参考文献:


编辑@新锐恒丰研究院

作者@徐云碧

联系: novoseed@163.com 


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多