第三章 蔷薇科 地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。 第二章往期回顾 白菜 ◆ 甘蓝 ◆ 盐芥 ◆ 榨菜 ◆ 拟南芥 ◆ 琴叶拟南芥 第二章十字花科的解读在不知不觉中就结束了,在第二章里,我们研究过高大上的古早植物,也讨论过亲民的萝卜、榨菜,相信大家都各有收获。接下来,180+植物基因组文献解读计划就要进入第三章——蔷薇科的解读啦,你们准备好了吗?! 蔷薇科里有许多富有经济价值的温带果品,例如:苹果、梨、草莓、樱桃、山楂等,其种植范围遍布世界各地。所以,蔷薇科真的是名副其实的水果王国啊!第三章的第一篇我们就将解读苹果中的著名高产品种——金冠苹果(Golden Delicious)。 文献题目:High-quality de novo assembly of the apple genome and methylome dynamics of early fruit development 发表期刊:Nature Genetics 发表时间:2017年6月8日 影响因子:27 摘要介绍:本研究由法国、意大利、南非、荷兰、奥地利等多国科学家共同合作,完成了一个迄今为止最好的栽培苹果品种的基因组从头组装。除了第二代和第三代测序数据联合组装外,本文还利用光学图谱技术提升组装效果。超过一半的基因组组装结果中充斥着重复序列,这虽然在木本植物中十分常见,但本文进一步在异染色质区域发现了一个新的大量重复的逆转录转座子序列,并且推测出2100万年前发生过一次转座因子的爆发。 而这次爆发时间与天山山脉的地质隆起时间一致,考虑到天山山脉地区是苹果的物种起源中心,这些转座因子及其爆发过程可能与苹果和梨的物种分化,及苹果祖先的物种多样性的形成具有较大影响。本研究另外探讨了苹果全基因组的甲基化水平,发现了甲基化在果实发育等重要农艺性状上有重要意义。 研究意义:完善了2004年第一个苹果基因组文章当中相对较差的组装结果;提供了一个非常完善的苹果参考基因组;为苹果基因组重复序列对其物种分化和祖先物种多样性形成的研究指出了方向;对影响果实发育的几十个基因的甲基化标记进行了深入研究。 研究难点:构建一个具有单纯遗传背景的双单倍体实验材料;完成大量的全基因组单碱基分辨率的甲基化测序并挖掘对果实发育有重要影响的基因。 内容简析 研究方向: 1. 苹果De novo基因组学研究; 2. 苹果基因组转座子研究; 3. 苹果转录组和小RNA分析; 4. 苹果全基因组甲基化研究; 研究亮点: 1. 二三代联合组装,Bionano辅助组装; 2. 转座子在苹果的物种分化与祖先多样性形成中可能发挥重要作用; 3. 某些基因的甲基化可能对果实发育产生重要影响,可用于分子标记辅助选择育种。 研究问题: 1. 双单倍体金冠苹果基因组组装(二三代测序与BioNano数据联合组装); 2. 重复序列尤其是转座子的爆发与苹果物种分化及多样性形成的关系; 3. 苹果全基因组甲基化水平研究及其与产量等重要农艺性状等的关联,并可为用于栽培苹果分子标记辅助选择的表观标记的开发提供支持。 研究方法 研究对象:栽培苹果“金冠”(Golden Delicious)的双单倍体植株用于基因组de novo研究, 以及2株分别产大小两种果实的金冠苹果的不同组织用于全基因组甲基化研究。 所用软件: 组装与比对:SOAPdevo2.223,BWA-MEM,Pilon1.17,BESST,IrisViewer v2.5,DBG2OLC; 连锁图谱:R package snpStats和LDheatmap; 甲基化分析:deepTools; 注释:Trinity,SOAPdenovo-trans,EuGene,InterProScan,TargetP; 共线性分析:SynMap; 重复序列分析:REPET package TEdenovo和TEannot, 所用数据: 1. 金冠苹果全基因组从头测序的二代shotgun和三代数据; 2. BioNano数据; 3. 7个栽培和杂交品种的不同组织的转录组数据; 4. 2个品种的叶片与果实的重亚硫酸氢盐测序数据; 5. 双单倍体金冠苹果植株的sRNA数据;
Denovo样品准备:利用一个含有未受精卵子的子房发育形成金冠苹果的单双倍体植株。 转录组样品准备:利用7个栽培品种的根,茎,叶,茎尖,种子和花等6个部位的组织样品提取DNA,反转录为cDNA。 研究结果 研究成果: 1. 对金冠苹果的双单倍体个体(GDDH13)进行测序,基于二三代测序数据及BioNano光学图谱数据和一个高密度的连锁图谱组装得到2150个contigs和280个scaffolds,超过50%的contigs被包含在大于620kb的contigs序列中。进一步结合600x的光学图谱数据,组装后的一致性序列的长度从625Mb提高到了649Mb。利用两种方法对组装结果进行评估:将遗传图谱上的15417个SNP比对到组装的scaffold中,发现同源的数量达到14732个,而其中可以定位到目标基因组位置的标记达到95.8%,14117个;第二种方法采用SNP标记间的r2参数来评估连锁不平衡水平,在本版本的组装结果中未发现任何abrupt jumps。
2. 通过对7个品系的不同组织样品的转录组测序和组装,并进一步比对回组装后的基因组数据,鉴定出来42,140个编码基因和1,965个非编码基因,其中23.3%出现在组装的基因组中。对之前发布的sRNA数据比对回基因组,发现大部分长度在21和22nt的sRNA都比对回了编码基因,而大部分24nt都则比对到了TEs,而23nt的则在两类中分布较平均。 3. 本文重点对重复序列中的转座子进行了研究。利用TEdenovo检测流程对基因组中的TEs的拷贝进行注释,发现超过基因组57%的区域包含有转座子。具体分布情况在下面的图示中展示。 4. 本文对叶片和果实的全基因组单碱基甲基化水平进行了研究,叶片中CG,CHG和CHH所占比例分别为49%,39%,12%。DNA甲基化在染色体中的分布很不均一,甲基化峰出现的区域集中在非重组热点区。和预期一样的是,基因序列区甲基化水平低,而TEs区是甲基化热点。针对基因的甲基化状态对基因进行了三种分类:I类基因在CG与CHG区域尤其是其周围区域具有高甲基化水平;II类基因在CG具有较低的甲基化水平在CHG和CHH具有极低的甲基化水平,而周围区域相对较高;III类基因在基因区及其周边区域甲基化水平均低。第三类基因在苹果中占比最高(64.5%)揭示了苹果整体甲基化水平较低。 5. 为了进一步获得甲基化对果实发育的影响的信息,文章对比了GDDH13叶片和果实的甲基化水平,发现了1017个差异甲基化区域,而其中86%为CHH甲基化。在差异甲基化基因上游2kb的转录起始区发现了几个与拟南芥同源的基因,这些基因在花和果实的发育中扮演重要角色。 6. 我们商业种植的金冠苹果为本文进行denovo测序的GDDH13与GDDH18的杂交种。前者果实巨大,而GDDH13和18则果实体积小很多,18尤其瘦小。为了研究哪些基因的甲基化会对此产生影响,本文在授粉前3天、授粉后3天、授粉后9天三个时间段对GDDH13和18进行了全基因组甲基化测序。在授粉后9天的样本中发现了148个高置信度的差异甲基化基因其中53个基因的甲基化区域位于启动子区。最终发现GDDH18含有17个启动子区域甲基化差异化低水平的基因,而其中一些基因在其它物种中也发现与果实大小有关。这可能揭示了GDDH13与18果实大小差异的问题。 图1 基因组的组装与结果验证 图2 基因组与表观基因组共线性分布图 图3 转座子的分布及其进化分析 图4 苹果叶片与果实中的差异甲基化区域 |
|