分享

易基因:植物DNA甲基化专题 |玉米:从群体水平揭示DNA甲基化变异对表型的贡献

 深圳易基因科技 2021-11-19

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

植物DNA甲基化研究:

(1)       NAR: 拟南芥AtHDA6与着丝粒周围DNA甲基化关系研究

(2)       nature油棕Karma转座子表观遗传重要发现

关于玉米DNA甲基化研究,华中农业大学李青团队和美国明尼苏达大学合作解析了玉米自然群体中的DNA甲基化变异,揭示了DNA甲基化变异的遗传基础以及DNA甲基化变异与基因表达和表型的关联。该成果发表在开放获取期刊Genome Biology上。

标题:Population-level analysis reveals the widespread occurrence and phenotypic consequence of DNA methylation variation not tagged by genetic variation in maize

期刊:Genome Biol

2021影响因子: IF 13.583

发表时间:2019.11.19

方法:液相探针捕获甲基化测序、WGBS测序分析、GWAS分析、RNA-seq

1、研究目的

DNA甲基化是许多植物物种中研究最多的染色质修饰。 DNA甲基化在维持基因组完整性方面具有重要作用,也可能影响植物的发育和环境响应,特别是在具有复杂基因组的物种中。 DNA甲基化发生在植物的CGCHGCHH的三个序列环境中(H=A,CT碱基),其中CG通过DNA甲基转移酶1(Met1)CHG通过染色质甲基化酶3(CMT3)CHH通过RNA诱导的DNA甲基化(RdDM)和染色质甲基化酶2(CMT2)来维持。

近年来,高通量测序技术和基因型检测技术的发展极大促进了作物遗传改良,育种家可以根据大量的SNP数据建立模型,预测表型和进行基因组选择,这一做法的前提是性状变异由DNA序列变异(SNP)决定。但对于很多性状,DNA序列变异通常只能解释部分的遗传力,仍有相当一部分遗传力无法被解释,许多学者将这种现象称为消失的遗传力,如何寻找并利用这部分遗传力是遗传学家和育种学家面临的一个重大挑战。研究表明,DNA甲基化在玉米不同基因型间存在巨大变异,但无法在群体水平研究DNA甲基化变异的程度及其生物学功能。

本研究对玉米不同自交系DNA甲基化中自然变异的遗传基础和生物学功能进行分析,揭示了存在差异甲基化区域(DMR)的许多实例证据,这些区域包含的信息不能用SNP完全捕获。并且DNA甲基化的变化与基因表达变化有关,这种关联依赖于序列环境以及DMR距离基因转录起始位点的位置。此外研究还表明,DNA甲基化变化与玉米的表型变异有关,可以解释某些代谢性状的部分遗传力。

2、样本选取

选取263份来自全球热带、亚热带和温带的玉米自交系,在标准温室条件下生长至V3,随后收集第三叶冷冻在液氮中,采用标准的CTAB法(cetyl-trimethyl-ammonium bromide)提取基因组DNA进行实验分析。

3、实验结果

①玉米自交系中DNA甲基化变异广泛存在

作者使用基于探针捕获的技术对263份来自热带、亚热带和温带的玉米自交系进行DNA甲基化分析,鉴定出大量DNA差异甲基化区域(Differentially methylated region, DMR),在CG,CHG,CHH上分别鉴定了8864,9759,5705DMR。将基于捕获技术鉴定的DMR与全基因组重亚硫酸盐测序(WGBS)鉴定的DMR进行比较,比较结果相对应。DMR沿10条玉米染色体分布,其中许多DMRs位于基因所在区域,且这些DMRs大小非常相似,在60~1000bp之间,中位数为200bpMEF分析(minor epiallele frequency)表明CGCHG DMR 稀有等位基因表现出低甲基化状态,而CHH DMR稀有等位基因通常表现出较高的甲基化水平。

虽然在不同区域确定了DMRs,但是很多位点发生了共同变化,并且在CGCHG上有很大的冗余。作者将CGCHG上的DMR结合并鉴定在CG_onlyCHG_onlyCG_CHG上的DMR,分别有708,944,2223DMRs

图1


DMRs可以区分玉米亚群

作者使用SNPDNA甲基化水平计算个体关联性,结果显示CG DMRsCG甲基化与不同自交系之间遗传关系的关联性显著高于CHG DMRsCHG甲基化和CHH DMRsCHH甲基化,表明CG甲基化可能更稳定。使用来自DMRCGCHGCHH甲基化水平进行主成分分析(Principle component analysisPCA),结果证明了DMRs可以通过不同区域的甲基化水平将自交系分为不同的亚群,这与基于SNP的分类非常一致,其中CG甲基化区分亚群的能力最强。CG_onlyCHG_onlyDMRs与遗传距离的关联性小于CG_CHG DMR。使用DMR区分亚群表明存在亚群特异性DMRs。方差分析(an analysis of variance analysisANOVA)表明,在一个亚群的大多数品种中,许多DMRs表现出高甲基化或低甲基化,但没有发现一个亚组中只有低甲基化或高甲基化的DMR

图2


通过全基因组关联分析来解析DMRs的遗传基础

DNA甲基化可能与周围的遗传变异有关,为了研究DMRSNP标记的程度以及不同类型DMR之间是否存在差异,作者使用控制种群结构和个体关联性的混合线性模型(mixed linear model)对约 100万个高质量SNPs进行全基因组关联分析(genome-wide association analysisGWAS),共鉴定了4336,40961426CG,CHGCHH DMR与基因组水平显著相关联。在这些DMRs中,大多数仅与一个SNP显著关联;同样,大多数SNP仅与一个DMR相关。且DMR和相关SNP之间的距离通常在10Mb以内。因此,如果相关DMR10Mb以内,则SNP被定义为局部(local)关联SNP如果在不同的染色体上,则被定义为远端(distal)关联SNP。与玉米基因型在关联panel中的全基因组DNA甲基化没有明显变化的观察结果一致,未发现强烈的远端热区(distal hotspots)。表明在本研究所用的自交系中,主要甲基化机制并未受到影响。

CG,CHG,CHH三种序列环境中,CG DMR最有可能通过局部或远端与SNP相关联,很少同时与两类SNP相关联(图3e)。CHH DMRSNP相关联最少。重要的是,超过60%DMRsSNP没有明显的关联性,这可能是因为GWAS分析通过SNP无法捕获到DMRs中一些特异性信息。在某些情况下,DMRs可能由SNP不能有效标记的结构变异引起,这些分析表明,很大一部分DMR不能被SNP或结构变异有效捕获。

图3


④特异性环境DMR的染色质变异和遗传控制

对于与SNP显著相关联的不同序列区域,DMR的分布存在差异。CG_only45%)和CHG_only26%DMR显著相关联的SNP DMR比例低于CG_CHG DMR51%)。表明CG_onlyCHG_only DMR不如CG_CHG DMR稳定,这与此前研究CG_CHG DMR能更好区分玉米亚群的结果一致。在大部分CG_only DMR中,CHG在所有基因型中的水平较低,表明这些区域不是维持CHG甲基化的Zmet2/Zmet5靶点。大多数CHG_only DMR在所有基因型中具有高水平的CG甲基化,表明这些区域是维持CG甲基化酶MET1的靶点。特异性环境DMR的染色质特征也存在差异,CG_only DMR往往具有较低水平的H3K9me2H3K27me3标记,表明CG_only DMR不太可能发生在具有抑制性染色质环境的区域中。CHG_only DMR往往具有更高的H3K9me2标记。与CG_onlyCHG_only DMR相比,CG_CHG DMR具有高水平的H3K9me2H3K27me3标记,且高的H3K9me2标记发生DNA高甲基化DMR中,而高水平的H3K27me3标记发生在DNA低甲基化DMR中,证明了此前研究DNA甲基化和H3K27me3通常表现出负相关。

图4


DMR与基因表达的自然变异有关

为研究DNA甲基化和基因表达之间的关联,作者以基因表达作为因变量,以DNA甲基化作为自变量进行GWAS分析。基因表达数据来自授粉后15天的籽粒,检测到的基因表达和甲基化水平之间的显著关联有1389个,CG,CHGCHH DMR分别有538,562289个关联。大多数显著相关的DMR位于与基因相同的染色体上,DMR与基因之间的距离通常小于1 Mb。且大多数DMR仅与一个基因相关,这与远端热区的存在有关。

CGCHG DMR与基因表达主要呈负相关,而CHH DMR与基因表达则主要呈正相关。DMR越靠近转录起始位点(TSS),这种关联性趋势就越强烈,尤其是在1 kb以内的TSSCGCHG DMR的负相关位于TSS下游,表明在基因组内CGCHG甲基化可能与基因表达降低有关。此外,CG_CHG DMR与基因表达的关联性是CG_onlyCHG_only3倍。CG_CHG DMRCHG_only DMRCHG甲基化与基因表达呈负相关,当CG甲基化随CHG甲基化而变化时表现出负相关,在CG_only DMR中表现正相关。因此,基因表达与DNA甲基化之间的关联取决于序列背景(sequence context)。

作者对DMR与不同组织(叶片和籽粒)基因表达数据进行关联分析,分析结果表明全基因组表达水平受 DNA 甲基化变异影响,只能通过对许多不同组织或生长条件的分析来证明。且DMR无论是否被SNP标记,都可以解释基因表达的变化。

图5


DMRs与基因表达和表型之间的关系

差异DNA甲基化可能是差异基因表达的因或果,作者选择了与DMR具有强关联性但与基因表达没有强相关的工具SNP,结果表明基因表达更可能由DMR引起。接下来,作者利用来自ddm1双突变核组织的RNA-seq数据进行验证,结果进一步支持了DNA甲基化可以对基因表达产生正相关或负相关的因果影响。

最后作者分析了天然DMR与表型之间的关系,作者使用了此前进行多样性panel研究中产生的代谢数据,以DMR作为自变量,以表型数据作为因变量进行GWAS分析。在3个独立的环境中共鉴定了986个特异性的代谢性状,其中156个性状(15.8%)在至少1个环境中与DMR显著相关联。大多数性状(76%)与一个DMR有关。总共发现43CG45CHG63CHH DMR与代谢性状显著相关联。有趣的是,与性状关联的DMR中超过半数不与SNP关联,且有些性状只与DMR关联而不与SNP关联,提示DNA甲基化携带了特有的遗传信息。

图6


易基因小结

本研究对263份来自热带、亚热带和温带的玉米自交系的DNA甲基化进行了分析,通过群体分析鉴定出大量DNA甲基化DMR,结合高密度SNP数据、叶片和籽粒基因表达数据以及籽粒代谢数据,解析了DNA甲基化变异的遗传基础及其对表型变异的影响。本研究系统解析了DNA甲基化变异的遗传基础,并证明DNA甲基化可调控基因表达和表型,为解释消失的遗传力提供了新的支持。

参考资料:

1、 DOI:10.1038/s41422-020-00465-7

2、 华中农业大学官网

原文解读:

植物DNA甲基化专题 | 玉米:从群体水平揭示DNA甲基化变异对表型的贡献

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多