分享

不忘“出新”,方得基因

 萌小芊 2018-01-19

全基因组关联分析 (GWAS) 是进行 QTL 定位和功能基因挖掘的有效手段,广泛应用于人类疾病、动植物复杂性状的遗传研究。在作物中,利用这一方法已经挖掘到大量影响重要农艺性状的 QTL/基因。GWAS 一般是将 SNP 和表型性状进行关联,检测与性状显著关联的 SNP 位点。但是,有时常规的 GWAS 并不能得到理想的分析结果。怎么办?别着急,下面小编带你了解一下 GWAS 分析的一些新玩法!


对于数量性状来说,单个 SNP  的效应一般比较低,很难达到严格的选择尺度,因此一些主效位点很容易被检测出来,但是大量微效位点往往很难被关联到。对于这些情况,基于单体型的关联分析 (Haplotype-based GWAS) 和基于基因的关联分析 (Gene-based GWAS) 是另外两种有效的分析策略。许多研究表明,同时将多个变异位点作为整体进行关联的 Haplotype-based GWAS 和 Gene-based GWAS 可以明显提高检测能力,比直接分析单个 SNP 更有优[1-3]


此外,除了利用 SNP 标记进行全基因组关联分析外,也可将同样在基因组范围内有广泛分布的拷贝数变异 (CNV)作为分子标记进行全基因组关联分[4-5]。Haplotype-based、Gene-based GWAS 和利用 CNV 变异的 GWAS 在人类疾病和动物复杂性状的研究中已经有了广泛的应用。近两年,这些 GWAS 分析方法也逐渐被应用到作物中。


1. RTM-GWAS 挖掘大豆百粒重微效位点[6]


一种类似于Haplotype-based GWAS的方法RTM-GWAS (Restricted two-stage multi-locus multi-allele genome-wide association study) 在大豆百粒重、开花期等的研究中就得到了较好的应[6-7]。这一方法首先构建 SNP 连锁不平衡区 (SNPLDB),然后将 SNPLDB 与表型性状进行关联。对大豆百粒重的关联分析中,基于 SNP 的分析方法只检测到3个显著关联位点,而利用 RTM-GWAS 的方法共检测到139个显著关联位点,其中126个与已报到 QTL 一致。说明这一方法对于检测由多基因控制的数量性状具有明显优势。


图1  SNP based GWAS和RTM-GWAS对大豆百粒重的分析结果比较


2. Gene-based GWAS 检测出 SNP-based GWAS 中错误关联位点[8]


利用176份粳稻对水稻开花期进行基于 SNP 的关联分析,共检测到26个与开花期显著关联的位点。作者对其中最显著的三个位点 (分别位于染色体1、6和11) 和两个包含已知开花基因 Hd2 Hd6 的位点进行了重点关注。在1号染色体和11号染色体上的新位点以及包含已知基因的两个位点都找到了与开花性状相关的候选基因,但是在6号染色体上的候选区域 (7.81-8.38 Mb) 却未找到合适的候选基因。虽然该区域附近存在已知开花基因 Hd1,但 Hd1 所在区域 (9.22–9.61 Mb) 未达到显著水平。作者又采用 Gene-based GWAS 对这一性状进行了分析,发现 Hd1所在区域基因的峰值要高于7.81-8.38 Mb 区域基因的峰值。这说明 Gene-based GWAS 对于 SNP-based GWAS 中错误关联位点的检测更准确。


图2  Gene-basedGWAS检测出SNP-based GWAS中错误关联位点


3. CNV-GWAS挖掘大豆农艺性状相关位点[9]


该研究首先利用在302份大豆 (62份野生大豆、130份地方品种和110份栽培种) 中检测到的979万个 SNP 对大豆驯化和改良过程的选择消除信号进行了检测,并对种子大小、种皮颜色、生长习性、含油量等性状做了 GWAS 分析,挖掘到一些显著关联同时在驯化或改良过程中受到强选择的位点。然后利用检测到的1614个 CNV 对大豆种脐颜色、株高和包囊线虫抗性等农艺性状进行 GWAS分析。


其中在8号染色体上成功检测到一个与种脐颜色显著关联的信号,该位点与驯化过程中的一个选择消除信号重叠。在18号染色体成功检测到一个与孢囊线虫抗性相关的位点,该位点同样在驯化过程中经历选择,并且与已报到的 Rhg1 重叠。对株高的 GWAS 则检测到4个新位点。


图3  利用拷贝数变异的GWAS挖掘大豆农艺性状相关位点


怎么样?这些介绍是不是刷新了你对 GWAS 的认识?想要了解更多关于作物 GWAS 的新方法、新思路和新进展,欢迎咨询诺禾致源作物团队 (crop-pm@novogene.com)。我们用“新”为您提供更专业的服务!



参考文献

[1] Sato S, Uemoto Y, Kikuchi T, et al. SNP-and haplotype-based genome-wide association studies for growth, carcass, and meat quality traits in a Duroc multigenerational population. BMC Genet, 2016, 17:60.

[2] Trégouët DA, König IR, Erdmann J, et al. Genome-wide haplotype association study identifies the SLC22A3-LPAL2-LPA gene cluster as a risk locus for coronary artery disease. Nat Genet, 2009, 41(3):283-5.

[3] Zhang W, Li J, Guo Y, et al. Multi-strategy genome-wide association studies identify the DCAF16-NCAPG region as a susceptibility locus for average daily gain in cattle. Scientific Reports, 2016, 6:38073.

[4] Legge SE, Hamshere ML, Ripke S, et al. Genome-wide common and rare variant analysis provides novel insights into clozapine-associated neutropenia. Mol. Psychiatry, 2017, 22(10): 1502-1508.

[5] Marshall CR, Merico D, Thiruvahindrapuram B, et al. Contribution of copy number variants to schizophrenia from a genome-wide study of 41,321 subjects. Nat. Genet, 2017, 49(10): 1558.

[6] He J, Meng S, Zhao T, et al. An innovative procedure of genome‑wide association analysis fits studies on germplasm population and plant breeding. Theor Appl Genet, 2017, 130:2327–2343.

[7] Li S, Cao Y, He J, et al. Detecting the QTL-allele system conferring flowering date in a nested association mapping population of soybean using a novel procedure. Theor Appl Genet, 2017, 130(11):2297-2314.

[8] Wang SB, Feng J Y, Ren WL, et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice. Nature Genetics, 2016, 48 (8):927.

[9] Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean. Nat Biotechnol, 2015, 33(4):408-14.


作物业务线   杨明涛丨文案

王婷婷丨编辑

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多