分享

双单倍体育种如何使用基因组选择

 育种数据分析 2021-11-18

1. 文献

  • 题目: Genomic Selection in Cereal Breeding谷物育种中的基因组选择

  • 时间: 2019年2月19

  • 类型: 综述

2. 摘要

  • 基因组选择, 是通过对一个个体进行建模, 进而预测另一群个体的方法, 在育种中的作用是可以不用等到候选群体的表型值出来后进行选择, 直接可以根据候选群的基因型数据进行预测, 然后进行提前选择.

  • 影响GS的准确性因素, 包括参考群的大小, 个体间的亲缘关系, 标记密度, 是否利用系谱等等.

  • 植物育种中GS的流程还不是很清晰, 这篇文章进行一个梳理

两个概念

  • PS: Phenotypic Selection, 表型选择

  • GS: genomic Selection, 基因组选择

基因组选择, 已经有研究表明, 比如小麦, 大麦, 燕麦中. 在自交作物, 杂交作物, 自交系, 双单倍体中都有优势.

这篇综述的目的

  • 讨论谷子育种中怎么使用GS

  • 参考群的大小

  • 训练群体和候选群体的个体间的亲缘关系

  • 标记密度

3. 基因组选择的流程

  • 1, 首先群体分为训练群体(有基因型有表型)和测试群体(有基因型无表型),通过训练群体建模, 预测测试群体的表型值, 根据预测的表型值进行提前选择

  • 2, 训练群体中, 估算SNP的效应值(贝叶斯类方法), 或者构建关系矩阵(G矩阵或者H矩阵)用于预测测试群体

  • 3, 训练群体, 会有不同的参数和模型设置, 通过交叉验证, 看哪个模型评估准确性最好, 选择最好的模型去预测测试群体

  • 4, 测试群体, 根据训练群体中最优的模型, 进行预测测试群体的表型值, 进而进行育种选择

4. 目前GS在植物育种中研究的不足之处

  • 1, GS方法如何高效的整合到植物育种流程中

  • 2, GS方法中, 如何利用或者整合亲缘关系到育种流程中(比如, 玉米, 水稻自交系选择, 不同的类群组内参考群, 提高自交系的育种值)

  • 3,大部分的植物育种中, 忽略系谱的影响, 直接使用GBLUP, 其实SSGBLUP更好用.

4. 双单倍体育种如何使用GS

4.1 传统DH育种流程

  • 1, P1和P2杂交产生F1

  • 2, 单倍体加倍纯合变为双单倍体

  • 3, PYT, 即初级试验(增加种子量)

  • 4, AYT, 高级试验, 比如2地点, 每个地点3个重复

  • 5, EYT-1, 选择优秀的品系(多点鉴定)

  • 6, EYT-2, 选择优秀的品系(多年多点鉴定)

  • 7, Variety release, 品种投放市场

4.2 加入GS的DH育种流程

如何在双单倍体育种中, 增加GS的技术呢, 可以这样做:

  • 1, P1和P2产生F1, 单倍体诱导, 加倍纯合, 变为DH groups

  • 2, 在PYT(初级试验时),使用GS技术, 测得PYT的基因型, 用GS预测表型值, 提前选择, 同时获得优秀的F1信息, 同时在下一轮的育种中优先诱导表现好的F1.

  • 3, 在AYT(高级试验时),使用GS技术,测得AYT的基因型, 用GS预测表型值, 提前选择, 获得优秀的AYT, 将获得的信息用于下一轮的PYT或者下下论的DH groups

  • 4, 在EYT-1, EYT-2中, 也使用GS技术, 这样GS可以淘汰50~70%的个体, 增大选择压, 加快品种的迭代

研究表明, 植物育种中, 如果想要取得较好的效果, 训练群体和测试群体需要有一定的亲缘关系. 所以, 在后继世代(subsequent)中使用GS技术效果较好, 因为亲缘关系较高, 比如在自交系或者自交品种选择的过程中, 一个品种不断的作为亲本, 或者他的后代作为亲本, 这样的群体进行循环育种中用GS效果较好, 而且GS方法可以非常方便的加入到育种流程中.

5. 植物GS育种中如何利用系谱信息

在动物育种中, 单存使用GBLUP做基因组选择的方法在实际应用中非常少, 应用最为广泛的是一步法(SSGBLUP), 即将系谱和基因组数据合并为SSGBLUP的方法, 这是性价比最好的方法. 系谱的整理可以是完整的系谱信息, 如果只有大致的分组, 也可以将分组信息考虑在内, 考虑系谱的优势在于可以利用测序个体, 然后根据系谱信息, 去提高非测序个体的准确性.

6. 植物GS育种如何利用非加性效应

概念

  • AGV(additive genetic value): 加性效应(育种值)

  • TGV(Total genetic value): 所有的效应值

  • SCA(special combining ability): 特殊配合力

一般根据系谱计算BLUP值, 或者根据基因组计算GBLUP, 都是计算的加性效应, 而非加性效应, 比如显性效应, 上位性效应, 在利用杂种优势或者选配时也非常重要. 现在也有相关方法可以根据系谱或者基因组信息计算显性矩阵和上位性矩阵, 但是预测效果不是很理想. 值的关注的是非线性的GS选择方法, 比如RKHS, 可以考虑高阶的基因互作, 是一个有前景的GS方法.

7. 基因组选择的其它方法

  • 支持向量机(support vector machines)

Abraham, G.; Tye-Din, J.A.; Bhalala, O.G.; Kowalczyk, A.; Zobel, J.; Inouye, M. Accurate and robust genomic prediction of celiac disease using statistical learning. PLoS Genet. 2014, 10, e1004137. [CrossRef]

  • 贝叶斯加性回归树(Bayesian additive regression trees)

Waldmann, P. Genome-wide prediction using Bayesian additive regression trees. Genet. Sel. Evol. 2016, 48, 42. [CrossRef]

  • 非参数方法(Non-parametric methods)

Howard, R.; Carriquiry, A.L.; Beavis, W.D. Parametric and nonparametric statistical methods for genomic selection of traits with additive and epistatic genetic architectures. G3-Genes Genomes Genet. 2014, 4, 1027–1046. [CrossRef]

  • 主成分回归(Principal components regression)

Du, C.; Wei, J.L.; Wang, S.B.; Jia, Z.Y. Genomic selection using principal component regression. Heredity 2018, 121, 12–23. [CrossRef] [PubMed]


福利就是我将自己的公众号做了一个汇总, 如果你也在这个领域, 你想了解哪一部分的内容呢, 留言说出你想了解或者感兴趣的内容吧, 点赞靠前的我会优先写的.

生物统计:

主要包括试验设计,生物统计中的数据分析,育种中的数据分析,相关的文献解读。

1,用R语言生成增广试验设计

2,P-rep designs 文献解析及实现方法

3,RCBD和alpha-lattice试验效率比较

4,如何对增广试验数据进行分析

5,如何对数据进行汇总统计(R语言)

6,关于联合方差分析的讨论-1

7,农业统计分析系列1-软件包介绍

8,农业统计分析系列2-试验设计

9,Excel中的数据透视功能处理农业数据

10,进军机器学习--序言

11,  植物育种中全基因组选择是成熟的方法么?

12,  不同试验设计遗传力的计算方法

13,  农业大数据时代的几个案例

14,  农业试验中如何分析单因素方差分析

15,  P-rep designs 文献解析及实现方法

16,  文献阅读: 林木中遗传参数评估

17,  育种4.0世代的到来个人应该准备什么

18,  农业试验设计中田间种植图的绘制方法


数量遗传:

主要是动物数量遗传,动物育种中应用比较广泛,无论是基于系谱的动物模型,近交系数,亲缘关系系数,配合力,育种值,还是单性状模型,重复力模型,多性状模型等相关知识。

1,R语言求解混合线性方程组(有系谱)

2,R语言混合线性模型包代码演示

3,DMU-遗传参数评估-学习笔记1

4,DMU-单性状动物模型-学习笔记2

5,DMU-单性状重复力模型-学习笔记3

6,DMU-多性状动物模型-学习笔记4

7,DMU-单性状母体效应-学习笔记5

8,DMU软件 语法高亮-学习笔记6

9,DMU从入门到放弃系列汇总

10,育种中一般和特殊配合力的计算方法

11,为什么要学习数量遗传学1--序言

12,2-数量遗传学课程介绍

13,3-数量遗传学课程介绍-R语言基础

14,4-数量遗传学课程介绍-R挖掘数据

15,利用系谱计算近交亲缘关系系数

16,单性状动物模型矩阵形式计算BLUP值

17,  文献阅读: ABLUP-GBLUP-SSGBLUP模拟数据比较

18,  文献阅读: 林木中遗传参数评估

19,  遗传变异系数怎么计算

20,  测定日模型及随机模型介绍


编程语言:

包括Python,R语言,Julia,Perl语言,Linux的Shell语言,主要是我平时学习时的一些笔记和总结。

1,R,Julia以及Python共享数据

2,Python生物统计---笔记1

3,Python学生物统计---笔记2

4,Python学生物统计---笔记3

5,Python学生物统计---数据导入笔记4

6,Python学生物统计---可视化---笔记5

7,Python学生物统计---T检验笔记6

8,Python学生物统计---方差分析笔记7

9,shiny学习笔记1---上传数据

10,shiny学习笔记2-下载数据

11,shiny学习笔记3--生成html报告

12,data.table学习笔记1

13,data.table学习笔记2

14,  R语言与独孤九剑以及Python与降龙十八掌

15,  snakemake 学习笔记1

16,  snakemake 学习笔记2

17,  远程访问服务器 jupyter notebook 的设置方法

18,  WOX 糙快猛的实现方法

19,  R语言中如何写入xlsx的不同sheet表格

20,  几种加快R语言运算的方法

21,  如何批量安装R语言包


基因组选择:

育种数据分析中,表型选择,方差分析,混合线性模型的BLUP育种值是学科的枝干,MAS,GWAS是花苞, GS则是盛开的花朵,其依赖于常规的数量遗传理论,但青出于蓝而胜于蓝,具有光明的前景,由于GS的应用,分子育种的落地又大大提前了一步。现在GS在动物育种中,特别是牛,猪,鸡,羊中正在大规模落地,以后再玉米,水稻,小麦,大豆的应用也将落地。冬天来了,春天还会远么? 这个章节有文献解析,SNP数据清洗,G矩阵及H矩阵构建,模拟数据,软件使用,理论介绍等等。

1,QMSim 基因组数据模拟软件-介绍

2,关于SNP在染色体上的分布图怎么做

3,GS中G矩阵和H矩阵构建时的计算效率

4,JWAS: 基于贝叶斯的GWAS和GS软件

5,多性状分析中FA Model的用法

6,如何构建G矩阵-基因组亲缘关系矩阵

7,基因型数据012及-1,0,1计算基因频率

8,rrBLUP和asreml-r计算GBLUP比较

9,全基因组选择介绍-1

10,全基因组选择介绍2:构建H矩阵

11,基因组选择技术在动物育种中的应用

12,plink格式转化为012的方法

13,  全基因组选择GS软件: MiXBLUP 2.1介绍

14,  基因组选择和SNP分析在ASREML-SA中的实现方法

15,  基因组选择分析软件调研


放飞自我系列:

所谓放飞自我, 就是放飞自我系列. 

1,使用摇床通过微信运动进行市场推广

2,关于写长文有助于思考的感想

3,《大国宪制》读后感---题记

4,一只特立独行的猪

5,铭记: 首例基因编辑婴儿在中国诞生

6,月薪8000出租车司机给我上的一课

7,DMU从入门到放弃系列汇总

8,读龙场大悟--有感

9,学习方法论与花心大萝卜的博文

10,玉米育种理论在谈恋爱中的应用分析

11,学习编程, 我为什么建议你不要看视频

12,人际交往能力远比你想象的重要

13,从年终总结到买凶杀人

14,科学算命以及全基因组选择的讨论

15,如何科学的理解算命及深度思考

16,有公众号的少年不可欺

17,情人节--下雪的白色情人节

18,农学研究生的前途

19,奇文读后感:农学劝退论

20,奇文共赏:农学专业有多坑?

21,为什么搞数据分析的人要学学打麻将

22,  上士闻道

23,  我与红宝书《玉米数量遗传学》的故事

24,  我年薪百万的故事

25,  从读书到别人思想的跑马场

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多