分享

我的研究适合“混合测序”吗?

 生物_医药_科研 2018-12-17

上周科技君介绍了混合测序那些必须要绕过的“坑”。那么混合测序到底适用于什么样的群体?如何进行研究更有效?混合DNA测序如何定位突变位点?混合DNA、RNA测序如何进行基因定位?混合测序可以进行GWAS研究或驯化研究吗?


今天和大家分享这些经典案例,说不定能解答您的疑问,帮助打开新的研究思路。


点突变检测

对于突变位点,特别是隐性纯合的点突变,利用混合样本测序研究效果比较好。日本一个研究水稻的实验室,针对点突变检测设计了一系列的检测方法和软件。

图1 点突变检测方法MutMap[1]、MutMap+[2]、MutMap-Gap[3]


01

MutMap

水稻品种Hitomebore的突变体(叶子浅绿色)Hit1917-pl1Hit0813-pl2与野生型杂交,构建了大于200个的F2群体中,选择20个具突变表型子代混合测序。在突变体Hit1917-pl1Hit0813-pl2分别检测到1,001和1,339个G→A/C→T的突变位点;Hit1917-pl1在10号染色体检测到一个包含7个SNP的集合,一个SNP位于基因OsCAO1的编码区,使得植株叶绿素含量降低;Hit0813-pl2在1号染色体体检测到一个包含5个SNP的集合。


02

MutMap+

用化学诱变剂EMS对水稻受精后幼年胚芽进行诱变,诱变后产生的M1(突变位点为杂合位点)。M1自交获得M2,目标突变性状是由一个隐性基因控制的,在M2代出现性状分离;选择杂合突变基因型的M2自交,获得M3;M3发生性状分离,选择M3子代中野生型和突变型各20-40株个体,混池测序。测序reads比对到亲本基因组上,计算SNP-index。M3突变混合池中目标突变位点SNP-index=1,同时通过比较突变池和野生池的SNP-index差值,计算△SNP-index,利用Fisher精确检验判断候选区间,检测突变所在的基因区域。


03

MutMap-Gap

利用MutMap可以检测点突变,但是如果目标位点位于参考基因组没有组装上的gap区,或是参考基因组不具有的序列中,那么利用MutMap检测方法则不能有效检测到目标突变位点。MutMap-Gap方法结合了MutMap和de novo组装,首先将所要研究的样本进行MutMap分析,通过计算SNP-index,分析SNP-index peak区,发现找不到跟突变性状相关的基因;那么突变位点很有可能就在品系特有基因区域内,将之前比对不上参考基因组的野生型亲本unmapped reads和MutMap分析中SNP-index peak区域的野生型亲本比对上的reads一起进行de novo组装,获得潜在的新基因,并以此为参考再计算SNP-index,检测目标突变位点。


作图群体混合分组分析(BSA)

棉花突变体T582是由棉花品种TM-1突变获得,它与TM-1有5种突变表型不同,包括V1-黄叶、cu-上曲叶、gl1-茎与圆荚无气封、fg-窄苞叶、cl1-双胞圆荚。T582与TM-1杂交,F1与T582回交构建BC群体,根据5种突变表型选择突变表型样本28个进行混合测序。T582测序37.9X、混合样本测序7.2-13.8X。T582 测序reads比对回TM-1 参考基因组,检测双亲间的SNP,突变表型混合样本测序reads比对回参考基因组 TM-1计算SNP频率,筛查只含有 mutant-type SNPs的区域。

图2 BSA分析定位棉花突变位点[4]


混合样本GWAS分析

从意大利和澳大利亚收集到3万个野生果蝇,分成5份,意大利3份,澳大利亚2份,在实验室环境下繁殖一代,检测8000个雌性果蝇腹部颜色,然后5个重复中各取100个黒腹和100个浅色腹部的样本混合测序,检测部位为A7背片。Pool-GWAS检测到17个SNP(FDR<>tanbab1的附近。但是检测的SNP没有位于基因编码区内的,而是位于基因tanbab1顺式调控区域。上面是利用5个重复的群体获得的结果,如果分别用100vs100的样本分析检测功效降低很多,只有几个显著性关联位点。但是在本研究中作者也提到Pool –GWAS 研究复杂遗传背景的性状功效降低,对稀有变异的检测能力下降。

图3 果蝇混合样本GWAS分析[5]


混合样本研究驯化

家鸡的现代野生型祖先和 8个品系的家鸡,每个品系选择8-10个个体进行pooling测序,平均每个个体0.5X;利用驯化相关区域杂合度降低,及与祖先红原鸡遗传距离增加的特点,在家鸡的基因组上分析筛选出蛋鸡驯化的关键基因 (TSHR);用同样的方法,找到肉鸡驯化的关键基因。但是我们也可以看到这样分析获得的驯化相关位点很多,如果想用类似的方法检测复杂性状相关位点,后续挖掘真正的功能位点的难度还是很大。

图4 鸡混合样本研究驯化[6]

 


上面提到的都是DNA层面的混合测序,那么利用RNA混合测序可以进行类似的研究吗?


Pooled RNA测算等位基因频率,准吗?

Pooled RNA-seq区别于DNA pool-seq测序,RNA在不同的样本间、不同的基因位点、同一基因不同等位基因间的表达量都可能不同。从图5研究的结果可见混合RNA测序比单独RNA测序检测的SNP数量大幅下降,高质量SNP中只有26.8%在Pool-seq中被检测到,并且大部分是MAF>0.25。混合样本测序对于MAF小的SNP等位基因频率预估错误率比较高,但随着MAF增大,错误率降低。样本间基因表达水平的差异会影响等位基因频率检测。但是基因表达水平检测结果与混合与否差距不大。所以对于非稀有SNP,利用Pool RNA-seq检测等位基因频率也是可行的,并且同时可以研究基因表达差异。但是相对而言RNA测序检测的SNP数量低,而且只适用于高频的SNP,应用的限制性更高,非必要的情况下还是优先选择DNA测序。

图5 混合RNA测序计算等位基因频率评估结果[7]


小麦RNA pooling测序BSR分析

小麦条锈病高抗品种和高感品种杂交构建RIL群体,筛选高抗和高感各40株小麦混合,转录组测序进行BSR(bulked segregant RNA-seq)分析。在4B染色体长臂上检测到12个SNP与抗性有关联。然后筛选4BL上的DNA标记进行BSA分析,验证了分析结果。但是RNA测序只能检测表达基因上的SNP,比DNA层面的变异少,同时由于存在RNA编辑等问题,RNA层面检测的SNP和DNA层面也是有差别的,所以只有DNA层面无法实现,或DNA测序成本过高(如超大基因组),可以选择BSR,否则还是更推荐BSA。

图6 小麦BSR分析定位条锈病抗性基因[8]

 

什么研究推荐样本混合测序?

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多