名词解释De novo:拉丁文,从头开始的意思,de nove测序则是指在不需要任何参考序列的情况下对某一物种进行基因组测序,然后将测得的序列进行拼接、组装,从而绘制该物种的全基因组序列图谱。 重测序概念:重测序是全基因组重新测序的简称,是指是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。(没有组装的短的Reads序列) Contig:是指Reads基于Overlap关系,拼接获得的长的序列; Scaffold:是指将获得的Contig根据大片段文库的Pair-end关系,将Contig进一步组装成更长的序列; Contig是无Gap的连续的DNA序列,而Scaffold是存在Gap的DNA序列。 小片段文库是指插入片段小于1Kb的文库,小片段文库产生的Reads主要用于拼接成Contig。例如在de nove测序中,我们通常要不同梯度下片段如250bp、350bp、500bp等;建库测序流程如图3所示。 值得注意的是除了de nove测序需要建大片段文库外,其他测序如重测序只需建一个小片段文库(250bp),而构建大片段文库过程繁琐,价格较高。这是de novo测序比重测序价格贵的原因之一。 ScaffoldN50是将组装得到的Scaffold从长到短进行排列,当长度达到总长度一半的时候,此时该条Scaffold的长度即ScaffoldN50 除用ContigN50和ScaffoldN50对基因组进行评估外,还会对基因组进行序列一致性评估、序列完整性评估、准确性评估、Cegma保守性评估等。 我们要做的是对基因组进行注释,注释主要是对基因组中的
注释的方法有同源注释以及de nove预测等。重复序列的注释主要是串联重复序列注释(卫星DNA、小卫星DNA以及微卫星DNA等)和散列重复序列(LTR、LINE、SINE以及转座子序列等)。非编码RNA的注释主要是对MicroRNA、rRNA以及tRNA等注释;基因注释主要是对基因的启动子、外显子、内含子等注释。 原文链接:动植物De novo 测序知识大讲解 基因组de novo组装知识基因组特征评估:
按测序材料采用不同策略进行测序:
案例:
|
|
来自: 昵称70435864 > 《待分类》