分享

全基因组测序指南(一):名词解释

 生物_医药_科研 2018-12-11


Barcode


条形码,因为在测序过程中往往是多个样本一起测序,所以Barcode的作用就是区分测序产生序列到底是来源于哪一个个体;另外,10X Genomics在测序过程中也用到了Barcode,其作用是区分测序产生的序列是否来源于同一个大片段,更加有利于组装成更高质量的基因组。

BAC


细菌人工染色体(Bacterial artificial chromosome),可以构建超长片段的DNA序列,在基因组组装过程中有助于组装更高质量的基因组,也可用于基因组的组装质量评估。

Contig


拼接软件基于reads之间的重叠(overlap)区,拼接获得的没有gap的序列称为Contig(重叠群)。与之对应的一个概念是Scaffold:是指将获得的Contig根据大片段文库的Pair-end关系,将Contig进一步组装成更长的序列。

 

ContigN50


衡量Contig的一个指标。即将所有的Contig长度相加,获得一个Contig总长度,然后将所有的Contigs按照从长到短进行排序,将Contig按照这个顺序依次相加,当相加的长度达到Contig为总长度的一半时,最后一个加上的Contig长度即为ContigN50。

 

ContigN90


概念与N50的类似,即当相加的长度达到Contig总长度的90%时,最后一个加上的Contig长度即为Contig N90。N50或者N90是衡量基因组质量的一个重要指标。

 

ScaffoldN50


衡量Scaffold的一个指标。即将所有的Scaffold长度相加,获得一个Scaffold总长度,然后将所有的Scaffold按照从长到短进行排序,将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。ScaffoldN90的概念与N50的类似,即当相加的长度达到Scaffold总长度的90%时,最后一个加上的Scaffold长度即为Scaffold N90。N50或者N90是衡量基因组质量的一个重要指标。

 

Coverage


测序深度,经过测序后一段序列每个碱基平均被覆盖的次数称为测序覆盖深度(Sequencing Coverage Depth);比如,假设一个基因组大小为100M,测序深度为10X,那么获得的总数据量为1G。这个概念注意与测序的覆盖度区分,是指测序获得的序列占整个基因组的比例,也可理解为对目的基因组的覆盖程度,比如一个基因组有些区域难以测得,基因组的覆盖度往往不能达到100%覆盖。

 

De novo assembly


基因组的从头组装,指不依赖任何参考基因组,依靠测序序列进行从头组装。

 

Fosmid


一种克隆基因组片段的细菌载体,插入片段在40kb左右。

 

K-mer


指的是将一条read连续切割,挨个碱基滑动得到的一序列长度为K的核苷酸序列,这个概念在许多组装算法中会用到。

 

Masking


将一段DNA序列中的ATGC(通常是重复序列或者低质量序列)转换成无信息的字母N或者小写的atgc,通常在基因组注释的过程中会用到这一概念。

 

Mate-pair


旨在生成一些短的DNA片段,这些片段包含基因组中较大跨度(2-10kb)片段两端的序列,更具体地说:首先将基因组DNA随机打断到特定大小(2-10kb范围可选);然后经末端修复,生物素标记和环化等实验步骤后,再把环化后的DNA分子打断成400-600 bp的片段并通过带有链亲和霉素的磁珠把那些带有生物素标记的片段捕获。这些捕获的片段再经末端修饰和加上特定接头后建成mate-pair文库,然后上机测序。

 

Paired-end sequencing


短的DNA片段(长度通常仅有几百bp)两端的序列信息。

 

Reads


即我们通常说的读长的意思,它是指高通量测序平台直接产生的DNA序列。

 

大片段文库


是指插入片段大于1Kb的文库,大片段文库主要是用于将Contig进一步组装成Scaffold。文库类型通常有2Kb5Kb10Kb15Kb以及20Kb等,建库和测序使用Mate-pair sequencing的方法。

 

小片段文库


是指插入片段小于1Kb的文库,小片段文库产生的Reads主要用于拼接成Contig。例如在de novo测序中,我们通常要不同梯度下片段如250bp350bp500bp等,建库和测序使用Paired-end sequencing的方法。

 

今天先给大家介绍到这里,下次再为大家介绍基因组测序更详细的内容。


 

参考文献


Ekblom R, Wolf JBW. A field guide to whole-genome sequencing, assembly and annotation[J]. Evolutionary Applications, 2014, 7(9): 1026-1042.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多