现今的生信领域几乎就是和无数的序列打交道,而这些序列的来源就是如今风靡的高通量测序技术,现今的测序不论是测RNA、DNA、miRNA还是ChIP-Seq等等,都是基于NGS(二代测序,next-generation sequencing)的技术发展而来的,目前最为常用的就是illumina公司的测序技术,当然除了illumina公司外还是有其它二代测序技术存在的,ABI公司也有SOLiD测序技术。而之所以被称为二代测序,是因为比一代测序技术提升了非常多,具体体现在速度、准确性、效率等等方面。 由于序列对于生信行业的重要性,我认为了解基本的测序技术的原理是非常必要的,这也有利于生信技术人员了解到测序序列的特点和测序序列中可能出现的问题,了解到现今测序技术的局限性,甚至提出意见改进测序技术。因此本文会简要介绍当今最常用的illumina测序技术的测序原理。 基因文库制备(sample prep)制备测序基因文库是最初始的一步,这里我不过多解释文库,简要解释文库就是一个包含你所要测序的所有基因序列的集合体。测序过程中的基因文库的制备是将要测序的样本经过序列片段化(fragmentation)、再将这些片段化后得到的所有短序列的两端加上接头,从而将要测序的序列制备成为一个有很多拥有相同双端序列,但内部序列不同的序列片段集合体。具体步骤如下图。 图自:https://max.book118.com/html/2017/0924/134913788.shtm
有博客中写到文库制作是有两次序列片段化的过程的,这个具体我不是很清楚,但是实际上操作是一样的,只是会重复某些步骤而已。有兴趣的人可以去看这篇文章 这里要提一下加上的接头序列,一个序列片段加上接头后即变成如图的序列:
生成序列簇(cluster generation)这一个步骤很多博客直接起名为桥式PCR,我觉得不够完整,桥式PCR只是是其中的一个重要的步骤,重要的是通过一系列包含了桥式PCR的步骤,从而生成了测序序列的序列簇。什么叫序列簇呢?就是相同的序列都聚集在一起从而形成的一簇序列。这个步骤是最最最核心的步骤,也是illumina公司的专利技术所在。 生成序列簇的意义是因为若是仅有一条序列进行测序,而测序时每条序列上又仅有一个荧光分子,而一个荧光分子所释放的荧光是很难被设备检测到的,而将每条需要测序的序列进行处理从而生成序列簇后就能在每次检测荧光时检测到一群相同的序列所释放的荧光,这样就不会有刚刚的问题了。大致了解序列簇后,接下来就要介绍序列簇的生成了。 序列簇的生成是在flowcell(流动槽)上形成的,一个flowcell的外观如图:
上面这张图就是一个孔中的情况,每个孔中都密布着DNA探针,这些探针序列是能够和之前提到的接头序列互补配对的,所以每个孔中就只有两种DNA探针,这些探针序列是通过共价键结合到孔底部的(这些技术都是illumina的专利技术)。 了解了上面的知识后,就可以开始介绍如何制作序列簇啦。 首先,将之前制作好的DNA文库变性解旋,以使加入的序列都是单链状态,将这些单链序列加入到流动槽之中,而illumina独有的技术能够确保每个纳米井中仅进入一条序列。由于每个纳米井中只进入一条序列,因此每个纳米井中最终都只生成一个序列簇,也正是因此每一个纳米井中的所有序列发出的荧光都是一样的,因此对一个纳米井中的荧光检测的结果也就是一条序列测序的结果,这样也就完成对单独的一条序列进行测序的需求啦。 每条序列进入纳米井后,由于具有接头序列,因此其能够与纳米井中的一条探针序列配对,配对后加入dNTP和聚合酶就能够使序列延伸到文库中序列的长度(包含接头),如下图: 测序(sequencing)达到上图所示的状态后,就差不多算完成了。但是要进行测序,就得先确定测序的方向,而刚刚提到了双端测序,也就是我们要对序列的两条单链序列进行分别测序。首先进行read1的测序,使用一种酶在能与read2引物配对的序列的某个位置上将read1切断,这样每个纳米井中就只剩下了一种方向的序列(不是5→3就是3→5),之后还会对伸出那端的核酸进行修饰防止额外延伸。这样就能够进行一端的测序啦。 贴一下示意图:
上面第一部分介绍到了接头中包含了一端index序列,在测read1结束后就会测index序列了,测index序列时,首先需要将测序得到的双链水解掉。再使用read2引物和序列接头(这时配对的部分与read1部分不同,但是延伸的方向)配对,配对后延伸大概六到八个碱基即可,这六到八个碱基就能够用于确定样本的来源了。 测完index序列后就可以开始对read2的测序啦,要对read2测序很简单,就只需要再进行一次桥式PCR即可,这样得到的纳米井就是所有探针序列都被延伸过的结果,如图(同上面的一张图一样): 数据处理(data analysis)在测序结束后,需要对得到的结果进行处理,这个方面我不是很清楚,不过可能大多会得到fastq文件。
这个部分不多讲,因为我不是很熟,以后有机会会补上的。 叮参考:https://www.bilibili.com/video/BV13p411f7vx |
|
来自: 刘得光3p6n6zqq > 《已打印》