一代测序:Sanger测序原理
简单概述 双脱氧终止反应法,聚合酶延伸链 (由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应)
设置四个反应体系1-4,分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有放射性标记)例如1中是ddATP,它就负责测定T碱基的位置;
之后大批量的核苷酸反反复复的结合,把所有的位点都结合
最后利用凝胶电泳和放射自显影只能看到带有荧光标记的ddNTP,先利用电泳条带前后关系确定下他们的排列顺序,再用ATCG关系反转一下
优点:准确度很高,99.999%
缺点 一代最长能测1000bp,再多了就要重头开始一遍导致成本高;另外它一次只测一条,也就是所谓的通量低。
二代测序NGS步骤与原理(先看必备words,见下)
三平台:Roche公司的454技术、illumina公司的Solexa/Hiseq技术(占主要市场,PE(Pair End双端)测序原理)、ABI公司的SOLID技术
双端测序原理:如下
建DNA文库
超声打断,用酶补平为平末端,再在两端加上互补配对的adapter(接头),再通过PCR扩增达到一定浓度,构成单链DNA文库
adapter修饰,图片来自生信星球**
2. 上样
3. 桥式PCR
第一轮扩增模版:flowcell表面固定的序列(模版链),与lane接头配对产生了补成双链,后来强碱试剂作用下两条互补链被分开,模版链被冲走,但是互补链稳固定在lane上。接下来就要对互补链p5'- p7' 进行操作
去杂:加入NaOH强碱性溶液使双链DNA变性;模板链会被洗脱
图片补充来自生信星球
桥式形成: 加入缓冲溶液,互补链的p7'和lane上的p7互补(但还是一个lane中的),形成了桥的样子
桥式PCR: PCR弯成桥状,一轮桥式扩增一倍
循环: 大约35个循环后,最终每个DNA片段都将在各自的位置上集中成束,称为cluster,这是一群完全相同的序列。目的在于实现放大单一碱基的信号强度,满足后期测序需求
解链: 桥式PCR完成后,形成了很多的桥形的互补双链,再次强碱解链。这一次不再进行复制,而是利用一种酶--甲酰胺基嘧啶糖苷酶(Fpg)选择性的切掉lane 上p5' 连接的链,只留下了与lane p7连接的链,这就是Forward Strand(正链,相对应的reverse strand 是负链)
4. 测序(边合成变测序)
4①双端测序之Forward Strand
4② Index测序
index1 primer和链上的index1 互补配对,进行index1的检测,测完后,洗脱产物,得到index1 的序列。之后再桥式,再进行index2的。图片来自生信星球
4③双端测序之Reverse Strand: 洗脱掉index2 产物后,还是一个桥式扩增得到双链,再变性得到原始Forward strand 和 新的Reverse Strand, 除去测完的Forward strand。然后和测Forward一样,也是先连接primer,只是连接的位点是Primer Binding Site2,测完后得到reverse strand序列
二代优点:一个循环就能测定flowcell上成千上万的cluster,这就实现了高通量;illunima一次只添加一个dNTP,确实能够保证准确测量同聚物的长度问题
二代缺点:illumina会限制合成的链的长度(原因在于测序长度越长,杂信号越多)
三代测序
必备words(需不断更新)
flowcell: 测序反应的载体/容器,1个flowcell有8个lane
lane: 测序反应的平行泳道,试剂添加、洗脱等过程的发生位置
tile: 每次荧光扫描的位置,肉眼是看不到的
双端测序: 可能序列比较长有四五百bp,两边各测120-150bp
junction: 双端测序中间一些没有测到的区域
flowcell构造:一个lane包含两列(swath),每一列有60个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)
sequence by synthesis, SBS 边合成变测序
同聚物:就是3'端一个一个加dNTP聚合而成的聚合物,因为还带接头,所以不能直接说成DNA分子
一二三代测序总结与对比(引自生信星球)
二代测序主要平台有:
1.罗氏454公司的GS FLX sequencer
2.Illumina solexa genome analyzer
3.ABI公司的SOLiD sequencer