分享

理性看待基因芯片与高通量测序

 诙太狼宋晓辉 2017-08-20


二十一世纪,是生命科学的世纪。而现今生命科学的发展,与生物检测技术的发展密不可分。高通量检测技术,是生物检测技术的重要成员之一。其中,高通量基因芯片和测序技术是实现细胞内全基因组核酸组成与变化的重要工具。那么,这两个发展时间不同,成长道路不同的高通量检测技术,到底孰优孰劣呢?



基因芯片产生于上世纪90年代,通过在微小芯片上合成成千上万个长度为几十个碱基的探针来实现对全基因组基因信息的检测。根据检测目的的不同,基因芯片可分为SNP芯片,拷贝数检测芯片,RNA表达检测芯片和甲基化检测芯片等。基因芯片技术平台主要由以下几个特点:

1.     芯片基于已知序列信息进行探针设计,以碱基互补杂交,通过检测荧光表达来进行序列识别和丰度评判。因此,基因芯片是封闭系统,只能检测已知物种;

2.     芯片检测经历近30年的发展,检测技术和后期分析方法成熟,数据易读性强。芯片可实现在短期内拿到大样本的数据信息;

3.     芯片以杂交和荧光检测为基础,这么多年的实践证明,通过芯片检测筛到的差异基因,后期通过 qRT-PCR等手段验证的吻合率还是很高的;

4.     芯片性价比高。基于碱基互补杂交原理,以转录组检测为例,一张基因芯片可以实现mRNA,lncRNA,circRNA不同种类的RNA全基因组检测。因此,只要一个样本的总RNA量大于200 ng,一张芯片即可检测细胞内多类RNA分子的表达情况。

以二代测序技术为标志的高通量测序技术发展于2000年以后。经历了短短的十几年发展,测序技术发展呈现以下几个特点,(1)以Illumina测序平台为主导的二代测序平台,检测通量越来越大,检测时间越来越短,成本越来越低;(2)测序技术已由二代向三代,四代进化。三代测序平台已实现长片段序列检测,通量和检测范围更加广泛;(3)目前高通量检测平台还是以二代测序平台为主,三代测序平台初具雏形,四代平台还在成长。以二代测序为代表的高通量测序技术,主要有以下几个特点:

1.     测序是开放检测平台,无论是已知物种,还是未知物种,只要有核酸序列,都可通过建库来进行检测;

2.     测序不受已知背景知识影响,通过测序平台,可以发现新的序列,新的突变与基因转录本等信息;

3.     测序覆盖范围的大小与数据量相关,对于低表达丰度的基因或者稀有突变,需要足够的测序深度才能发现;

4.     测序对于特殊转录组成员检测需要特殊处理,如lncRNA需要链特异性建库,circRNA最好在建库前先用RNase R消化线性RNA,单独富集circRNA后再进行建库。

那么,这两个技术平台在医学及科研领域的运用情况是怎么样的呢?

A.从实际情况来看,虽然目前大家运用测序平台进行检测的势头越来越高,但是,在样本量大的情况下,特别在临床研究中,芯片由于检测速度快,数据处理简单快捷而受欢迎。相比而言,测序由于目前的分析方法的复杂与数据分析策略的多样性而稍逊风骚。

B.有关这两个技术的官方研究比较主要基于SEQC项目。从SEQC发表的有关两种平台对于疾病预后预测,安全性评价,基因标签可转移性等角度的研究可以看到,芯片和测序的检测效果是类似的,具有很高的一致性和可重复性。因此,从目前的角度来说,这两个平台在技术层面上用于精准医学检测不相上下。

C.  从实际检测效率和后期验证情况来看,有一系列的文章通过实际数据显示,芯片在转录组层面检测灵敏度大于测序。在针对转录组表达检测时,目前市场上主推的6G数据量的RNA-seq,对于检测高丰度基因,是足够了,但是,当面对中低表达丰度基因时,它的灵敏度就没有芯片好了。因此,在针对转录组检测时,特别是针对表达丰度更低的基因时,目前市场上主流的推荐数据量得到的数据,质量相对来说还是稍微比芯片差一些。

D. 从针对特殊检测对象的来说,测序的技术原理导致其分辨率低于芯片。如lncRNA的检测,测序是通过测到序列,进行拼接和分析来反应是否存在某个lncRNA,是否在样本间有差异。那么问题来了,有些lncRNA和mRNA是有很多的重叠区域,而lncRNA的本身表达丰度低导致不可能对一个lncRNA的所有碱基都测到。因此,在这种情况下,就无法把lncRNA和mRNA进行精确区分而流失很多信息。而芯片就不同了,由于芯片是针对每一个lncRNA和mRNA的特异性区域设计的探针,所有就能进行特异性的区分了。因此,就这个角度来说,针对一些特殊RNA成员,如非编码RNA,芯片还是有明显优势的。

由此可见,就现阶段来说,至少在3-5年内,我们还不会看到高通量基因芯片和测序技术之间的显著差异。就未来的发展来说,芯片可以继续发挥样本通量高,检测速度快,分析简单等优势;而测序随着技术的进一步进化和分析方法的进一步完善,将会有更加广阔的运用前景。

参考文献:

Zhang,W.; Yu, Y.; et al. Comparison of RNA-seq and microarray-based models for clinical endpoint prediction. Genome Biol. 2015, 16, 133.

Wang, C.; Gong, B.; The concordance between RNA-seq and microarray data depends on chemical treatment and transcript abundance. Nat. Biotechnol. 2014, 32, 926–932.

Su, Z.; Fang, H.; et al. An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era. Genome Biol. 2014, 15, 523.

SEQC/MAQC-III Consortium. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium. Nat Biotechnol. 2014 Sep;32(9):903-14.

Xu J.; Gong B.; et al. Comprehensive Assessments of RNA-seq by the SEQC Consortium: FDA-Led Efforts Advance Precision Medicine. Pharmaceutics. 2016 Mar 15;8(1).

Xu W; Seok J; et al. Human transcriptome array for high-throughput clinical studies. Proc Natl Acad Sci U S A. 2011 Mar 1;108(9):3707-12.


【温馨提示】本文为微信号:基因芯片知识屋(bio-microarry)原创文章,如需转载请注明来源:基因芯片知识屋。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多