分享

芯片和测序又打架了,这回谁赢了呢?

 诙太狼宋晓辉 2017-08-20

作为高通量检测的两个平台,基因芯片和二代测序之争,目前还是一场没有结果的战役。一老一新,一保守一开放,他们之间不是简单的技术升级的区别,不同的生身导致他们在高通量领域各有所长,各放异彩。也许有人提出来,现在很多文章都力挺测序。但是,科研领域就需要不同的声音。通过下面的一篇最新的文献,我们来看看当最新一代的全转录本芯片和二代测序相遇,会发生什么?

先前已经有很多的研究来比较芯片和测序。但是,有意思的是,这些研究基本上是用10几年前的3’端探针芯片和二代测序进行比较。但是,对于更精细化的转录信息检测,如非编码RNAs或者可变剪切分析,芯片和测序又会有什么样的各自表现呢?本研究以9对肺鳞状细胞癌配对样本为材料,分别用Affymetrix Human Transcriptome Arrays 2.0 (HTA)(最新一代全转录本表达谱芯片)和Illumina HiSeq 2000检测平台,以测序200 M reads为基础,深入比较了芯片和测序在转录本定量检测和可变剪切方面的情况。

1

基因表达检测,二代测序可变性更大

首先,通过对检测基因覆盖范围比较分析,可以发现,芯片和测序不相上下。Ensembl数据库中的92%的mRNA和90%的lncRNA,在两个平台都能检测到。这就有了接下来可以进行比较分析的基础。

不可否认,在进行整体样本PCA分析和相关性分析可以看到,两个平台对于癌和癌旁样本区分方面还是非常明显和一致的。因此,两者对于总体样本检测一致性还是很高的。

对正常和肿瘤组织生物学重复比较分析可以看到,RNA-seq数据,特别在低表达基因方面,样本间的可变性更大,而芯片则没有表达高低间的偏好性。因此,相对生物学重复实验,HTA芯片的稳定性比RNA-Seq更好。当面对大样本差异比较时,芯片稳定性更好(低表达丰度的非编码RNAs检测,也需要考虑这个问题)。

2

基因表达差异,芯片灵敏度更高

通过分析两个平台的检测信号分布强度(log2 intensity values)可以看到,HTA变化范围在3到13之间,RNA-seq在-1到14之间,RNA-seq动态范围更大。但是,一些在RNA-seq中没有检测到的mRNA,在HTA芯片中信号还是可以的。仔细分析可以看到,基因的长度是导致该现象的原因。对于短的基因,RNA-seq检出的可能性更小,芯片是不会有这种情况的。因此,对于短片段基因,芯片检测效果更好。

通过非配对差异分析,在mRNA差异检出数量,HTA对比RNA-seq分别是6173和4777(3683为共有),lncRNA差异检出数量,HTA对比RNA-seq分别是1219和892(376为共有)。那么,这些找出的差异谁更可靠呢?对同样疾病样本在TCGA上的数据分析比较,差异基因中,无论是mRNA,还是lncRNA,芯片与TCGA吻合的基因数量更多。

3

 疾病诊断预测,芯片表现更好

通过高通量平台找到特异性基因,作为疾病诊断预测,哪个会更好?结果显示,无论是mRNA或者lncRNA,HTA平台有更多的基因可作为biomarker。用于疾病biomarker研究,HTA表现更好。

4

可变剪切分析,芯片测序差异较大

可变剪切分析是识别基因不同转录本特异性表达的有效手段。通过对HTA和RNA-seq数据分析显示,RNA-seq鉴定到23,934个差异exons,HTA鉴定到26,999个差异exons(3698个共有)。Junctions差异鉴定,RNA-seq为7063个,HTA为40,384个(1551个共有)。综合两者分析显示,只有207个mRNAs的可变剪切结果在两个平台能同时出现。

以上4方面的内容把最新一代的基因芯片和二代测序用于高通量肿瘤研究时的差异显现了出来。可能偏好于用二代测序做研究的小伙伴们对以上结果并不认同。但是,小编想说的是:1.该文章的客观实验结果是值得尊重的;2.该结果是对现在只认测序,不认芯片的有力回击;3.基因芯片or二代测序,只选对的,两个你都用过了,才知道谁更适合自己。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多