测序项目完成,我们会获得大量的数据,包括有很多图片在内。当然,对于熟悉生物信息分析的大神而言,这些图片太easy。但是,在科研岗位上,还有很多生信小白。。。。。所以我们还是来讲一下如何解读这些结果图片。 在RNA-seq项目中,常见的结果图片包括:火山图、韦恩图、聚类热图、log2(ratios)折线图、有向无环图、散点图、代谢通路图、蛋白互作网络图等等。 本期,我们先来看看火山图、韦恩图、聚类热图和折线图。 火山图 RNA-seq中,火山图(Volcano Plot)显示了两个重要的指标:fold change和校正后的p value,利用T检验分析出两样本间显著差异表达的基因后,以log2(fold change)为横坐标,以T检验显著性检验p值的负对数-log10(padj)为纵坐标。 图示解释:
因此,左上角和右上角的点分别表示表达水平差异非常显著的下调基因和上调基因。 对于有生物学重复的样本,要求padj﹤0.05,所以,上图中红色点和绿色点均在1.3以上。 韦恩图 韦恩图(维恩图)也叫文氏图,用于显示元素集合重叠区域的图示,常用圆或椭圆表示。根据参与集合数,可将venn图分为二集合、三集合、四集合、五集合等。 可利用R语言来实现,比如使用R语言中的 Vennerable package。 图示解释: 在RNA-seq项目中,每个椭圆表示一个比较组合(处理组 vs对照组)中的差异基因,椭圆重叠区域的数字表示对应的多个比较组合之间的共有差异基因个数,未重叠区域表示各比较组合特有的差异基因。可以通过与韦恩图对应的表格,可以看到比较组合共有和特有的基因信息。 聚类热图 热图以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区,用在RNA-seq中,热图可以表示图中某一个位置的基因的表达水平高低。聚类热图可用于判断不同实验条件下差异基因的表达模式。每个比较组合都会得到一个差异基因集,将所有比较组合的差异基因集的并集在每个实验组/样品中的FPKM值,用于层次聚类、 K-means聚类和SOM聚类分析。热图可以通过R语言工具中的pheatmap实现。 图示解释:
折线图 log2(ratios)折线图展示的是各个基因在不同样本中表达量的变化趋势(表达模式)。表达模式相近的基因被聚为一类,根据基因的表达模式差异,会形成多个subcluster。 图示解释:
以上涉及到的一些名词解释如下:
文案:杜德超(转录调控事业部) 编辑:贾红丽 |
|