分享

用R画火山图的几种方法

 生物_医药_科研 2019-09-01

火山图(volcano plot)常用于显著差异基因表达的展示,包含显著和差异两个重要信息。

那么如何看懂一张火山图所包含的信息呢?首先需要知道,火山图的横坐标通常用log2(fold change)表示,差异越大的基因分布在两端,纵坐标用-log10(pvalue)表示,T检验显著性P值的负对数。由于P值越小表示越显著,所以我们进行-log10(P value)转化后,转化值越大表示差异越显著。通常差异倍数越大的基因T检验越显著,所以左上角和右上角的值往往是我们关注的。

随机生成log2FoldChange和padj的数值

log2FoldChange<-sample(rnorm(10000,mean=0,sd=4),1000,replace=T)padj<-sample(runif(10000,0,0.08),1000,replace=T)#log2FoldChange和padj合并到一个数据框mydata <- data.frame(log2FoldChange,padj)##对满足不同条件的数据给不同的标记,放入Condition列,颜色放入color列mydata$Condition=ifelse(mydata$log2FoldChange>=1 & mydata$padj<=0.05,'up',ifelse(mydata$log2FoldChange<=-1 & mydata$padj<=0.05,'down','normal'))mydata$color=ifelse(mydata$log2FoldChange>=1 & mydata$padj<=0.05,'red',ifelse(mydata$log2FoldChange<=-1 & mydata$padj<=0.05,'green','gray'))

接下来就开始画图。

1.直接用plot画图

plot(mydata$log2FoldChange,-log10(mydata$padj),col=mydata$color,pch=20,cex=.3,xlab='log2 fold change',ylab='-log10 p-value',font.lab=2,font.axis=2,cex.axis=.9)##用abline给几条虚线abline(v=1,lty=3)abline(v=-1,lty=3)abline(h=-log10(0.05),lty=3)

结果图如下所示:

2.用ggplot2画图

library(ggplot2)p <-ggplot(data=mydata, aes(x=log2FoldChange, y=-log10(padj), colour=Condition)) + geom_point(alpha=0.8, size=1) + xlab('log2 fold change') + ylab('-log10 padj')+geom_hline(yintercept=-log10(0.05),linetype=4)+geom_vline(xintercept=c(-1,1),linetype=4)+scale_color_manual(values=c('up'='red','down'='green','normal'='gray'))p

结果如下图所示:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多