火山图火山图用于展示基因表达差异的分布,横轴为 一步绘制火山图输入数据格式火山图需要的数据格式如下 (本文用到的数据文件名为
id log2FoldChange padj significant labelE00007 4.28238 0 EHBIO_UP AE00008 -1.1036 0.476466843393901 Unchanged -E00009 -0.274368 1 Unchanged -E00010 4.62347 7.37606076333335e-103 EHBIO_UP -E00012 0.973987 0.482982440163204 Unchanged -E00017 -1.30205 0.000555693857439792 Baodian_UP BE00024 0.617636 2.78047837287061e-13 Unchanged -E00033 1.48669 2.56000581595275e-60 EHBIO_UP -E00034 -0.783716 0.00341521725291801 Unchanged -E00036 2.01592 6.03136656016401e-06 EHBIO_UP CE00040 -1.89657 4.73663890849056e-21 Baodian_UP -E00041 -0.268168 0.563429434558031 Unchanged -E00042 0.0861048 0.367700939634328 Unchanged -E00043 -1.19328 1.42673872027352e-153 Baodian_UP -E00044 -0.887981 2.43067804654905e-26 Unchanged -E00047 -0.610941 5.51696648645932e-57 Unchanged - 使用significant列绘制火山图# -f: 指定输入文件,格式如上 这个图看上去还可以,没有太大的问题。但有部分点与最顶端的线重合了,这些点的pvalue为0,取负对数后为负无穷。另外在一些情况下,会存在部分基因的pvalue极小,使得整张图呈现一个压缩的趋势,大部分点偏安于图的下方,中间大段空白,最上面零星几个点。为了避免这种情况,程序设置了参数 # -M 10: 指定P-value(也可能是p-adj);若小于10^(-10),则为10^(-10) 注意看纵轴的变化,和最上面排成一条线的一堆点。 自动计算significant列绘制火山图若不存在 # <-f '0.05,1'="">, 默认值,故命令行中未写,引号是必须的 # -M 10: 与之前相同 火山图中标记基因的名字# -l: label,在图中标记部分基因的名字;
今天先到这,前天提到的富集分析图,今天的火山图都是散点图的一种,后续介绍散点图时再对用到的R代码进行解读。 |
|