分享

如何用EXCEL画一张帅气的火山图?

 生物_医药_科研 2019-02-15

火山图是生物信息学中常见的图表类型之一,其作用是展示差异基因的分布情况,横轴表示差异基因表达变化的倍数(Fold change),一般常取以2为底的对数,表示为log2(FC),而纵轴则表示p-value,亦或是更为严格的筛选标准q-value(又称adjusted p-value),一般常取负的以10为底的对数,表示为-log10(p-value)。


常用的火山图绘制方法包括R语言的ggplot2包,芯片测序平台自带的内置软件,亦或是在线工具比如ImageGP (http://www./ImageGP/index.php/Home/Index/)。

相关推文:自从用了它,导师被我的论文图片美哭

如何看懂和绘制火山图?

如果你不懂R语言,又不想让自己受到现成的软件作图时受到的格式上的束缚,那么你可以试一试EXCEL!

 

首先我们得到绘制火山图的原始数据,即包括基因名称、P(value)和log(FC)的表格。



然后我们将ID、logFC和adjusted p-value三列单独拿出来,并把adjusted p-value的数据处理成负的以10为底的对数形式。


 

以K、L、N三列作为数据来源创建散点图


 


随后调整图表格式,比如我们换一个这种稍微浮夸一些的


当然了,目前这图肯定是还有一大堆问题的,黑色背景肯定是不行的,坐标轴的位置不好,刻度看不清,区分不出差异基因等等,需要我们自己DIY处理一下,下面我们一一细说:


背景设置成无填充即可



坐标轴的标签位置设置为低,那么坐标轴标签就在左边了,顺手这些标签的颜色都调整成黑色



下面重点说说如何把上下调基因的颜色标注出来。


首先我们要把差异基因从原始数据中挑出来,筛选标准为adjusted p-value<>



我们先设置上调基因,系列名称随便填,X轴系列值设置为logFC那一列(不包括标题那一行),Y轴系列值设置为-log10(q-value)那一列(不包括标题那一行)。



左键随便选中一个点,便可更改该系列所有点的格式



图表中所有的格式选项都是这里,可以尽情发挥自己的想象力:



另外我们还可以增加新的系列,来把我们想要展示的基因名称添加到火山图中



最后另存为保存成PDF格式,结果如下:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多