在这三篇文章中,大部分图都是比较平平无奇的WB和ELISA图,但是也不乏有清新脱俗的图,比如文章中出现的主成分分析图以及热图。 主成分分析图(PCA) 热图 这些图片一出现,是不是让你眼前一亮,有种高大上的感觉,今天笔者就给大家讲讲如何做这些精美的图片。无需R语言,这些图可以用一个在线可视化网站实现,这个网站就是clustvis,网址为https://biit.cs./clustvis/。 在讲述如何作图之前,先给大家说说PCA(主成分分析)的含义,通过名称大家应该能够猜出来,就是对样本中主要成分进行分析,是一种重要的降维处理方法。 怎么理解呢,这里举一个不是十分恰当的例子,比如你有10个样本,想通过质谱鉴定出他们的差别,如果你每个样本只检测一个具体的蛋白,结果很容易在一维图上展现出来,但是如果你每个样本检测了100个蛋白,就相当于100维度,这是无法使用图像清晰展现出来的,这个时候我们就需要利用PCA分析进行降维,如果降至2个维度,我们就能用图像展示出来。在这个过程中,需要对测定的100个蛋白进行定量处理,在这10个样本中,有的蛋白变化很大,有的则很小,通过PCA降维就能够突出蛋白变化较大的样本。 下面开始讲述如何用该网站进行可视化PCA分析。 进入该网站,在首页,我们可以看到该网站呈现出来的热图和PCA分析图。 点击data import,在左上方的Choose data input type栏目中,有几种不同数据导入方式,可以直接上传数据,也可以直接导入从ArrayExpress数据库获得的公共数据,在这里我们选择网址提供的样本数据,随后在Choose dataset栏目中选择鸢尾花的数据集(Iris flowers)。可以看到该数据集提供150个样本,每个样本中又检测了花瓣的长和宽以及花萼的长和宽。 待网页刷新后,选择数据预处理界面(date pre-processing),在页面的左端,有不同的处理方式。 Transformation:是否需要对数据进行转换,如果数据差异很大,可以进行转换,在这里笔者选择默认的no transformation; Column annotation groups tokeep:是否需要保留注释,这里选择保留所有注释; Collapse columns withsimilar annotations:折叠具有相似注释的列,这里选择不折叠; Maximum percentage of NAs:行或者列允许NAs的最大百分百,这里保存默认值; Row scaling和PCA method分别为行距和PCA分析方法。 各项条件选择完毕后,点击PCA栏目,待网页自动刷新后即可获得主成分分析图。 在这个页面左上方中,可以对数据的颜色,形状和标签进行修改,以便获得更加美观的图片;在页面的正上方,可以对获得的PCA分析图片进行下载。 PCA分析完成后,可以接着获得热图,点击Heatmap,待网页刷新后,获得以下热图分析。 同样能够调整热图的颜色的标签,也能够下载不同格式的图片,直接用于文章中。 学会了吗,热爱科研的同行们,有了清新脱俗的主成分分析图和热图,文章的档次还会低吗! |
|
来自: 小梦想在努力 > 《数据库/分析/可视化》