陕西省微生物研究所 常帆 简介文章简介MicrobiomeAnalyst,综合微生物组学数据网页工具,2017年发表在Nucleic Acids Research上:MicrobiomeAnalyst - a web-based tool for comprehensive statistical, visual and meta-analysis of microbiome data. (doi: https:///10.1093/nar/gkx295 ) ,是一款集成数据分析展示工具,主要建立了从OTU table开始的下游分析全套流程。和其他工具最大的不同是提供简单直观的网页可视化操作界面,只需要鼠标点击上传相应的文件就能实现多元化的分析,并输出分析表格和数据展示图形,非常简单易操作。直至2018年10月21日,一直在更新(last updated 2018-10-15)。
主要功能模块网址:http://www./
网站的tutorials提供了每个模块详细的pdf介绍和教程,不同于其他网站,教程图文并茂,很好理解,推荐大家查看。 网站包括4大模块:
网站无需注册,点击就可使用,方便的同时,也不能保存刚刚的结果,需要手动将结果下载到本地。且一段时间无操作时再次点击会刷新到主页,而且网页会偶发异常刷新的情况,使之前的分析中断。所以上传数据开始分析时只能一次分析完,不然就要从头开始。 16S多样性分析展示数据上传及格式要求此处用笔者的6个样本(分2组,每组3个平行)进行测试: 首先点击左上角的MDPMarker Data Profiling (MDP):
其中taxonomy处用哪个数据库注释的就选择哪个,RDP的话选择Not Specific/Other。因为网站只需要三个文件,所以上传真菌注释后选择Not Specific/Other一样能进行后续的真菌扩增子分析。
完成后submit,等待程序运行。结果如下: 数据完整性检查Data Integrity Check 如果数据格式不符合要求,会在右上角报错,提示格式的可能原因,需修改数据再次上传。如果格式合格。显示如下: 首先是此次数据的基本信息: Text Summary:聚类OTU多少,大于2 counts的OTU是多少;样本数,样本分组最大最小平均OTU counts数; Graphic Summary:直观的展示了以上信息。右侧边提供图的PDF和SVG格式下载。后面所有的分析右侧都会提供相应的原始数据表格和不同格式图形的下载。
数据过滤Data Filtering Feature Editor可以对低counts的数据进行过滤,一般认为低counts是测序错误或嵌合体。参数默认即可,有经验者可自行调整。
Sample Editor 可以简便的对分组进行重新调整。在这里可以简单的先不想查看的分组调整至右侧:选中分组名称(支持按住ctrl多选)点击
submit完成后右上角会弹出提示信息和过滤结果。 数据标准化Data Normalization 此处可以选择是否抽平和抽平策略: 图12. 数据标准化方法选择页面 Data rarefying:选择是否抽平序列至最小样本量。 Data scaling:选择数据标准化方法,有不标准化、TSS、CSS、UQ可选,常用TSS或CSS。 Data transformation:选择数据是否进行数据变换(标准化)。 分析主界面现在可以看到分析方法的全貌的树状图:中间分为6大部分,右侧每一个模块包含了一种具体的分析,直接从右侧每个模块点下去就可以看到此次实验分组的所有分析结果展示和统计了。 Choose an analysis method to proceed
可视化Visual exploration:可视化,主要是样本相对丰度展示。 点击第一个框: 堆叠柱状图弹出交互界面,只需要简单的点击勾选,就能完成所有操作。 图15. 物种组成堆叠柱状图 展示可以选择不同分类级别
修改完参数,再次点击Submit,可更新图片结果。 图形会直接展示在下方,右侧有选项可有导出丰度原始表格,导出已生成图片的pdf/svg格式。 之后的所有分析展示操作和这个模块一样:选择修改相应参数→submit更新→查看并保存结果。直观,方便。 交互饼形图交互式的饼图。可以选择展示不同样本的丰度情况,还可以点击左边饼图中的不同区域(例:门水平的Proteobacteria 34%),然后在右侧再展示其他分类级别的下(例:Proteobacteria门中的纲水平菌注释丰度情况)此区域的下级分类比例。经测试有一定的bug,可能无法进行切换或切换不同的分类水平后仍展示的是门水平的结果。 图18. 饼形图展示门,及具体门内纲的组成 Alpha多样性Alpha多样性和显著性检验。可选择不同的level和显著性检验算法。 Beta多样性beta多样性分析,同样可以选择多种分类法PCoA/NMDS;距离算法bray-curtis/Unifrac(weighted和unweighted);和统计方法PERMANOVA/ANOSIM等,可以分组加标签或者分别展示。点击标签还可以呈现 核心微生物组核心微生物分析。可以看到组间主要的核心微生物。也有众多参数可选。 热图聚类热图展示分析。可以按照之前的实验设计文件生成不同分组不同图例的热图。 聚类树图聚类建树。同样提供了包括利用bray-curtis距离等在的聚类方法。 相关分析相关分析,包括了主流的pearson和spearman相关系数的算法。 模式搜索模式分析。以前面相关分析为基础,以某一物种(比如自身实验关注的物种)为参考,分析与其他物种的关系,点击每个物种的details还能看到分组之间的显著性差异子图(两两比较) 单变量分单变量分析。可以选择不同的统计学方法来比较组间差异性,秩和检验就没有显著性,而ANOVA当p值定为0.01时仍有6个门具有显著性。 metagenomeSeqmetagenomeSeq:一种算法,用在疾病领域丰度较低的情况,查看 RNAseq方法RNAseq分析:包括了EdgeR和DESeq2算法.用来检验组间的不同分类水平的差异。 LEfse分析LEfse分析,除了分析得到的显著性最大的OTU或注释,会得到前25位的显著性差异的统计表。默认LDA大于1为有显著性,可以自己调整相关参数。 随机森林随机森林分析,样本量较大(15个)的情况下使用,样本量少随机穷举的时候会显示不出差异。工具还可显示对模型的贡献程度(此处6个样本只是对功能进行了简单展示,具体的算法和生物学意义大家还是要明确,不能生搬硬套)。 功能预测功能预测:PICRUSt需要greengenes数据库注释的结果才可以分析;Tax4Fun需要SILVA数据库注释的结果才能使用。 结果导出重要的部分来了: 点进去后,刚刚做的所有分析在这里均有记录,可以一个一个下载,或者download.zip下载全部数据。最神奇的是点击 总结
|
|