分享

我做微生物组分析--经常用到了哪些R包

 微生信生物 2021-07-14

我做扩增子分析流程中常用的R包

下面介绍我常用的R包,还有一些R包比较底层,都会调用,但是不会被我们熟悉,也有一些R包我遗漏了,欢迎大家留言补充。

文件夹和文件管理

  • fs :

    快速复制剪切文件,文件移动,大小统计等,基于高通量数据化整合我还专门使用fs写过一个R包Bigamplicon,用于结合爬虫批量下载和整理NCBI测序数据。

微生物组分析核心R包

  • phyloseq:

    提供S4类对象封装和各种简单的微生物组学数据标准化和转化方法。

  • tidyverse:

    使用tidy家族语法对微生物组数据进行清洗

  • tidyfst :

    快速版本的dplyr, 对于宏基因组数据进行数据迅速清洗。

  • ggClusterNet:

    衔接phyloseq包,扩展phyloseq对数据的标准化和转化方法,提供清洗微生物组数据的更方便的函数,并且可以完成微生物组网络分析,并且具有大量独一无二的可视化方法供大家选择。

    二分网络绘制等

  • EasyStat :

    封装非参数检验和t检验等内容,快速对微生物组数据进行差异分析和可视化。

  • vegan :

    大量的生态学分析功能,目前引用超过1万次,被多个微生物组分析的R包所依赖,例如:

    phyloseq,Microbiome等。

    是微生物生态学分析中最重要的R包之一。

  • Microbiome 提供微生物组分析中常见功能分析函数,尤其是扩展了大量的alpha多样性指标。

  • picante:

    提供系统发育等分析,通常结合vegan共同用于微生物组分析。

  • agricolae 提供统计检验方法能内容,用于微生物组数据的统计分析。

  • MASS :

    提供LDA判别分析等内容,常见的LeFSe便是依赖了MASS包

  • Rtsne :

    提供sne排序算法分析微生物组样本差异

  • edgeR DEsep2 limma :

    对微生物组数据进行标准化和差异分析。

    edgeR DEsep2  输入原始测序得到的微生物组计数数据。

    limma 输入标准化后的微生物组数据。

  • randomForest e1071 caret :

    randomForest,ROCR 提供随机森林算法,支持向量机等机器学习方法的函数对微生物组数据进行分析,ROCR对机器学习结果进行分析和可视化。

  • igraph,sna,ggraph,network tidygraph:

    提供对微生物网络分析和可视化的支持。

  • ape Hmisc eulerr minpack.lm FSA等 提供系统发育分析等一些了微生物生态分析。

    Hmisc用于统计分析和供给图表展示等,eulerr 做欧拉图,是韦恩图的变种。

    minpack.lm 解决非线性最小二乘法等,ape主要用于系统进化树分析,通过核酸序列计算距离树。

    FSA提供生态学的一些估计方法。

    这些R包在做微生物群落系统发育过程中很有用。

  • psych WGCNA:

    提供微生物之间香菇关系的计算等一些列运算。

  • plspm  SEM plspm:

    偏最小二乘路径分析,SEM:

    结构方程模型分析

  • ggpubr 提供一些统计分析和可视化样式

绘图工具包

  • ggalluvial 提供冲击图和面积图等ggplot类图形绘制。

  • ggthemes ggsci:

    提供丰富的图形可视化主题

  • RColorBrewer :

    提供丰富的配色供图片使用。

  • ggrepel :

    解决微生物数据标签重叠问题。

  • ggtree,data.tree,ggdendro,ggstance :

    提供进化树等一系列相关可视化函数。

    ggdendro可以进行进化树数据转化,方便实用ggplot进行联合绘图,微生物组常见的聚类柱状丰富图就可以使用这种方法绘制。

    ggstance实现常见的ggplot2 geoms的水平版本。

  • VennDiagram UpSetR :

    对不同样本或者分组微生物数量统计结果进行可视化。

    UpSetR可以对超过6个分组进行共有和特有数量的展示,但是韦恩图一般只分组数量低于6个。

  • pheatmap aplot :

    绘制微生物组差异热图等可视化,aplot可以结合ggtree和ggplot绘制ggplot版本的热图,方便使用ggplot语法进行修改。

  • ggstar :

    提供了扩展ggplot中点形的绘图函数。

    兼容ggplot,用法类似于geom_point。

    丰富在多个分组的微生物组排序分析绘图点的多样性。

  • ggnewscale :

    方便根据多个分组进行颜色映射,同一个图中允许多个颜色映射。

  • Cairo :

    提供R语言绘图对字体的扩展

  • patchwork :

    提供基于ggplot对象进行拼图的多种函数,并具有非常灵活的拼图样式。

  • circlize :

    绘制微生物物种丰富的和弦图等

数据清洗

  • reshapes 提供长宽数据转化

  • plyr 提供累计求和等功能

  • apply :

    提供对微生物组数据的高级清洗功能

  • parallel :

    提供运算的速度,多线程操作。

  • stat 辅助数据整理,数据标准化等

功能预测

  • pathview :

    提供代谢通路绘图

reference

  • https://cran./web/packages/states/index.html

  • https://cran./web/packages/Hmisc/index.html

  • https://cran./web/packages/eulerr/index.html

  • https://cloud.tencent.com/developer/news/180720

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多