【原】QIIME 2教程. 25可用和开发中插件AvailableFuturePlugins (2020.2)

宏基因组 2020-10-09

展开全文

前情提要

可用插件

Available plugins

https://docs./2020.2/plugins/available/

用户可以通过插件使用QIIME 2微生物组分析功能。QIIME 2的当前最新版(2020.2)包含以下官方插件：

alignment对齐：用于生成和处理序列对齐

方法

mafft：
使用MAFFT从头进行多序列比对
mask：
保守位置和间隙过滤

composition：用于组成型分数据分析

方法

add-pseudocount：
将伪计数添加到表中

可视化

ancom：
应用ANCOM识别丰度不同的特征

cutadapt：用于从序列数据中除去接头，引物和其他不需要的序列

方法

demux-paired：
将具有序列条形码的成对序列数据拆分
demux-single：
将具有条形码顺序的单端序列数据拆分
trim-paired：
在拆分后的配对末端序列中查找和删除接头序列
trim-single：
按拆分后的单端序列查找和删除接头序列

dada2：用于使用DADA2进行序列质量控制

方法

denoise-paired：
对双端序列进行去噪和去冗余
denoise-pyro：
对单端焦磷酸序列进行去噪和去冗余
denoise-single：
对单端序列去噪和去冗余

deblur：使用Deblur进行序列质量控制

方法

denoise-16S：
对16S序列进行去正向过滤
denoise-other：
使用用户指定的正向过滤

可视化

visualize-stats：
可视化每个样本的Deblur统计信息
demux：用于混合测序样本拆分和查看序列质量

方法

emp-paired：
EMP协议生成的成对末端序列数据进行样本拆分
emp-single：
对通过EMP协议生成的单端序列数据进行样本拆分
filter-samples：
从样本拆分后的数据中筛选出样本
subsample-paired：
子采样配对末端序列，无放回抽样
subsample-single：
子采样单端序列，无放回抽样

可视化

summarize：
汇总每个样本的计数

diversity：探索群落多样性的插件

流程

beta-correlation：
Beta多样性相关
core-metrics：
核心多样性指标（非系统发生）
core-metrics-phylogenetic：
核心多样性指标（系统发生和非系统发生）

方法

alpha：
Alpha多样性
alpha-phylogenetic：
Alpha多样性（系统发生）
alpha-phylogenetic-alt：
Alpha多样性（系统发生）-可选方法
beta：
Beta多样性
beta-phylogenetic：
Beta多样性（系统发生）
filter-distance-matrix：
过滤距离矩阵中的样本。
pcoa：
主坐标分析
pcoa-biplot：
主坐标分析二元图bipot
procrustes-analysis：
Procrustes分析

可视化

adonis：
adonis PERMANOVA检验β多样性组间显著性
alpha-correlation：
Alpha多样性相关分析
alpha-group-significance：
Alpha多样性比较
alpha-rarefaction：
Alpha稀疏曲线
beta-group-significance：
Beta多样性组间显著性分析
beta-rarefaction：
Beta多样性稀疏
bioenv：
环境因子分析
mantel：
将mantel检验应用于两个距离矩阵

emperor：排序绘图

可视化

biplot：
可视化并与主坐标分析交互biplot
plot：
可视化并与主坐标分析图进行交互
procrustes-plot：
可视化并与procrustes绘图进行交互

feature-classifier：序列物种分类

流程

classify-hybrid-vsearch-sklearn：
ALPHA混合分类器：
VSEARCH精确匹配+ sklearn分类器

方法

classify-consensus-blast：
BLAST +一致物种注释分类器
classify-consensus-vsearch：
基于VSEARCH的一致物种注释分类器
classify-sklearn：
预先基于sklearn的物种注释分类器
extract-reads：
从参考中提取读取
fit-classifier-naive-bayes：
训练naive_bayes分类器
fit-classifier-sklearn：
训练几乎任意的scikit-learn分类器
feature-table：用于按特征表处理样本

方法

filter-features：
从表中过滤特征
filter-samples：
从表格中过滤样本
filter-seqs：
从序列中过滤特征
group：
按元数据列对样本或特征进行分组
merge：
合并多个表
merge-seqs：
合并特征序列的集合
merge-taxa：
合并特征分类的集合
presence-absence：
转换为在二元无权重有/无表
rarefy：
稀疏表
relative-frequency：
转换为相对频率
subsample：
子样本表
transpose：
转置特征表

可视化

core-features：
确定表中的核心功能
heatmap：
生成特征表的热图
summarize：
汇总表
tabulate-seqs：
与每个功能关联的序列视图

fragment-insertion：用于扩展系统发育

方法

classify-otus-experimental：
通过在参考系统发育中找到最接近的OTU，获得分类谱系
filter-features：
从表中过滤树中的片段
sepp：
使用SEPP将片段序列插入参考系统发育

gneiss：用于构建成分模型的插件

方法

assign-ids：
在树的内部节点上分配ID，并确保它们与表列一致
correlation-clustering：
使用特征相关的层次聚类
gradient-clustering：
使用梯度信息的层次聚类
ilr-hierarchical：
等距对数比转换应用于层级聚类
ilr-phylogenetic：
等距对数比变换应用于系统树

可视化

balance-taxonomy：
balance摘要
dendrogram-heatmap：
树状图热图
lme-regression：
简单线性混合效应回归
ols-regression：
简单普通最小二乘回归

longitudinal：用于配对样本和时间序列分析的插件

流程

feature-volatility：
特征易变性分析
maturity-index：
微生物成熟度指数预测

方法

first-differences：
计算相继状态之间的一阶差异或与基线的差异
first-distances：
计算相继状态之间的第一距离或距基线的距离
nmit：
非参数微生物相互依赖性测试

可视化

anova：
ANOVA检验
linear-mixed-effects：
线性混合效果建模
pairwise-differences：
成对差异检验和箱形图
pairwise-distances：
成对距离检验和箱线图
plot-feature-volatility：
绘制纵向特征波动图和重要性
volatility：
生成交互式波动图

metadata：处理元数据

方法

distance-matrix：
从数字“元数据”列创建距离矩阵

可视化

tabulate：
以交互方式浏览HTML表中的元数据

phylogeny：生成和处理系统发育

流程

align-to-tree-mafft-fasttree：
使用fasttree和mafft对齐构建系统发育树

方法

fasttree：
使用FastTree构建系统发育树
filter-table：
从表中删除树中不存在特征
iqtree：
使用IQ-TREE构建系统发育树
iqtree-ultrafast-bootstrap：
使用具有引导支持的IQ-TREE构建系统发育树
midpoint-root：
中点根系统发育树
raxml：
使用RAxML构建系统发育树
raxml-rapid-bootstrap：
使用RAxML通过自展支持构建系统树

quality-control：用于特征和序列数据质量控制

方法

exclude-seqs：
通过比对排除序列

可视化

evaluate-composition：
评估样本的预期分类与观察分类
评估序列：
比较查询（观察到的）与参考（预期的）序列
评估分类法：
评估预期分类法与观察分类法的分配

quality-filter：用于基于PHRED的过滤和修整的插件

方法

q得分：
基于序列质量得分的质量过滤器
q-分数连接：
基于连接序列质量得分的质量过滤器

样本分类器：用于对样本元数据进行机器学习预测的插件

分析流程

分类样本：
训练和测试交叉验证的监督学习分类器
class-samples-from-dist：
在标记的距离矩阵上运行k个最近邻
热图：
生成重要功能的热图
metatable：
将正数字元数据（输入）转换（并合并）到特征表中
回归样本：
训练和测试交叉验证的监督学习回归器

方法

classify-samples-ncv：
嵌套的交叉验证的监督学习分类器
适合分类器：
适合监督学习的分类器
fit-regressor：
适合监督学习的回归器
预测分类：
使用训练有素的分类器预测新样本的目标值
预测回归：
使用训练有素的回归器预测新样本的目标值
regress-samples-ncv：
嵌套的交叉验证的监督学习回归器
拆分表：
将功能表拆分为训练集和测试集

可视化工具

confusion-matrix：
从样本分类器预测中得出一个混淆矩阵
散点图：
进行2D散点图和回归预测的线性回归
总结：
为训练有素的估算器汇总参数和特征提取信息
分类：用于处理功能分类注释的插件

方法

合并：
在指定分类层级进行丰度合并
filter-seqs：
基于分类的特征序列过滤器
filter-table：
基于分类的特征表过滤器

可视化工具
条形图：
通过交互式条形图可视化分类法

类型：用于微生物组分析的插件定义类型

vsearch：用于通过vsearch进行聚类和去冗余的插件

流程

cluster-features-open-reference：
半有参聚类

方法

cluster-features-closed-reference：
有参聚类
cluster-features-de-novo：
从头/无参聚类
序列去重：
去除重复序列
序列合并：
合并双端序列
uchime-denovo：
使用vsearch进行从头嵌合体过滤
uchime-ref：
使用vsearch的基于参考数据的嵌合体过滤

正在或计划开发的插件

https://docs./2020.2/plugins/future/

QIIME 2论坛(https://forum./)中讨论了计划用于将来版本的插件和非核心插件。如果您对QIIME 2方法，操作，管道或插件的可用性有疑问，请在此处发表您的问题。如果您使用的插件不属于QIIME 2核心发行版，但您想通知QIIME 2用户，则应在论坛的“Community Plugins 社区插件(https://forum./c/community-plugins)”类别中发布主题。

Reference

https://docs./2020.2/

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

译者简介

刘永鑫，博士。2008年毕业于东北农业大学微生物学专业，2014年于中国科学院大学获生物信息学博士学位，2016年中科院遗传发育所博士后出站留所任工程师。目前主要研究方向有微生物组数据分析、方法开发和科学传播。目前以第一作者(含共同)或微生物组数据分析负责人在Science、Nature Biotechnology、Cell Host & Microbe 等杂志发表论文20余篇，引用千余次。作为中国唯一单位代表参与微生物组分析平台QIIME 2开发。受邀以第一作者和/或通讯作者(含共同)在Protein & Cell、Current Opinion in Microbiology、遗传等杂志发表微生物组研究方法综述。2017年7月创办“宏基因组”公众号，目前分享本领域相关原创文章1800余篇，代表作品有《微生物组图表解读、分析流程和统计绘图》、《QIIME2中文教程》等系列，关注人数9万+，累计阅读1400万+。