扩增子分析QIIME2. 1简介和安装QIIME2版本 2017.6声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。 本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记发布于“宏基因组”公众号,方便大家学习和使用。 简介QIIME2是微生物组分析流程QIIME(截止17.7.13被引7771次)的全新版(不是升级版),采用python3全新编写,并于2018年1月全面接档QIIME,是代表末来的分析方法标准(大牛们制定方法标准,我们跟着用就好了)。 优点
安装有多种安装方法,根据环境任选其一即可,先后序列即推荐序列。 1. Miniconda软件包管理器安装(需要有Linux服务器,但无需管理员权限)本人测试采用Miniconda安装QIIME2于Ubuntu 16.04,这也是官方推荐的方法,确实非常简单。 # 安装miniconda软件管理器:用于安装QIIME2及依赖关系 https:///miniconda.html
wget https://repo./miniconda/Miniconda3-latest-Linux-x86_64.sh
chmod +x Miniconda3-latest-Linux-x86_64.sh
./Miniconda3-latest-Linux-x86_64.sh
# 按提示操作,如回车确定,输入yes同意许可,输入安装目录或回车按默认安装;
# 完成后关闭当前终端,新打开一个终端继续操作才能生效
# 升级conda为最新版:新版的bug最少,碰到问题的机会也小
conda update conda
# 安装qiime2-2017.6,下载安装所有依赖关系,网速不没,时间差别很大,我安装大约半小时
conda create -n qiime2-2017.6 --file https://data./distro/core/qiime2-2017.6-conda-linux-64.txt
# 激活工作环境,需要几十秒
source activate qiime2-2017.6
# 检查是否安装成功,弹出程序帮助即成功
qiime --help
# 关闭工作环境:不用时关闭,不然你其它程序可能会出错
source deactivate 2. Docker方式安装,Linux需要管理员权限我比较喜欢使用docker,直接下载预配置好的系统使用,对本地系统无影响 # 下载2017年6月最新版QIIME2
docker pull qiime2/core:2017.6
# 运行QIIME2测试:显示成功
docker run -t -i -v $(pwd):/data qiime2/core:2017.6 qiime
# 启动docker命令行,挂载目录至data目录
docker run --rm -v $(pwd):/data --name=qiime -it qiime2/core:2017.6
这就相当于打开了一个软件工作环境,目录/data为当前工作目录,可方便分析数据 3. Windows 10 64x Pro + DockerDocker已经出Windows版了,但是需要Windows10 64位专业版 + HyperV,或者Win7 64位以上+Docker toolsbox,我尝试了一下没成功,可能是我相关知识不足或环境不满足,想用Windows体验分析的可以尝试一下。 附1. 核心概念https://docs./2017.6/concepts/
附2. Glossary 名词解释Action 方法或可视化的动作A general term for a method or visualizer. Artifact 本流程定义的文件格式,存储数据和分析结果Data that can be used as input to a QIIME method or visualizer, or that can be generated as output from a QIIME method. Artifacts typically have the extension .qza when written to file. Method 对Artifact分析的方法An action that takes some combination of artifacts and parameters as input, and produces one or more artifacts as output. These output artifacts could subsequently be used as input to other QIIME 2 methods or visualizers. Methods can produce intermediate or terminal outputs in a QIIME analysis. Parameter 参数,软件或方法中可调整的部分A primitive (i.e., non-artifact) input to an action. For example, strings, integers, and booleans are primitives. Primitives are never output from an action. Pipeline 流程,一系统分析方法的串联A combination of actions. This is not yet implemented. Plugin 插件,可扩展的功能A plugin provides microbiome (i.e. domain-specific) analysis functionality that is accessible to users through a variety of interfaces built around the QIIME 2 framework. Plugins can be developed and distributed by anyone. In more technical terms, a plugin is a Python 3 package that instantiates a qiime2.plugin.Plugin object, and registers actions, data formats, and/or semantic types that become discoverable in the QIIME 2 framework. Result 分析结果A general term for an artifact or visualization. A result is produced by a method, visualizer, or pipeline. Visualization 可视化,把数据绘制成图表方便查看和分析规律Data that can be generated as output from a QIIME visualizer. Visualizations typically have the extension .qzv when written to file. Visualizer 可视化工具,将结果可视化的软件An action that takes some combination of artifacts and parameters as input, and produces exactly one visualization as output. Output visualizations, by definition, cannot be used as input to other QIIME 2 methods or visualizers. Visualizers can only produce terminal output in a QIIME analysis. 附3. 常用的语义类型semantic types原文链接:https://docs./2017.6/semantic-types/ FeatureTable[Frequency]: 频率,即Feature表(OTU表),为每个样品中对应OTU出现频率的表格 FeatureTable[RelativeFrequency]: 相对频率,OTU表标准化为百分比的相度丰度 FeatureTable[PresenceAbsence]: OTU有无表,显示样本中某个OTU有或无的表格 FeatureTable[Composition]: 组成表,每个样品中OTU的频率 Phylogeny[Rooted]: 有根进化树 Phylogeny[Unrooted]: 无根进化树 DistanceMatrix: 距离矩阵 PCoAResults: 主成分分析结果 SampleData[AlphaDiversity]: Alpha多样性结果,来自样本自身的分析 SampleData[SequencesWithQuality]: 带质量的序列,要求有质量值,要求序列名称与样品存在对应关系,如为按样品拆分后的数据格式 SampleData[PairedEndSequencesWithQuality]: 成对的带质量序列,要求序列ID与样品编号存在对应关系; FeatureData[Taxonomy]: 每一个OTU/Feature的分类学信息 FeatureData[Sequence]: 代表性序列 FeatureData[AlignedSequence]: 代表性序列进行多序列比对的结果 FeatureData[PairedEndSequence]: 双端序列进行聚类或去噪后,分类好的OTU或Feature EMPSingleEndSequences: 采用地球微生物组计划标准实验方法产生的单端测序数据; EMPPairedEndSequences: 采用地球微生物组计划标准实验方法产生的双端测序数据; TaxonomicClassifier: 用于物种注释的分类软件 Reference
想了解更多宏基因组、16S分析相关文章, 快关注“宏基因组”公众号,干货第一时间推送。 系统学习生物信息,快关注“生信宝典”, 那里有几千志同道合的小伙伴一起学习。
|
|