分享

众筹编写《微生物组数据分析与可视化实战》——成为宏基因组学百科全书的创始人

 宏基因组 2020-10-09

高通量测序的发展极大地推动了微生物组/宏基因组领域的发展。微生物组的数据分析和解读需要微生物学、生物信息学、统计学、Shell和R语言、宏基因组学等多学科的知识,无论是中国还是世界范围内仍缺少系统的学习教材。宏基因组公众号成立的目的是打破微生物组数据分析解读的壁垒,推动本领域的发展。目前经常三年的积累,已发布数百篇本领域相关数据分析、可视化和科研经验的教程。但本领域发展迅速,很多教程需要更新,而且团队成员的知识和研究领域有限,需要更广泛的同行加入,打造宏基因组学入门百科全书,现向全球华人圈全面征集《微生物组数据分析与可视化实战》章节编写的创作者和审稿人

创始人就是你,赶快加入贡献你的智慧吧!

创作者要求

  • 本领域的专业同行,专业包括且不限于微生物学、生物信息学、微生物组学,或应用培养组学、扩增子、宏基因组、宏转录组、宏病毒组、宏蛋白组、宏代谢组、宏表观组等技术研究人类、动植物、环境的相关研究人员(年级和职称不限);

  • 有专业知识搜集和整理的能力,有记录电子笔记、发表文章经历者的优先;

  • 认领下方目录中章节,按照参考模板(一周内陆续发布前几节样章),采用有道云笔记markdown格式或Rmarkdown(加入后有免费培训)编写逻辑严谨、考虑读者感受、可重复性强的教程;

  • 对宏基因组编辑部提出的合理意见进行认真修改;

创作者福利

  • 创作者作为章节的作者之一;

  • 结识宏基因组核心团队成员,见习编辑可获取编辑的基础培训;

  • 发布文章三篇或过万字,可成为正式编辑,免费获得价值万元的最新扩增子、宏基因组分析流程或参加培训、会议的机会;

  • 相关教程、技术文档可推荐发表SCI论文,详见:《JoVE微生物组专刊征稿,写方法拍视频教程发SCI》

  • 根据贡献,获得团队发表论文、出版图书的署名权

审稿人要求

  • 专业审稿人,建议有发表文章经历,对自己擅长领域章节的逻辑、语言的全面修改和提出改进建议(同论文审稿);

  • 大众审稿人,对公众号发布文章中可改进地方提出意见或建议,可通过文章下方留言、联系公众号管理员等方式沟通;

审稿人福利

  • 专业审稿人可进入编辑部,作为审核文章的责任编辑,获得责编栏姓名和单位的署名权;

  • 大众审稿人的姓名和单位可出现在章节的致谢部分;

  • 审稿人节日福利红包!

联系宏基因组公众号

联系人:刘老师

微信:meta-genomics

广告营销人员较多,添加微信务必备注姓名-单位-职位-研究方向,否则无法通过好友申请

邮箱:metagenome@126.com

微生物组数据分析与可视化实战——目录

以下为目前整理本领域基础知识、常用分析、必备技能的目录。部分章节有前期发布的资源和教程供参考。有自己擅长章节的作者,欢迎认领相应章节进行更新或从头创作。如果你觉得有自己擅长而且重要的知识和方法,欢迎联系我们一起讨论目录的更新。

中文的宏基因组学百科全书期待你的贡献!

    • 推荐序

    • 编者序

  • 微生物组分析(原始数据到特征表)

    • 扩增子

    • 宏基因组

    • USEARCH/VSEARCH

    • QIIME 2

    • 有参分析Read-based

    • 无参Assembly-based

    • 功能注释数据库

    • 分箱专题

    • 生物信息

    • 实验设计和元数据

    • 分析的基本思路

    • Shell和Linux

    • R统计与绘图

    • R语言基础

    • ggplot2绘图基础

    • R语言绘图专辑

    • 高级统计绘图

    • 微生物组的概念

    • 常用研究手段

    • 扩增子16S

    • 宏基因组

    • 其他宏组学

    • 微生物组

    • 分析前准备

    • 常用分析流程

    • 认识特征表 Feature table

  • 特征表的分析、可视化和解读

    • 特征与环境因子相关

    • 特征间相关(同网络)

    • 相关分析的可视化

    • 进化树构建

    • 分类树构建

    • 机器学习的常用算法

    • 随机森林分类

    • 随机森林回归

    • Adaboost/slime2

    • 深度学习

    • 来源追溯SourceTracker/FEAST

    • 其他常用算法

    • 网络基础知识

    • 可视化入门

    • 可视化进阶

    • t检验和秩和检验

    • 匀二项分布和计数型差异分析edgeR/DESeq2

    • STAMP与扩展柱状图

    • LEfSe和Cladogram

    • 其他常用差异分析方法

    • 堆叠柱状图

    • 弦图

    • 树图/气泡图

    • 非限制性排序PCoA/NMDS

    • 统计方法PERMANOVA

    • 限制性排序

    • 箱线图或柱状图

    • 稀释曲线

    • 维恩图

    • Alpha多样性

    • Beta多样性

    • 物种组成

    • 差异比较

    • 网络分析

    • 机器学习

    • 树形图

    • 相关分析

  • 统计学基础

    • 正态性检验和方差齐性分析

    • t检验、方差分析、卡方检验使用注意事项

    • 两组和多组秩和检验

    • 多重比较的P值校正

    • 物种数据标准化方法和注意事项

  • 文章套路总结

    • 参考基因集

    • 碳水化合物

    • 抗生素抗性

    • 扩增子

    • 宏基因组

    • 扩增子+宏基因组

    • 其他研究热点

  • 附录

    • 实验设计

    • 测序平台和测序技术

    • 数据备份与发布

    • 图片排版和美化

    • 杂志点评

    • 论文写作、投稿和文献整理

    • 机遇与挑战

    • 三代测序

    • 经验和资源推荐

    • 宏基因组精品文章(专题)

推荐序

找在本领域积累多年的专家、学者,如朱永官院士、蓝灿辉总裁、赵方庆研究员、王军研究员、褚海燕研究员、韦中教授等对本书进行点评。

编者序

概述、历史背景、我们的基础、主要动机,以及你将学到什么?

微生物组分析(原始数据到特征表)

微生物组

微生物组的概念

发展史:摸索,初步探索,建立方法,百花齐放。

测序平台和数据

常用研究手段

扩增子16S

宏基因组

其他宏组学

真菌组 18S/ITS

功能基因

代谢组

基因组

转录组

有时研究也会涉及宿主、微生物的基因表达研究。更多转录组、单细胞的文章可关注生信宝典公众号。

分析前准备

生物信息

实验设计和元数据

分析的基本思路

Shell和Linux

R统计与绘图

ggplot2绘图基础

R语言绘图专辑

高级统计绘图

常用分析流程

盘点主流软件。高级阶段应该是各种方法步骤的自由组合,甚至是根据需要设计、开发方法。

扩增子

64, 33格式转换

USEARCH/VSEARCH

宏基因组

有参分析Read-based

无参Assembly-based

功能注释数据库

分箱专题

认识特征表 Feature table

特征表是上游大数据分析的终点,是里程碑式的成果,同时也是下游分析的起始。

特征表的分析、可视化和解读

Alpha多样性

箱线图或柱状图

稀释曲线

维恩图

维恩图的变形,如UpsetView,网络图等。

Beta多样性

非限制性排序PCoA/NMDS

  1. 主成分分析PCA

  2. 主坐标分析PCoA

  3. 非度量多维尺度分析NMDS

  4. 对应分析CA

  5. 其他排序pls-da,opls-da,t-sne

统计方法PERMANOVA

  1. PERMANOVA

  2. ANOSIM

  3. MRPP

限制性排序

  1. 限制性主坐标分析Constrinaed PCoA

  2. 冗余分析RDA

  3. 典范对应分析CCA

  1. LDA

物种组成

堆叠柱状图

弦图

树图/气泡图

差异比较

t检验和秩和检验

匀二项分布和计数型差异分析edgeR/DESeq2

  1. 什么是物种数据的过度离散现象和负二项分布

  2. 用edgeR包进行差异分析

  3. DESeq2包进行差异分析

STAMP与扩展柱状图

LEfSe和Cladogram

  1. ANCOM分析

  2. ALDEx2分析

  3. songbird和DEICODE介绍

  4. limma

网络分析

网络基础知识

可视化入门

  1. 按分类或模块着色网络

  2. 网络属性

  3. 全局属性

  4. 节点属性

可视化进阶

  1. 双网络比对

  2. 多网络时间序列

  3. Gephi美化

机器学习

机器学习的常用算法

随机森林分类

  1. 分类

  2. 分类评估-ROC曲线及DCA分析

随机森林回归

  1. 回归

  2. 回归及效果评价

Adaboost/slime2

深度学习

来源追溯SourceTracker/FEAST

其他常用算法

  1. 人工神经网络分类

  2. 支持向量机分类

  3. 逻辑回归(GLM)

树形图

进化树构建

  1. 多序列比对

  2. 建树Fastree/RaxL

  3. 宏基因组中建树Phylophlan3

  4. iTOL美化进化树

  5. ggtree美化进化树

分类树构建

  1. Graphlan与Cladogram

  2. Krona

  3. Metacoder

相关分析

特征与环境因子相关

特征间相关(同网络)

相关分析的可视化

统计学基础

正态性检验和方差齐性分析

t检验、方差分析、卡方检验使用注意事项

两组和多组秩和检验

多重比较的P值校正

物种数据标准化方法和注意事项

文章套路总结

扩增子

参考基因集

碳水化合物

抗生素抗性

扩增子+宏基因组

其他研究热点

  • 人类:肠型、肥胖、二型糖尿病、IBD、早产、关联分析

  • 动物:无菌小鼠、牛瘤胃、食性、宿主和微生物共进化

  • 植物:根际、叶际、代谢物、氮利用、抗病

  • 环境:抗生素耐药、抗生素挖掘、极端环境、生命之树

附录

实验设计

实验方案,样本元数据收集,样本名命名规则和示例。

测序平台和测序技术

数据备份与发布

NCBI,GSA,EBI

图片排版和美化

杂志点评

CNS,Microbiome,ISME

相关文章按杂志分类

论文写作、投稿和文献整理

机遇与挑战

目前的优缺点和不足,未来的发展方向。

三代测序

NBT的PacBio和ONT文章简介

经验

办工效率

书籍专著

国外教程

宏基因组精品文章(专题)

本书主要参考文献全文解读

网站数据库

软件算法和流程

方法评测

培养组

肠型

基金

人物传记

参考基因(组)集

病毒组

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多