1. 稀释性曲线(Rarefaction Curve)采用对测序序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建曲线,即稀释性曲线。
当曲线趋于平坦时,说明测序数据量合理,更多的数据量对发现新OTU的边际贡献很小;反之则表明继续测序还可能产生较多新的OTU。

横轴:从某个样品中随机抽取的测序条数;"Label 0.03"
表示该分析是基于OTU 序列差异水平在0.03,即相似度为97% 的水平上进行运算的,客户可以选取其他不同的相似度水平。
纵轴:基于该测序条数能构建的OTU数量。
曲线解读:
Ø 图1中每条曲线代表一个样品,用不同颜色标记;
Ø 随测序深度增加,被发现OTU 的数量增加。当曲线趋于平缓时表示此时的测序数据量较为合理。
2. Shannon-Wiener
曲线
反映样品中微生物多样性的指数,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。
当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物物种信息。

横轴:从某个样品中随机抽取的测序条数。
纵轴:Shannon-Wiener 指数,用来估算群落多样性的高低。
Shannon 指数计算公式:
其中,
Sobs= 实际测量出的OTU数目;
ni= 含有i 条序列的OTU数目;
N = 所有的序列数。
曲线解读:
Ø 图2每条曲线代表一个样品,用不同颜色标记,末端数字为实际测序条数;
Ø 起初曲线直线上升,是由于测序条数远不足覆盖样品导致;
Ø 数值升高直至平滑说明测序条数足以覆盖样品中的大部分微生物。
3.Rank-Abundance
曲线
用于同时解释样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度。
物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;
物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高。

横轴:OTU 相对丰度含量等级降序排列。
纵轴:相对丰度比例。
曲线解读:
Ø 图3与图4中每条曲线对应一个样本(参考右上角图标);
Ø 图3与图4中横坐标表示的是OTU(物种)丰度排列顺序,纵坐标对应的是OTU(物种)所占相对丰度比例(图3为相对百分比例,图4为换算后Log值),曲线趋于水平则表示样品中各物种所占比例相似;曲线整体斜率越大则表示样品中各物种所占比例差异较大。
4. 样本群落组成分析:多样本柱状图/
单样本饼状图
根据分类学分析结果,可以得知一个或多个样品在各分类水平上的物种组成比例情况,反映样品在不同分类学水平上的群落结构。

柱状图(图5)
横轴:各样品的编号。
纵轴:相对丰度比例。
图标解读:
Ø 颜色对应此分类学水平下各物种名称,不同色块宽度表示不同物种相对丰度比例;
Ø 可以在不同分类学水平下作图分析。
饼状图(图6)
在某一分类学水平上,不同菌群所占的相对丰度比例。不同颜色代表不同的物种。
5. 样品OTU 分布Venn 图
用于统计多个样品中共有或独有的OTU数目,可以比较直观地表现各环境样品之间的OTU 组成相似程度。
不同样品用不同颜色标记,各个数字代表了某个样品独有或几种样品共有的OTU 数量,对应的OTU编号会以EXCEL 表的形式在结题报告中呈现。

分析要求
单张分析图,样本分组至少两个,最多5 个。
Ø 默认设置为97% 相似度水平下以OTU 为单位进行分析作图。
6. Heatmap 图
用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。将高丰度和低丰度的物种分块聚集,通过颜色梯度及相似程度来反映多个样品在各分类水平上群落组成的相似性和差异性。

相对丰度比例:
热图(图8)中每小格代表其所在样品中某个OTU 的相对丰度。以图8为例,红框高亮的小格所对应的信息为:样本(R11-1Z)中OTU(OTU128)的相对丰度比例大概为0.2%。
丰度比例计算公式(Bray Curtis 算法):

其中,
SA,i = 表示A样品中第i个OTU所含的序列数
SB,i = 表示B样品中第i个OTU所含的序列数
样品间聚类关系树:
进化树表示在选用成图数据中,样本与样本间序列的进化关系(差异关系)。处于同一分支内的样品序列进化关系相近。
物种/OTU 丰度相似性树:
丰度相似性树表示选用成图的数据中样品与样品中的OTU 或序列在丰度上的相似程度。丰度最相近的会分配到同一分支上。
客户自定义分组:根据研究需求对菌群物种/OTU 研究样本进行二级分组
Ø 二级物种/OTU 分组:将下级分类学水平物种或OTU 分配到对应的上级分类学水平,以不同颜色区分;
Ø 二级样品分组:根据研究需要,对样品进行人为的分组,以不同颜色区分。
7. 主成分分析PCA (Principal Component Analysis)
在多元统计分析中,主成分分析是一种简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中对方差贡献最大的特征,从而有效地找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。
通过分析不同样品的OTU 组成可以反映样品间的差异和距离,PCA 运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴为能够最大程度反映方差的两个特征值。如样品组成越相似,反映在PCA图中的距离越近。

横轴和纵轴:以百分数的形式体现主成分主要影响程度。以图9为例,主成分1(PC1)和主成分2(PC2)是造成四组样品(红色,蓝色,黄色和绿色)的两个最大差异特征,贡献率分别为41.1% 和27.1%。
十字交叉线:在图9中作为0 点基线存在,起到辅助分析的作用,本身没有意义。
图例解读:
Ø PCA 分析图是基于每个样品中所含有的全部OTU 完成的;
Ø 图9中每个点代表了一个样本;颜色则代表不同的样品分组;
Ø 两点之间在横、纵坐标上的距离,代表了样品受主成分(PC1 或 PC2)影响下的相似性距离;
Ø 样本数量越多,该分析意义越大;反之样本数量过少,会产生个体差异,导致PCA分析成图后形成较大距离的分开,建议多组样品时,每组不少于5个,不分组时样品不少于10个;
Ø 图10中的圆圈为聚类分析结果,圆圈内的样品,其相似距离比较接近。
8. RDA/ CCA
分析图
基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。主要用来反映菌群与环境因子之间的关系。RDA 是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。

横轴和纵轴:RDA 和CCA 分析,模型不同,横纵坐标上的刻度为每个样品或者物种在与环境因子进行回归分析计算时产生的值,可以绘制于二维图形中。
图例解读:
Ø 冗余分析可以基于所有样品的OTU作图,也可以基于样品中优势物种作图;
Ø 箭头射线:图11中的箭头分别代表不同的环境因子(即图中的碳酸氢根离子HCO3-,醋酸根离子AC-等,图中的其它环境因子因研究不同代表的意义不同,因此不再赘述);
Ø 夹角:环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。环境因子的射线越长,说明该影响因子的影响程度越大;
Ø 图11中不同颜色的点表示不同组别的样品或者同一组别不同时期的样品,图中的拉丁文代表物种名称,可以将关注的优势物种也纳入图中;
Ø 环境因子数量要少于样本数量,同时在分析时,需要提供环境因子的数据,比如 pH值,测定的温度值等。
9. 单样品/ 多样品分类学系统组成树
根据NCBI 提供的已有微生物物种的分类学信息数据库,将测序得到的物种丰度信息回归至数据库的分类学系统关系树中,从整个分类系统上全面了解样品中所有微生物的进化关系和丰度差异。

单样品图(图12):可以了解单样品中的序列在各个分类学水平上的分布情况。

图例解读:
Ø 图12中不同的层次反映不同的分类学水平;
Ø 分支处的圆面积说明了分布在该分类学水平,且无法继续往下级水平比对的序列数量,面积越大,说明此类序列越多;
Ø 每个分支上的名词后面的两组数字分别表示比对到该分支上的序列数和驻留在该节点上的序列数;
Ø 图13中为某单一水平物种分布情况,并非是序列分布。

多样品图(图14):比对多个样品在不同分类学分支上序列数量差异。
图例解读:
Ø 比对不同样品在某分支上的序列数量差异,通过带颜色的饼状图呈现,饼状图的面积越大,说明在分支处的序列数量越多,不同的颜色代表不同的样品。
Ø 某颜色的扇形面积越大,说明在该分支上,其对应样品的序列数比其他样品多。
Ø 多样品在做该分析时,建议样品数量控制在10个以内,或者将重复样本数据合并成一个样本后,总样品数在10个以内。
10.系统发生进化树
在分子进化研究中,基于系统发生的推断来揭示某一分类水平上序列间碱基的差异,进而构建进化树。

图例解读:
Ø 图15中体现的是序列进化差异情况,处在同一分支上的物种说明进化关系较近。
Ø 图15左下角的图例为距离标尺,分支距离越长,进化关系越远。
11. (un)Weighted UniFrac PCoA/Tree 分析
利用各样品序列间的进化信息来计算样品间距离,反映环境样品在进化树中是否有显著的微生物群落差异。
PCoA(principal co-ordinates analysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,PCoA 可以找到 距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。通过PCoA 可以观察个体或群体间的差异。

图例解读:
Ø 图16和图17中不同颜色代表不同分组;
Ø PCoA 分析建议不分组时,样本数量不少于10 个;多组样本时,每组样本数量不少于5 个;
Ø 对于某一功能基因,进行进化树分析时,建议采用OTU数目控制在10,000以内,或者由客户指定分析优势OTU个数。
12. NMDS 分析
NMDS(Nonmetric Multidimensional Scaling)常用于比对样本组之间的差异,可以基于进化关系或数量距离矩阵。
横轴和纵轴:表示基于进化或者数量距离矩阵的数值在二维表中成图。

图例解读:
Ø 图18中不同的颜色代表不同的分组;
Ø 建议不分组时,样本数量不少于10个;多组样本时,每组样本数量不少于5个;
Ø 图18中的点代表样本,点与点之间的距离表示差异程度。
13. 含相似性树柱状图
根据样品中相似程度进行排布,并绘制对应样本树状图反映样本中群落结构。

图例解读:
Ø 图19中左侧是相似度树状图,样本之间的差异越小,样本便会处在相近的同一分支上;
Ø 右侧柱状图,展示样本中微生物的群落结构。不同颜色代表不同物种。
14.Unifrac 显著性差异分析
比较样品间进化差异的显著性分析。

图例解读:
Ø 图20横坐标为两组样品;
Ø 纵轴坐标为unifrac 进化距离(序列差异)。
15. 单因素unweighted unifrac PCA 分析
在某单一因素上,进行unweighted unifrac PCA 分析。

图例解读:
Ø 图21横轴为不同变量(本例为不同年龄阶段)下的样本;
Ø 纵坐标为主成分,图21中显示同一年龄阶段内和不同年龄阶段间的由主成分导致的差异情况。
16.
个性化分析案例展示
案例描述一
Community composition of
root-associated fungi in a Quercus-dominated temperate
forest:"codominance" of mycorrhizal and root-endophytic fungi. Ecol
Evol. 2013 May; 3(5):1281-93.
样本来源 | 样本数量 | 高变区 | 测序平台 | 测序量(reads) |
植物根系/ 泥土 | 159/38 | ITS | Roche GS | 70,495 |
样本来自于以日本橡木为主的温带森林,使用454 测序分析多个生态系统的真菌多样性。样品来源为植物根系样本,从12 株植物中提取了159 份根系。分析结果表明,外生真菌群落和根系内生真菌群落互相作用,维持了这种以日本橡木为主的温带森林的生态环境。

图例解读:
Ø 图22构建了地下植物与真菌的相互关系网络;
Ø 图22中灰色圆点表示与植物共生的微生物物种,菱形代表真菌OTU,它们之间的关系用灰色连接线表示;
Ø 它们之间的密集程度越高表示它们之间相互作用被观察的次数越多;
Ø 互利共生真菌OTU 用粉色菱形表示;寄生微生物OTU用橘色菱形表示;未知功能OTU用蓝色菱形表示;
Ø A:子囊真菌门;B:担子菌门;G:球囊菌门;U:表示门水平未知真菌。
案例描述二
The ignored diversity: complex bacterial communities in intensive care units revealed by 16S pyrosequencing. Sci Rep.
2013;3:1413.
室内微生物群落对日常生活中人类健康起着重要作用,尤其是医院的重症监护室。采用扩增焦磷酸测序研究ICU 中微生物群落可以检测多种微生物序列,与现有的传统标准培养技术相比,有极大的优越性。
传统培养方式只能检测总细菌多样性的2.5%。结合外部环境与物种系统发育谱分析发现,许多微生物与潜在的人类病原菌相关,当然也包含有益菌,一共7 个门76 个属。此外,丙酸杆菌属,假单孢菌属和伯克霍尔德氏菌被确定为感染的重要来源。在地板,医疗器械和工作间微生物组成有显著差异,但网络分析和一致性分子指纹印记分析发现该三个地点微生物组成也有一定的相似性。这些信息将帮助加护病房进行新的公共卫生风险评估,帮助建立新的卫生协议,帮助深入了解医院获得性感染的情况。
样本来源 | 样本数量 | 高变区 | 测序平台 | 测序量(reads) |
重症监护室(ICU)中地板,医疗设备及工作间表面样品 | 34 | 16S rRNA | Roche 454 FLX+ | 5000/样本 |

图23为丰度最高的40 种菌(OTU) 在不同采样区域的分布情况。不同颜色代表不同样本来源,绿色为ICU 地板,红色为医疗设备,蓝色为工作间。结点面积表示该OTU 在三个采样区域之间的相对丰度。
案例描述三
Skin Microbiome Imbalance in Patients with STAT1/STAT3 Defects Impairs Innate Host Defense Responses. Journal of
Innate Immunity. 2013, DOI: 10.1159/000351912.
CMC和HIES均属于罕见的原发性免疫缺陷病。本文研究了CMC和HIES病人皮肤及口腔微生物与正常人群的微生物菌群差异。结果表明,相比正常人体的微生物组成(主要包括棒杆菌属和放线菌科等),病人的所携带的微生物中革兰氏阴性菌比例增加。而革兰氏阴性菌(如不动杆菌属)可以抑制机体对假丝酵母和金色葡萄球菌的免疫反应,结果很可能导致患者对这些菌感染的敏感性增加。本文的研究表明,此类免疫缺陷病人所携带的微生物菌群可以影响宿主的免疫防御系统,进而有可能通过基于微生物的辅助疗法来治疗免疫缺陷的患者。
样本来源 | 样本数量 | 高变区 | 测序平台 | 测序量(reads) |
慢性皮肤黏膜念珠菌病(CMC)、高IgE综合症(HIES)患者皮肤及口腔微生物 | 60 | 16S rRNA V4区 | MiSeq | 6389/样 本 |

图24 为免疫缺陷疾病各亚型患者皮肤和口腔微生物群落结构的协方差。(a)图表示35个皮肤样本的微生物多样性的差异;(b)图表示21个口腔样本微生物多样性差异。其中,绿色方块表示健康对照组,红色圆圈表示CMC,蓝色三角形表示HIES。健康人体皮肤表面的微生物主要包括葡萄球菌和棒状杆菌,而疾病组多为莫拉菌科。
Ø Aleksandar D. Kostic, Dirk Gevers, et al. Genomic analysis identifies association of Fusobacterium with
colorectal carcinoma. Genome Research, 2012, 22:292–298.
Ø Chiachi Hwang, Fangqiong Ling, et al. Microbial community dynamics of an urban drinking water
distribution system subjected to phases of chloramination and chlorination treatments. Microbiol,
2012, 78(22):7856.
Ø Craig E. Nelson, Stuart J. Goldberg, et al. Coral and macroalgal exudates vary in neutral sugar
composition and differentially enrich reef bacterioplankton lineages. The ISME Journal, 2013, 7:962–979.
Ø Elie Jami, Adi Israel, et al. Exploring the bovine rumen bacterial community from birth to adulthood.
The ISME Journal, 2013. 2:1–11.
Ø Erik C von Rosenvinge, Yang Song, et al. Immune status, antibiotic medication and pH are associated
with changes in the stomach fluid microbiota. The ISME Journal, 2013. 33:1–13.
Ø Krissi M. Hewitt, Charles P. Gerba, et al. Office space bacterial abundance and diversity in three metro
politan Areas. PLoS ONE, 2012, 7(5):e37849.
Ø Sizhong Yang, Xi Wen, et al. Pyrosequencing investigation into the bacterial community in permafrost
soils along the China-Russia crude oil pipeline (CRCOP). PLoS ONE, 2012, 7(12):e52730.
Ø Vasvi Chaudhry, Ateequr Rehman, et al. Changes in bacterial community structure of agricultural land
due to long-term organic and chemical amendments. Microb Ecol, 2012, 64:450-460.
Ø Weiguang Chen, Fanlong Liu, et al. Human intestinal lumen and mucosa-associated microbiota in
patients with colorectal cancer. PLoS ONE, 2012, 7(6):e39743.
Ø Katherine R Amato, Carl J Yeoman, et al. Habitat degradation impacts black howler monkey (Alouatta
pigra) gastrointestinal microbiomes. The ISME Journal, 2013, 7: 1344–1353.
Ø Kabir G Peay, Christopher Baraloto, et al. Strong coupling of plant and fungal community structure across
western Amazonian rainforests. The ISME Journal, 2013, 7: 1852–1861.
Ø Dagne Duguma, Paul Rugman-Jones, et al. Bacterial communities associated with culex mosquito larvae and
two emergent aquatic plants of bioremediation importance. PLoS ONE, 2013, 8(8): e72522.
Ø Coolon JD, Jones KL, et al. Long-term nitrogen amendment alters the diversity and assemblage of soil
bacterial communities in tallgrass prairie. PLoS One. 2013, 8(6): e67884.
Ø Zhao J, Schloss PD, et al. Decade-long bacterial community dynamics in cystic fibrosis airways. Proc Natl
Acad Sci USA, 2012, 109(15):5809-5814.
Ø Bo Liu, Lina L. Faller, Niels Klitgord, et al. Deep Sequencing of the Oral Microbiome Reveals Signatures of
Periodontal Disease. PLoS ONE, 2012, 7(6): e37919.
Ø Baldrian P, Kolařík M, Stursová M, et al. Active and total microbial communities in forest soil are largely
different and highly stratified during decomposition. The ISME Journal, 2012, 6(2):248-258.
Ø Scott T Bates, Jose C Clemente, Gilberto E Flores. Et al. Global biogeography of highly diverse protistan
communities in soil. The ISME Journal, 2013, 7: 652–659.