【原】助力科研基金申请：微生物组测序分析步骤和预算模板

微生态 2021-04-13

展开全文

微生物组测序分析包括菌群结构谱、宏基因组和宏转录组，但是目前宏转录组研究较少。所以，本文介绍菌群结构谱、宏基因组测序分析的主要步骤和预算，以助大家申请相关科研基金。

本文介绍三种模式：（1）单独的菌群结构谱，即只研究菌群种类和丰度，该模式的特点是所需资金少，但研究的深度浅；（2）单独的宏基因组，研究菌群种类和丰度的同时，研究菌群所携带的基因的功能和丰度，该模式的特点是研究的深度深，但所需资金多而且风险较大；（3）菌群结构谱+宏基因组，该模式的特点是先投入较少的资金较大范围的筛选样品，然后从中挑出某些样本投入较多的资金深入研究，实现较深研究深度的同时规避风险。

如有疑问或想和深圳微生太科技有限公司合作，可以联系江舜尧。电话：13391510601，微信13391510601或17316279151。

第一部分步骤和预算

第一种模式：单独的菌群结构谱

1.1 步骤：

① 利用菌群采样器（或其他工具，如冻存管）采集待测样本（如果样本是人类粪便，建议使用菌群采样器采样，详细信息点击：一种基于菌群采样器的粪便菌群采样方法）；

② 使用宏基因组 DNA 提取试剂盒提取样本（如粪便）中的总 DNA；

③ 以细菌16S rRNA 基因的V3～V4可变区序列为靶标，以带有barcode 序列的338F-806R为引物（或其他靶标和引物，见表1），进行 PCR 扩增，获取 PCR 产物；

表1 各种引物及其序列

测序类型	引物名称	引物序列	长度	测序平台
细菌16S rRNA	515F	5'- GTGCCAGCMGCCGCGG-3'	392bp	PE250平台，土壤等环境样本推荐使用
	907R	5'- CCGTCAATTCMTTTRAGTTT-3'
细菌16S rRNA	338F	5'- ACTCCTACGGGAGGCAGCAG-3'	468bp	PE300平台，粪便等样本推荐使用
	806R	5'- GGACTACHVGGGTWTCTAAT-3'
真菌ITS	ITS5F	5'- GGAAGTAAAAGTCGTAACAAGG	300bp左右	PE250平台，欲获得较丰富的种类者推荐使用
	ITS1R	5'- GCTGCGTTCTTCATCGATGC
真菌18S	547F	5'- CCAGCASCYGCGGTAATTCC	420bp	PE300平台，欲获得较准确的种类者推荐使用
	V4R	5'- ACTTTCGTTCTTGATYRA

④ PCR 产物经过定量及文库构建后，利用 Illumina MiSeq PE300平台（根据实际情况调整）进行高通量测序，获取细菌16S rRNA 基因的V3～V4 可变区碱基序列信息（根据实际情况调整）；

⑤ 利用 QIIME 软件，对测序序列进行质控及 OTU（分类学操作单元）聚类，OUT代表序列与Greengenes数据库（或其他数据库，见表2）进行比对分析，获取 OTU 对应的分类单元（包括门纲目科属种）及其相应的丰度信息；

表2 各序列比对数据库

测序基因	建议比对数据库	数据库网址
16S rRNA	Greengenes	http://greengenes./
	Silva	http://www.
	RDP	http://rdp.cme./
18S rRNA	Silva	http://www.
ITS	UNITE	https://unite./

⑥ 计算 Chao1、ACE、Shannon 和 Simpson 等度量指数，评估样品中细菌菌群的丰富度和均匀度；

⑦ 综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻找各组样品中的特征菌；

⑧ 应用 RDA 分析关联菌群结构和环境因子（如动物生理生化指标），寻找与环境因子（或动物病理生理特征）存在正相关或负相关的菌群；

⑨ 应用PICRUSt 软件，预测各组样本菌群的代谢功能，从中找出有差异的组分。

1.2 预算：X*550元／例=Y元。建议单价按550-500元预算，样本多时，单价偏低，样本少时，单价偏高。该预算比市场价高，这样做是为了不至于被动。

表3 菌群结构谱测序分析预算明细

实验步骤	单价（元）	样本数	总价（元）
DNA提取	50	X	50X
PCR扩增	100	X	100X
文库构建	80	X	80X
测序	200	X	200X
数据分析	120	X	120X
共计（元）			550X

注：

① 如果不是按550元做预算，记得调整明细。

② 如果样本是人类粪便，建议增加菌群采样器的预算，每份样本用一个采样器，单价为55-50元（该预算比市场价高）。

③ 本预算按照从DNA提取到数据分析全外包的模式，这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例，标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用，如美国Omega菌群DNA提取试剂盒，2000元／盒，50次装（即理论上可以提取50份样品）。此部分可以加倍预算，即，如果需要提取100份样本，可以预算购买4个50次装的试剂盒。

第二种模式：单独的宏基因组

2.1 步骤：

② 使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA；

③ 总 DNA 经过随机打断，连接接头和PCR扩增富集等处理，构建测序文库；

④ 利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序，获得样品宏基因组序列；

⑤ 测序原始数据质控后利用 SOAP denovo 组装软件进行组装，再利用 MetaGeneMark 软件进行 ORF（Open Reading Frame，开发阅读框）预测，经 CD-HIT 软件去冗余后获得非冗余基因集，采用SoapAligner 软件，综合应用各样本的测序数据，获得各样品中各基因的丰度表；

⑥ 从非冗余基因集出发，与 NCBI 的 NR 数据库进行比对，获得基因的物种注释信息，及物种丰度表；

⑦ 从非冗余基因集出发，进行代谢通路(KEGG)，同源基因簇(eggNOG)，碳水化合物酶(CAZy)的功能注释和丰度分析，获得基因功能丰度表；

⑧ 基于物种丰度表和功能丰度表，进行丰度聚类分析、PCA 分析、样品聚类分析、显著性差异分析（包括Metastats 和LEfSe）、代谢通路比较分析，挖掘各组样本之间的物种组成和功能组成差异，为进一步深入研究xxxxx提供支撑。

2.2 预算：Z*5500元／例=W元。建议单价按5500-5000元预算，样本多时，单价偏低，样本少时，单价偏高。该预算比市场价高，这样做是为了不至于被动。

表4 宏基因组测序分析预算明细

实验步骤	单价（元）	样品数	总价（元）
DNA提取	200	Z	200Z
文库构建	600	Z	600Z
测序	900	Z	900Z
数据分析	3800	Z	3800Z
共计（元）			5500Z

注：

① 如果不是按5500元做预算，记得调整明细。

② 如果样本是人类粪便，建议增加菌群采样器的预算，每份样本用一个采样器，单价为55-50元（该预算比市场价高）。

③ 本预算按照从DNA提取到数据分析全外包的模式，这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例，标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用，如美国Omega菌群DNA提取试剂盒，2000元／盒，50次装（即理论上可以提取50份样品）。此部分可以加四倍预算，即，如果需要提取100份样本，可以预算购买8个50次装的试剂盒。

第三种模式：菌群结构谱+宏基因组

3.1 步骤：

3.1.1 菌群结构谱部分：

② 使用宏基因组 DNA 提取试剂盒提取样本（如粪便）中的总 DNA；

③ 以细菌16S rRNA 基因的V3～V4可变区序列为靶标，以带有barcode 序列的338F-806R为引物（或其他靶标和引物，见表1），进行 PCR 扩增，获取 PCR 产物；

表1 各种引物及其序列

测序类型	引物名称	引物序列	长度	测序平台
细菌16S rRNA	515F	5'- GTGCCAGCMGCCGCGG-3'	392bp	PE250平台，土壤等环境样本推荐使用
	907R	5'- CCGTCAATTCMTTTRAGTTT-3'
细菌16S rRNA	338F	5'- ACTCCTACGGGAGGCAGCAG-3'	468bp	PE300平台，粪便等样本推荐使用
	806R	5'- GGACTACHVGGGTWTCTAAT-3'
真菌ITS	ITS5F	5'- GGAAGTAAAAGTCGTAACAAGG	300bp左右	PE250平台，欲获得较丰富的种类者推荐使用
	ITS1R	5'- GCTGCGTTCTTCATCGATGC
真菌18S	547F	5'- CCAGCASCYGCGGTAATTCC	420bp	PE300平台，欲获得较准确的种类者推荐使用
	V4R	5'- ACTTTCGTTCTTGATYRA

表2 各序列比对数据库

测序基因	建议比对数据库	数据库网址
16S rRNA	Greengenes	http://greengenes./
	Silva	http://www.
	RDP	http://rdp.cme./
18S rRNA	Silva	http://www.
ITS	UNITE	https://unite./

⑥ 计算 Chao1、ACE、Shannon 和 Simpson 等度量指数，评估样本中细菌菌群的丰富度和均匀度；

⑦ 综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻找各组样本中的特征菌；

⑧ 应用 RDA 分析关联菌群结构和环境因子（如动物生理生化指标），寻找与环境因子（或动物病理生理特征）存在正相关或负相关的菌群；

⑨ 应用PICRUSt 软件，预测各组样本菌群的代谢功能，从中找出有差异的组分，为深入挖掘菌群的功能、剖析作用机制做铺垫。

3.1.2 宏基因组部分：

① 通过上述菌群结构谱的研究，筛选出关键节点的样本，进行宏基因组测序，以深入挖掘菌群的功能，并剖析作用机制，具体为：

② 使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA；

③ 总 DNA 经过随机打断，连接接头和PCR扩增富集等处理，构建测序文库；

④ 利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序，获得样本宏基因组序列；

⑤ 测序原始数据质控后利用 SOAP denovo 组装软件进行组装，再利用 MetaGeneMark 软件进行 ORF（Open Reading Frame，开发阅读框）预测，经 CD-HIT 软件去冗余后获得非冗余基因集，采用SoapAligner 软件，综合应用各样本的测序数据，获得各样本中各基因的丰度表；

⑥ 从非冗余基因集出发，与 NCBI 的 NR 数据库进行比对，获得基因的物种注释信息，及物种丰度表；

⑦ 从非冗余基因集出发，进行代谢通路(KEGG)，同源基因簇(eggNOG)，碳水化合物酶(CAZy)的功能注释和丰度分析，获得基因功能丰度表；

⑧ 基于物种丰度表和功能丰度表，进行丰度聚类分析、PCA 分析、样本聚类分析、显著性差异分析（包括Metastats 和LEfSe）、代谢通路比较分析，挖掘各组样本之间的物种组成和功能组成差异，为进一步深入研究xxxxx提供支撑。

3.2 预算：即菌群结构谱和宏基因组的总和。但是菌群结构谱的样本数大于宏基因组的，两者可以大概按照5:1的比例计算。明细见以下两个表格。

表3 菌群结构谱测序分析预算明细

实验步骤	单价（元）	样品数	总价（元）
DNA提取	50	X	50X
PCR扩增	100	X	100X
文库构建	80	X	80X
测序	200	X	200X
数据分析	120	X	120X
共计（元）			550X

表4 宏基因组测序分析预算明细

实验步骤	单价（元）	样品数	总价（元）
DNA提取	200	Z	200Z
文库构建	600	Z	600Z
测序	900	Z	900Z
数据分析	3800	Z	3800Z
共计（元）			5500Z

注：

① 如果不是按550元和5500元做预算，记得调整明细。

② 如果样本是人类粪便，建议增加菌群采样器的预算，每份样本用一个采样器，单价为55-50元（该预算比市场价高）。

③ 本预算按照从DNA提取到数据分析全外包的模式，这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例，标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用，如美国Omega菌群DNA提取试剂盒，2000元／盒，50次装（即理论上可以提取50份样品）。菌群结构谱部分，此部分可以加倍预算，即，如果需要提取100份样本，可以预算购买4个50次装的试剂盒；宏基因组部分，此部分可以加四倍预算，即，如果需要提取100份样本，可以预算购买8个50次装的试剂盒。

第二部分基础知识

一结题报告模板