分享

助力科研基金申请:微生物组测序分析步骤和预算模板

 微生态 2021-04-13

微生物组测序分析包括菌群结构谱、宏基因组和宏转录组,但是目前宏转录组研究较少。所以,本文介绍菌群结构谱、宏基因组测序分析的主要步骤和预算,以助大家申请相关科研基金。

本文介绍三种模式:(1)单独的菌群结构谱,即只研究菌群种类和丰度,该模式的特点是所需资金少,但研究的深度浅;(2)单独的宏基因组,研究菌群种类和丰度的同时,研究菌群所携带的基因的功能和丰度,该模式的特点是研究的深度深,但所需资金多而且风险较大;(3)菌群结构谱+宏基因组,该模式的特点是先投入较少的资金较大范围的筛选样品,然后从中挑出某些样本投入较多的资金深入研究,实现较深研究深度的同时规避风险。

如有疑问或想和深圳微生太科技有限公司合作,可以联系江舜尧。电话:13391510601,微信13391510601或17316279151。

第一部分 步骤和预算

第一种模式:单独的菌群结构谱

1.1 步骤:

① 利用菌群采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌群采样器采样,详细信息点击:一种基于菌群采样器的粪便菌群采样方法);

  使用宏基因组 DNA 提取试剂盒提取样本(如粪便)中的总 DNA;

  以细菌16S rRNA 基因的V3~V4可变区序列为靶标,以带有barcode 序列的338F-806R为引物(或其他靶标和引物,见表1),进行 PCR 扩增,获取 PCR 产物;

表1 各种引物及其序列

测序类型

引物名称

引物序列

长度

测序平台

细菌16S rRNA

515F

5'-  GTGCCAGCMGCCGCGG-3'

392bp

PE250平台,土壤等环境样本推荐使用

907R

5'-  CCGTCAATTCMTTTRAGTTT-3'

细菌16S rRNA

338F

5'-  ACTCCTACGGGAGGCAGCAG-3'

468bp

PE300平台,粪便等样本推荐使用

806R

5'-  GGACTACHVGGGTWTCTAAT-3'

真菌ITS 

ITS5F

5'-  GGAAGTAAAAGTCGTAACAAGG

300bp左右

PE250平台,欲获得较丰富的种类者推荐使用

ITS1R

5'-  GCTGCGTTCTTCATCGATGC

真菌18S

547F

5'-  CCAGCASCYGCGGTAATTCC

420bp

PE300平台

,欲获得较准确的种类者推荐使用

V4R

5'-  ACTTTCGTTCTTGATYRA

  PCR 产物经过定量及文库构建后,利用 Illumina MiSeq PE300平台(根据实际情况调整)进行高通量测序,获取细菌16S rRNA 基因的V3~V4 可变区碱基序列信息(根据实际情况调整)

  利用 QIIME 软件,对测序序列进行质控及 OTU(分类学操作单元)聚类,OUT代表序列与Greengenes数据库(或其他数据库,见表2)进行比对分析,获取 OTU 对应的分类单元(包括门纲目科属种)及其相应的丰度信息;

表2 各序列比对数据库

测序基因

数据

数据网址

16S rRNA

Greengenes

http://greengenes./

Silva

http://www.

RDP

http://rdp.cme./

18S rRNA

Silva

http://www.

ITS

UNITE

https://unite./

  计算 Chao1、ACE、Shannon 和 Simpson 等度量指数,评估样品中细菌菌群的丰富度和均匀度;

  综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻找各组样品中的特征菌;

  应用 RDA 分析关联菌群结构和环境因子(如动物生理生化指标),寻找与环境因子(或动物病理生理特征)存在正相关或负相关的菌群;

  应用PICRUSt 软件,预测各组样本菌群的代谢功能,从中找出有差异的组分。

1.2 预算:X*550元/例=Y元。建议单价按550-500元预算,样本多时,单价偏低,样本少时,单价偏高。该预算比市场价高,这样做是为了不至于被动。

表3 菌群结构谱测序分析预算明细

实验步骤

单价(元)

样本数

总价(元)

DNA提取

50

X

50X

PCR扩增

100

X

100X

文库构建

80

X

80X

测序

200

X

200X

数据分析

120

X

120X

共计(元)

550X

注:

① 如果不是按550元做预算,记得调整明细。

② 如果样本是人类粪便,建议增加菌群采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。

③ 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌群DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。此部分可以加倍预算,即,如果需要提取100份样本,可以预算购买4个50次装的试剂盒。

第二种模式:单独的宏基因组

2.1 步骤:

① 利用菌群采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌群采样器采样,详细信息点击一种基于菌群采样器的粪便菌群采样方法);

  使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA;

  总 DNA 经过随机打断,连接接头和PCR扩增富集等处理,构建测序文库;

  利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序,获得样品宏基因组序列;

  测序原始数据质控后利用 SOAP denovo 组装软件进行组装,再利用 MetaGeneMark 软件进行 ORF(Open Reading Frame,开发阅读框)预测,经 CD-HIT 软件去冗余后获得非冗余基因集,采用SoapAligner 软件,综合应用各样本的测序数据,获得各样品中各基因的丰度表;

  从非冗余基因集出发,与 NCBI 的 NR 数据库进行比对,获得基因的物种注释信息,及物种丰度表;

  从非冗余基因集出发,进行代谢通路(KEGG),同源基因簇(eggNOG),碳水化合物酶(CAZy)的功能注释和丰度分析,获得基因功能丰度表;

  基于物种丰度表和功能丰度表,进行丰度聚类分析、PCA 分析、样品聚类分析、显著性差异分析(包括Metastats 和LEfSe)、代谢通路比较分析,挖掘各组样本之间的物种组成和功能组成差异,为进一步深入研究xxxxx提供支撑。

2.2 预算:Z*5500元/例=W元。建议单价按5500-5000元预算,样本多时,单价偏低,样本少时,单价偏高。该预算比市场价高,这样做是为了不至于被动。

表4 宏基因组测序分析预算明细

实验步骤

单价(元)

样品数

总价(元)

DNA提取

200

Z

200Z

文库构建

600

Z

600Z

测序

900

Z

900Z

数据分析

3800

Z

3800Z

共计(元)

5500Z

注:

① 如果不是按5500元做预算,记得调整明细。

 如果样本是人类粪便,建议增加菌群采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。

 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌群DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。此部分可以加四倍预算,即,如果需要提取100份样本,可以预算购买8个50次装的试剂盒。

第三种模式:菌群结构谱+宏基因组

3.1 步骤:

3.1.1 菌群结构谱部分:

① 利用菌群采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌群采样器采样,详细信息点击:一种基于菌群采样器的粪便菌群采样方法);

  使用宏基因组 DNA 提取试剂盒提取样本(如粪便)中的总 DNA;

  以细菌16S rRNA 基因的V3~V4可变区序列为靶标,以带有barcode 序列的338F-806R为引物(或其他靶标和引物,见表1),进行 PCR 扩增,获取 PCR 产物;

表1 各种引物及其序列

测序类型

引物名称

引物序列

长度

测序平台

细菌16S rRNA

515F

5'-  GTGCCAGCMGCCGCGG-3'

392bp

PE250平台,土壤等环境样本推荐使用

907R

5'-  CCGTCAATTCMTTTRAGTTT-3'

细菌16S rRNA

338F

5'-  ACTCCTACGGGAGGCAGCAG-3'

468bp

PE300平台,粪便等样本推荐使用

806R

5'-  GGACTACHVGGGTWTCTAAT-3'

真菌ITS 

ITS5F

5'-  GGAAGTAAAAGTCGTAACAAGG

300bp左右

PE250平台,欲获得较丰富的种类者推荐使用

ITS1R

5'-  GCTGCGTTCTTCATCGATGC

真菌18S

547F

5'-  CCAGCASCYGCGGTAATTCC

420bp

PE300平台

,欲获得较准确的种类者推荐使用

V4R

5'-  ACTTTCGTTCTTGATYRA

  PCR 产物经过定量及文库构建后,利用 Illumina MiSeq PE300平台(根据实际情况调整)进行高通量测序,获取细菌16S rRNA 基因的V3~V4 可变区碱基序列信息(根据实际情况调整);

  利用 QIIME 软件,对测序序列进行质控及 OTU(分类学操作单元)聚类,OUT代表序列与Greengenes数据库(或其他数据库,见表2)进行比对分析,获取 OTU 对应的分类单元(包括门纲目科属种)及其相应的丰度信息;

表2 各序列比对数据库

测序基因

数据

数据网址

16S rRNA

Greengenes

http://greengenes./

Silva

http://www.

RDP

http://rdp.cme./

18S rRNA

Silva

http://www.

ITS

UNITE

https://unite./

  计算 Chao1、ACE、Shannon 和 Simpson 等度量指数,评估样本中细菌菌群的丰富度和均匀度;

  综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻找各组样本中的特征菌;

  应用 RDA 分析关联菌群结构和环境因子(如动物生理生化指标),寻找与环境因子(或动物病理生理特征)存在正相关或负相关的菌群;

  应用PICRUSt 软件,预测各组样本菌群的代谢功能,从中找出有差异的组分,为深入挖掘菌群的功能、剖析作用机制做铺垫。

3.1.2 宏基因组部分:

① 通过上述菌群结构谱的研究,筛选出关键节点的样本,进行宏基因组测序,以深入挖掘菌群的功能,并剖析作用机制,具体为:

  使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA;

  总 DNA 经过随机打断,连接接头和PCR扩增富集等处理,构建测序文库;

  利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序,获得样本宏基因组序列;

  测序原始数据质控后利用 SOAP denovo 组装软件进行组装,再利用 MetaGeneMark 软件进行 ORF(Open Reading Frame,开发阅读框)预测,经 CD-HIT 软件去冗余后获得非冗余基因集,采用SoapAligner 软件,综合应用各样本的测序数据,获得各样本中各基因的丰度表;

  从非冗余基因集出发,与 NCBI 的 NR 数据库进行比对,获得基因的物种注释信息,及物种丰度表;

  从非冗余基因集出发,进行代谢通路(KEGG),同源基因簇(eggNOG),碳水化合物酶(CAZy)的功能注释和丰度分析,获得基因功能丰度表;

  基于物种丰度表和功能丰度表,进行丰度聚类分析、PCA 分析、样本聚类分析、显著性差异分析(包括Metastats 和LEfSe)、代谢通路比较分析,挖掘各组样本之间的物种组成和功能组成差异,为进一步深入研究xxxxx提供支撑。

3.2 预算:即菌群结构谱和宏基因组的总和。但是菌群结构谱的样本数大于宏基因组的,两者可以大概按照5:1的比例计算。明细见以下两个表格。

表3 菌群结构谱测序分析预算明细

实验步骤

单价(元)

样品数

总价(元)

DNA提取

50

X

50X

PCR扩增

100

X

100X

文库构建

80

X

80X

测序

200

X

200X

数据分析

120

X

120X

共计(元)

550X

表4 宏基因组测序分析预算明细

实验步骤

单价(元)

样品数

总价(元)

DNA提取

200

Z

200Z

文库构建

600

Z

600Z

测序

900

Z

900Z

数据分析

3800

Z

3800Z

共计(元)

5500Z

注:

① 如果不是按550元和5500元做预算,记得调整明细。

 如果样本是人类粪便,建议增加菌群采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。

 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌群DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。菌群结构谱部分,此部分可以加倍预算,即,如果需要提取100份样本,可以预算购买4个50次装的试剂盒;宏基因组部分,此部分可以加四倍预算,即,如果需要提取100份样本,可以预算购买8个50次装的试剂盒。

第二部分 基础知识

一 结题报告模板

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多