分享

新冠病毒在微生物中的分类,如何根据现有片段进行微生物菌种比对?

 勤劳的bee 2020-05-22

01

天道好轮回,苍天饶过谁

前两天我一个学生跟我说,微生物太难了,根本记不住,当时我的内心毫无波澜,因为都是我奋斗过的曾经。天道好轮回,苍天饶过谁。今天老板就安排给我一个新任务,让我对分析出来的片段进行已知菌种的鉴定。

恩,很好,我一个上一次摸微生物书本还是在十年前的选手,现在要跟专业从事微生物领域的同学一样,进行专业鉴定。深呼吸,稳住,这波操作能行。

实际上,我已经在NCBI的Blast中,对拼接的序列与已知菌进行比对,包括网上已知序列,以及SRA中的五套测序数据的比对,结果都是NO significant....

然后老板一句话,提醒我,没有检测我们这个菌属是否被NCBI收录

(好吧,我一上午的工作量,原来一句话就可以解释清楚

02

任务进度

已完成任务1:使用DNAMAN对测序片段进行序列拼接

(几十个小片段拼接出4条contig)

已完成任务2:使用Blast对拼接序列进行比对

(无结果)

待完成任务1:如何根据contig与已知菌进行比对

(思路:真菌数据库中寻找解决方案)

待完成任务2:如何查找真菌保守区域

(思路:ITS确定引物)

待完成任务3:灰常珍贵的测序样本,我怎么利用才能把确定菌种+扩增全长都完成

(思路:可以稀释不)

03

微生物简介

贼高大上的介绍

微生物生态(MicrobialEcology),又名环境微生物(Environmental Microbiology),是研究微生物之间及其与环境之间相互关系的学科。从生物角度,其研究对象主要有真核微生物(Eukaryotes,如原生生物、真菌等)、原核微生物(Prokaryotes,细菌和古菌)和病毒(Viruses)。

学渣本渣的介绍

微生物分类
真核代表:真菌
原核
代表:细菌
病毒
代表:各种

04

微生物查询数据库

根据高通量测序的结果,获得微生物marker基因序列。

原核的16S rDNA序列

真核的18S rDNA序列、ITS(ribosomalinternal transcribed spacer)序列

拿到序列后,面临的问题:选择什么数据库进行比对才能得到较好的分类鉴定结果呢?

解答:针对每一类生物的主要marker序列都有相应的数据库以方便比对鉴定。

介绍:微生物生态研究中那些个常用的marker基因序列数据库

rRNA基因数据库

  • RDP

作用:提供质控、比对、注释的细菌、古菌16S rRNA基因真菌28S rRNA基因序列

          对少量rRNA基因测序后的物种进行分类鉴定,此时主要用其Classifier功能

  •  SILVA

作用:包含三域微生物(细菌、古菌、真核)rRNA基因序列的综合数据库,其数据库涵盖了原核和真核微生物的小亚基rRNA基因序列(简称SSU,即16S18SrRNA)和大亚基rRNA基因序列(简称LSU,即23S28SrRNA)。

          用于平时菌种鉴定时,对少量rRNA基因测序后的物种进行分类鉴定,此时主要用其SINA Alignment Service功能(https://www./aligner/),可非常方便地确定某条rRNA基因序列从门到属/种水平的分类信息并给出各分类水平相应的置信度。

  • Greengenes

作用:专门针对细菌、古菌16S rRNA基因的数据库

         较常用于16S rRNA基因高通量测序后进行嵌合体去除的参比数据库

         PICRUST,即根据16S rRNA高通量测序结果预测微生物群落功能的分析,也是基于gg_13_5数据库开发的。

  • EzBioCloud

作用:专门针对细菌、古菌16SrRNA基因的数据库

          以可培养的细菌、古菌16S rRNA基因序列为主。

         通过与该数据库比对,确定某16S rRNA基因序列对应物种在数据库中的近缘可培养/模式种,此时用到的是数据库的Identify功能

          较少用于16S高通量测序后的参比数据库。

  • PR2

作用:专门针对真核微生物小亚基SSU rRNA(即18SrRNA)基因的数据库

          主要由核编码的原生生物序列构成,但为方便分析18S的高通量测序数据,数据库也包含了后生生物、陆地植物、大型真菌和真核细胞器(线粒体、质体等)的SSU序列。

           内含子和嵌合体序列已被去除。

  • PhytoREF

作用:专门针对质体(plastid)中16SrRNA基因的数据库

          所有陆地、淡水、海洋中的含质体生物16S rRNA基因序列都囊括在该数据库内,包括陆地植物、海洋和淡水大型和微型藻类等的质体

  • PFR²

作用:浮游有孔虫界(planktonic Foraminifera /Rhizaria)是一类在海洋中广泛存在的浮游原生生物,其在海洋碳循环中起重要作用,且其化石可用以生物年代地层和古气候重建。PFR2是专门针对浮游有孔虫界18SrRNA基因的数据库。

          包含高质量的浮游有孔虫界18S rRNA基因序列。

ITS序列数据库

  • UNITE

作用:UNITE数据库就是专门针对真菌ITS序列的数据库。UNITE常被用于ITS序列高通量测序后对真菌进行分类注释的比对数据库,包含多条高质量ITS参考序列。

          对单条ITS序列进行进行在线分类鉴定(https://unite./analysis.php)。

  • ITS2 

作用:位于真核生物5.8S和28S rRNA基因之间的ITS2基因常被用于鉴定真核微生物的marker序列。ITS2数据库就是专门针对真核微生物ITS2序列的数据库

功能基因数据库

  • FunGene

作用:FunGene(Functional Gene)是RDP延伸的一个针对微生物功能基因序列的数据库。其按照功能分为抗生素抗性(Antibiotic resistances)、植物致病基因(Plant Pathogenicity)、生物地球化学循环(Biogeochemical cycles)、系统进化markerPhylogenetic markers)、生物降解(Biodegradation)、金属循环(Metal Cycling)及其他(Other等七类功能基因。

           每类都包含几到上百种功能marker基因,可被用于功能marker基因高通量测序后的比对及功能基因引物设计等。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多