分享

新风口丨病原微生物宏基因组检测(mNGS)

 生物_医药_科研 2020-01-03

文章已获探针资本授权!感谢!

《病原微生物宏基因组检测》

1 宏基因组二代测序技术简介

    1.1 宏基因组学发展历程

    1.2 宏基因组二代测序技术mNGS检测病源微生物过程
    1.3 mNGS与现有技术比较

2 mNGS在临床中的应用

    2.1 在新发传染病疫情中的应用

    2.2 在感染性疾病诊断中的应用

3 应用病种流行病学特征

    3.1 呼吸系统感染性疾病

    3.2 神经系统感染性疾病

4 竞争格局

宏基因组二代测序技术简介

宏基因组二代测序技术(metagenomics next-generation sequencing, mNGS)是借助二代测序平台快速测序获得样品中的核酸序列,并进一步与各个物种的基因组序列对比,从而得知样品中微生物的种类和比例的技术。

1.1宏基因组学发展历程

对宏基因组的研究最早可追溯到上世纪80年代,Pace等人尝试直接克隆环境DNA,将浮游微生物克隆在噬菌体的载体,构建文库,通过对文库的筛选进行后续的16S rRNA的分析。在1998年,Jo Handelsman, Michelle R Rondon等人在一篇土壤微生物的研究报道中首次提出宏基因组学(metagenomics)的概念。

最早宏基因组分析策略是对特定环境的样品构建DNA文库,再对构建的DNA文库进行筛选:首先将一个环境样本的DNA克隆在一个具有寄宿能力的宿主菌中,通常选用大肠杆菌,然后对克隆文库进行特定标志基因或者新陈代谢功能的筛选。这两种筛选方法分别称为基于序列和基于功能的筛选方法。

随着测序技术的发展,直接对环境DNA测序成为了可能,逐渐替代了传统的构建文库的流程。根据不同的研究目的,基于测序的宏基因组分析方法可以分成两类:标签序列测序和全基因组测序。标签序列测序通常以研究宏基因组多样性为主要目的,对样本的16S rRNA或者18S rRNA进行测序,通过将测序结果与现有的标签序列数据库比对分析,获取环境中微生物的物种丰度以及其它多样性信息。全基因组测序可以获得更多微生物群落功能方面的信息,测序结果不仅包含了群落的多样性信息还包含了功能的信息,这为研究微生物群落中单个物种、物种与物种的相互作用以及物种与环境之间的相互作用提供了信息。

1.2宏基因组二代测序技术mNGS检测病源微生物过程

使用宏基因组二代测序技术(mNGS)检测病原微生物通常需要6个步骤:采集病人感染部位的样本、提取核酸、对提取的核酸构建标准测序文库、高通量测序、生物信息分析确定病原菌和解读报告。最后医生根据报告中检测到的感染病原菌,对症下药。下面就其中重要步骤进行详细介绍:1)提取核酸,2)对提取的核酸构建标准测序文库,3)高通量测序,4)生物信息分析确认病原菌种类和定量(丰度)。

1.2.1提取核酸

从样品中提取DNA的过程是首先将微生物细胞的细胞壁、细胞膜打破,使基因组DNA释放出来,然后根据DNA的特质,将其从其他组分(主要是结合在DNA上的蛋白质)中分离出来。打破微生物细胞壁,通常使用溶葡球菌酶和溶菌酶破坏细胞壁成分的化学键。高质量的DNA是获得准确测序结果的基石。提取宏基因组的方法参考生物实验室常用的分子生物学方法,比如酚-氯仿法、加热煮沸法、Chelex-100抽提法,改良DNA抽提法和试剂盒抽提法。其中试剂盒抽提法技术成熟,有众多商品化试剂盒可选择。

判断DNA质量好坏的基本标准是样品在波长260nm处的吸收值(OD260)与280nm,230nm处吸收值(OD280,OD230)的比值。OD260是DNA的吸收峰值,OD280是蛋白质,OD230是碳水化合物。一般来说当OD260/OD280等于1.8,OD260/OD230等于2.5时,认为DNA较纯净。

1.2.2构建标准测序文库

得到纯化的宏基因组DNA后,需要通过加热或者化学的方法将DNA打断,接着在片段两端连接测序仪可以识别的接头序列(adaptor),通过一系列的纯化、预扩增(也有无需预扩增的商用试剂盒,例如TruSeq DNA PCR-Free Library Preparation Kits,Illumina)获得可以上机测序的DNA文库。

1.2.3高通量测序

新一代测序(Next-Generation Sequencing,NGS,也称二代测序)的方法先后有罗氏454焦磷酸测序技术、Illumina(Solexa测序技术)、SOLiD测序技术和Ion Torrent测序技术。目前Illumina(Solexa测序技术)为主流测序平台,Ion Torrent有一定份额。

Illumina(Solexa测序技术)的原理是边合成边测序,具体来说使用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出特定的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,得知此刻添加的是四种dNTP中的哪一种,再根据互补配对原则(AT,GC),从而推测出样品DNA的序列。

最主要厂商Illumina约占70-80%的市场,Illumina推出了三种适合检测宏基因组的测序仪,分别是NextSeq Series、HiSeq 4000 System和NovaSeq 6000 System。

Ion torrent是一种基于半导体芯片的测序技术。该项技术与454技术类似,它的核心技术是利用半导体技术将ATGC合成核酸链的过程转化为数字信息。将待测的DNA链固定在半导体芯片微孔中的微球上,随后依次掺入ACGT。符合配对的碱基与待测DNA链形成化学键,释放出氢离子。通过检测H +信号的变化即可获得序列碱基信息。Ion Torrent相比于其他测序技术来说,没有光学检测和扫描成像系统,因此,设备成本较低,测序速度快,整个上机测序可在2~3.5 h内完成。

Ion Torrent测序技术由Ion Torrent公司(后被Life Technologies公司收购,现为Thermo Fisher公司子公司)于2010年突出。Thermo Fisher推出的测序仪中有两个系列适用于宏基因组检测。


1.2.4生物信息分析确认病原菌种类和定量(丰度)

得到样品中DNA序列信息后,通过生物信息学分析可以得到样品中微生物的种类和含量。生物信息学学的分析主要分为预处理(质量控制、去除接头)、比对去除寄主基因序列(人)、比对序列至参考序列或经拼接组装后比对参考序列、计算每种微生物的丰度或其他分析四个步骤。

1)预处理(质量控制、去除接头)

质量控制是指剔除认为是测序出现错误的序列。测序时每一个碱基都会给出对应的测序质量值Q。碱基质量值Q是衡量测序质量的重要指标,质量值越高代表碱基被测错的概率P越小,其计算公式为Q=-10lgP。例如,Q20和Q30分别代表碱基被测错的概率为1%和1‰。不同的测序平台对应的剔除标准略有不同,通常标准是一条测得的序列中10%的碱基数质量值在30分以下时,会将这条序列剔除掉。通过Q30的控制可以有效防止序列测序错误导致后续的分析错误。

去除接头是指去除在测序过程中由于插入片段短于测序读长而测到两端的接头序列(adaptor)的情况。

2)比对去除寄主基因序列(人)

比对序列通常使用开发完善的生物信息学软件,常用短序列比对软件包括:SOAP、BWA、Bowtie、Martin和STAR等。

由于样品是来自病人的血液、唾液等,其中大部分的DNA序列来自病人细胞。所以通常会使用比对软件,先将测序的结果与人类参考基因组比对,从而将样品中属于人的序列剔除掉。通常人类基因组会占50%以上,甚至达到90%。

3)比对序列至参考序列或经拼接组装后比对至参考序列

将测得的DNA序列按物种进行分类是检测病原菌的核心环节。通常使用两种方法进行物种分类。一是基于序列相似性(同源性)的比对方法,二是基于序列特征的方法。这两种方法都需要已知物种的基因组信息作为参考序列。

宏基因组比对的参考微生物包括细菌、古细菌、病毒和真菌四大类。这些物种的基因组序列信息储存在多个权威数据库中,通常可从数据库下载所需基因组数据。

微生物基因组数据库介绍 资料来源:各数据库官网

基于序列相似性(同源性)的比对方法较为直接常规,其过程是利用比对软件,如BLAST,BWA和Bowtie等,将测得的片段比对到已知微生物物种上。常见使用此类的方法的分析平台有MG-RAST,CAMERA分析流程和MEGAN。

与已知基因组的物种比对的方法较为简单,然而由于在宏基因组中大量微生物是未知的,基于序列特征的分装方法也发挥着重要的作用。

由于二代测序技术得到的序列读长通常较短(几百bp),且其中的微生物组装复杂,通常对测序数据中的短片段根据两端的重叠序列进行拼接(assemble),再将其组装成更长的重叠片段(contig),再进行下游的分析将更有效。进一步将contigs分装至可操作分类物种单元(Operational Taxonomic Unit, OTU),再与现有的标签序列的数据库进行比对(如RDP,GreenGene,SliVA数据库),即可得到每一个OTU代表的物种信息。基于序列特征的分装方法可分为有监督和无监督两种。

资料来源:中国知网 探针资本整理

4)计算每种微生物的丰度或其他分析

目前有两种常见的计算物种丰度的方法。一种是将测序所得到的宏基因组序列与全基因组序列进行比对,经计算后得到物种丰度表。针对每一个物种,将比对到该物种的序列数(reads)比上比对到所有物种的序列数,并校正各物种的基因组大小(校正因为物种基因组大而随机使得比对到该物种的序列数多的现象)。另一种方法是将参考的多个物种基因组上单拷贝的系统发育标记基因取出,组成一个集合,每个物种比对到基因组上的序列数除以比对到该单拷贝基因集合的序列数记做物种的丰度。例如常用软件MetaPhlAn2在检测肠道样品时,会使用含了13500多个细菌古菌,3500个病毒和110个真菌的序列标记物的肠道数据库。软件mOTU计算物种丰度使用40个通用单拷贝系统发育标记基因序列,这40个基因来自3445个完整的细菌基因组和来自263个公开的宏基因组的未知物种。

1.2.5 使用mNGS检测病原菌的案例介绍

张金李和冯翔在临床诊断一例重症肺炎患儿时,初始诊断结果为支原体感染,然而使用红霉素、哌拉西林钠他唑巴坦、阿奇霉素抗感染治疗,效果不明显,怀疑其合并病毒感染,故使用mNGS快速检测了重症肺炎患者的呼吸道病原体。

资料来源:中国知网 探针资本整理

1.2.6 mNGS在临床应用中的难点

探针资本根据公开资料整理

1.3mNGS与现有技术比较

1.3.1与传统病原体检测方法的比较

1)传统方法介绍

涂片镜检是指将待检样品取材、制片后在显微镜下观察、分析和判断样品中微生物种类的一种临床诊断方法,通常用于疾病的初步判断。人体的排泄物、分泌物或病患组织都可以作为检查对象。常见的涂片镜检有革兰氏染色法,可检出革兰氏阳性菌(如肺炎双球菌、炭疽杆菌)、阴性菌(如百日咳杆菌、痢疾杆菌)。经过包括初染、媒染、脱色、复染等步骤后,革兰氏阳性菌呈现紫色,革兰氏阴性菌呈现红色并且由于染色使得细菌的形态和结构特征更易于观察,从而更利于分类鉴定。

左:革兰氏阳性杆菌,右:革兰氏阴性杆菌

生化方法是通过检测微生物表达的特异性的酶,从而鉴定微生物种类的方法。使用特定的底物,检测微生物代谢底物的能力,即可判断微生物是否具有某种特定的酶。例如检测沙门氏菌的辛酯酶法。各属肠杆菌科细菌中只有沙门氏菌表达辛酯酶,根据这一特性,甄宏太等开发了快速检测沙门氏菌的辛酯酶法。该方法是以42甲基伞形酮辛酯(MUCAP)为底物,在沙门氏菌的酶促反应后,生成4MU,在紫外灯下可观察到蓝色荧光。该方法在数分钟内即可完成,适合病菌的初步筛查。

全自动微生物生化鉴定系统是一种集生化反应、计算机和自动化技术于一体的检测技术,具有速度快,通量高的优点。常见仪器如法国生物梅里埃公司的VITEK系统和美国BD公司的PHOENIX系统。自动化系统可进行多达几十种的微量生化反应和药敏生长试验,根据各生化反应孔中的生长变化及呈色反应情况,由计算机通过数值编码技术与数据库进行比较分析,得到鉴定结果。

VITEK 2 COMPACT自动微生物鉴定系统 图片来源:公司官网

免疫学检测是利用抗原和抗体在体外特异结合后出现的各种现象,对样品中的抗原或抗体进行定性、定量、定位的检测。既可以检测病原菌的抗原,也可以检测免疫细胞的抗体。抗原检测可以确认病原菌,而抗体检测则是病人健康评估的方法,两者相辅相成。通常将待检测的抗原(或抗体)结合蛋白预先连接上某种标记物,借助标记物的荧光或酶的有色反应、放射性或高电子密度,在光镜或电镜下进行定性、定位或定量研究。比如诊断肺炎时可通过肺炎链球菌和嗜肺军团菌尿抗原检测及血清隐球菌荚膜多糖抗原检测诊断医院获得性肺炎。

微生物培养是通过培养样品中的微生物再结合检测液体菌液浓度(对应固体培养基检测菌落数)、或联合生化或免疫学检测对微生物进行鉴定的方法。例如罗氏培养法可以用于诊断肺结核病。罗氏培养基可促进分枝杆菌的生长并抑制其他杂菌,经培养3-4周后分枝杆菌形成菌落,呈干燥颗粒状,乳白色或米黄色,形似花菜心。

2)mNGS与传统方法的比较

探针资本根据公开资料整理

1.3.2与其他基于NGS的方案比较

1)其他基于NGS方法介绍

PCR扩增后测序是扩增富集已知病原体基因片段之后再测序。由于只扩增部分基因,该方法的测序成本较mNGS更低。但该方法对于未知病源的感染无能为力。例如,16S rRNA是原核生物(比如细菌)核糖体的组成部分。核糖体是序列高度保守的基因,可将扩增引物设计在多物种共同的序列区域扩增16S rRNA片段,之后再测序、比对鉴定微生物类别。

目标DNA区域捕获并测序的方法与PCR扩增思路类似,通过筛选出部分基因进行测序,从而降低成本。区别是筛选基因的方法:通过设计核酸探针(生物素标记)互补结合到待测病原体的基因组区域,从而捕获特定的病原体基因组片段,继而对这些片段进行测序。

2)mNGS与其他基于NGS方法的比较

探针资本根据公开资料整理

1.3.3与其他新兴方案的比较

1)新兴方案介绍

PCR检测技术是利用聚合酶链反应(Polymerase Chain Reaction,PCR),在DNA聚合酶催化下,以样品中提取的微生物基因组DNA为模板,选取特定微生物表达的特异基因设计引物,以是否能扩增出特异基因以及基因条带的位置来鉴定病原微生物种类的方法。例如对布鲁菌的bcsp31基因设计特异性引物再通过PCR扩增可快速检测血液、组织等标本中是否含有布鲁菌。

来源:中国知网

质谱检测技术通过对待测样本进行检测,获得其蛋白质图谱,再与已知微生物构建的数据库的参考图谱进行比对,从而鉴定病原微生物的方法。

2)mNGS与其他新兴方案的比较

探针资本根据公开资料整理

mNGS在临床中的应用

mNGS具有检测全面,准确率高,敏感度高和时间短的优势。鉴定样品中病原微生物时,mNGS可以补充或替代传统的生化、免疫和培养方法,更快更加准确地取得结果。更重要的是,传统方法在应对少见、罕见感染,新发性感染时常常束手无策,mNGS通过检测样品中全微生物物种,从而找出潜在的致病微生物,指导用药。

2.1在新发传染病疫情中的应用

在新发传染病疫情的发现和控制中,mNGS发挥了越来越重要的作用。2011年德国产志贺毒素大肠杆菌(STEC)O104:H4暴发,没有相应诊断试剂及标准可用于该新亚型,给检测带来了极大的难度。在多个高通量测序系统合力开展了宏基因组测序分析后,成功完成了菌株的基因组序列的重建,迅速确认了致命德国肠出血性大肠杆菌O104:H4。至今,mNGS在多次疫情中检测出致病菌,起到了鉴别病菌、控制疫情的作用。

数据来源:华大医学 广证恒生

2.2在感染性疾病诊断中的应用

mNGS用于感染性疾病的诊断首次由加州大学Charles Y. Chiu团队于2014年报道,发表在《英格兰医学杂志》。1例14岁患者,头痛、发热反复住院8个月,在进行了38种不同的诊断试验(从血清学到培养和活检),仍然无法明确其致病病原体,并进入了昏迷状态。最终团队使用mNGS检测其脑脊液样品,确诊为钩端螺旋体感染。随即给予针对性的青霉素治疗,32天后患者痊愈出院。此后该项技术广泛用于多种感染性疾病的诊断。

2.2.1在神经系统感染性疾病中mNGS的报道

据估计经过全面深入的传统检查后仍有30%~60%的脑炎病例无法明确其病因。使用mNGS检测可检查出所有微生物,帮助诊断病毒性(DNA病毒和RNA病毒)脑炎。2015年,德国报道了3例基底节脑炎患者,患者临床上以基底节病变为主,发病急骤,死亡率高,通过mNGS在脑内检测到松鼠博尔纳病毒,这是首次发现松鼠博尔纳病毒传染人类的证据。2015年,日本Sakiyama等报道了4例表现为脑脊髓膜炎的渔民,常规检查未能明确其致病病原体,通过mNGS检测发现其感染了以前从未曾报道的属于古细菌域的嗜盐菌(Halobacterium),在给予复方磺胺甲恶唑治疗后患者完全好转。上述报道均表明,mNGS检测在诊断罕见的、新发的或不典型的病原微生物(如钩端螺旋体、星状病毒、古细菌、博尔纳病毒)时发挥出了独特的优势,可以有效检测病原微生物并且指导用药。

2.2.2在呼吸道感染性疾病中mNGS的报道

在呼吸道感染中,除血液标本外,mNGS已用于多种呼吸道多种标本的检测,包括痰、咽拭子、胸水、支气管肺泡灌洗液、脓液及肺活检标本等。

谢云等报道了一项关于mNGS技术应用于重症肺炎的病原体检测效果的回顾性研究,对照组及mNGS组共178例患者。对照组130例患者送检痰、血及支气管肺泡灌洗液标本做常规的微生物培养,根据培养结果调整抗菌药物使用;mNGS组48例患者加做mNGS,根据mNGS检测结果调整抗菌药物的使用。最后以28天,90天死亡率为指标,mNGS组均显著低于对照组,说明在mNGS结果的辅助下,患者的治愈率显著更高。胡必杰等报道了应用mNGS检测病原体的一项大样本回顾性研究分析,纳入可分析数据的511例患者。通过分析发现mNGS较传统培养方法敏感性提高近15%。

2.2.3在小儿感染性疾病中mNGS的报道

王春花等人基于NGS方法优化的测序方法分别对94份重症病例和150份轻症病例临床样本进行了测序分析,共检出哺乳动物病毒科和植物病毒科共13种病毒。此外还检测出了多种肠道病毒不同型别之间、肠道病毒与非肠道病毒之间的混合感染事件,为手足口病的临床诊断提供了一种精准检测方法。严重急性呼吸道感染(Severe Acute Respiratory Infection, SARI)是儿童住院和感染死亡的重要原因之一。王延群等人对135份SARI儿童和15份非SARI儿童的呼吸道样品进行了mNGS测序,检测出病毒种类和主要病毒性病原,同时也通过比较病毒基因组学分析,发现感染组和对照组之间不同的病毒群落分布特点以及各个组内的特异性病毒特征。

应用病种流行病学特征


3.1呼吸系统感染性疾病

国际呼吸协会论坛(Forum of International Respiratory Societies)于2017年发布了《全球呼吸道疾病概况》,介绍了全球前五大呼吸系统致死疾病的流行病学数据以及预防、控制和治疗方案,其中包括感染类疾病:下呼吸道感染和肺结核。

下呼吸道感染和肺炎每年会导致全球多于四百万人死亡,在低收入和中收入国家中尤其严重。2015年,有920,136名儿童(五岁以下,新生儿期以外)死于下呼吸道感染和肺炎,占该年龄段死亡人数的15%。这也是多年来早逝和住院治疗的第二大原因。每年流感病毒会导致5-15%的人群下呼吸道感染并且有三至五百万重症患者。呼吸道合胞体病毒(RSV)是最常见的引起儿童急性呼吸道感染的原因,每年近3400万例,其中约90%RSV呼吸道感染死亡的儿童来自中低收入和中等收入国家。除RSV外,近几十年也有新的呼吸系统病毒出现,如2003年爆发的SARS病毒。

肺结核的发病率在以每年1.5%的速度递减,然而死亡率仍然高居不下,维持在17%。地区间死亡率差异较大,从5%到超过20%不等。2015年,肺结核共导致全球140万人死亡,是最大的单传染源致死病和世界范围内最大的致死疾病之一。2015年,合并HIV,肺结核的死亡人数达40万人。肺结核病例主要分布在20个国家,其中非洲中部和东南亚区域发病率较高。2015年新增肺结核病例数1040万例,其中100万例是儿童,并且由于儿科肺结核病诊断难度大,此数字可能被低估。2015年估计新增案例中约58万案例有耐药性,11%合并HIV感染。

3.2神经系统感染性疾病

2018年6月,J Neurosurg杂志刊登了由哈佛医学院的Faith C. Robertson、BS等人关于中枢神经系统感染性疾病的研究。研究者对1990至2016年期间发表的关于中枢神经系统感染病例的文献进行回顾和荟萃分析,统计了发病率,描述了地区分布情况。报告共涉及10万个过往研究,共有约51万个案例,共计1.3亿人次。

根据世卫组织对区域的划分,非洲的细菌性脑膜炎发病率最高(65例/100,000人),神经囊尾蚴病(650例/100,000人)和结核性脊柱炎(55例/100,000人),而东南亚的颅内脓肿发病率最高(49例/100,000人),欧洲非椎板性脊椎椎间盘炎的发病率最高(5例/100,000人)。有限的死亡数据显示结核性脑膜炎/脊柱椎间盘炎(21.1%)死亡率最高,神经囊尾蚴病最低(5.5%)。

报告指出各类中枢神经系统感染疾病的发病率和国家/地区收入相关。发病率低等收入国家>中等收入国家>高等收入国家。

合并的各类发病率有明显的地域差异(下图所示),其中非洲最高。

全球发病率统计 J Neurosurg 

竞争格局


探针资本根据公开资料整理


体外诊断新媒体&服务平台

满足好奇丨解决问题

长按识别小程序

每日奉上最新行业资讯

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多