分享

综述|Water Research: 环境中抗生素抗性基因的溯源追踪--挑战、进展和展望

 商商sutkwkb7dv 2021-01-18

论文信息

论文题目:Source tracking of antibiotic resistance genes in the environment — Challenges, progress, and prospects

期刊:Water Research

IF:9.13

发表时间:2020

点击最下方“阅读原文”下载完整文献pdf文件。

摘要

抗生素耐药性已成为全球公共卫生关注的焦点,抗生素耐药性的流行使得临床上一些常见的感染感染性疾病无药可医。

鉴于这一现象的普遍性,人们将越来越多的注意力转向可能有助于抗生素抗性基因 (Antibiotic resistance genes, ARGs) 在临床领域之外传播的环境途中。

过去数十年的研究清楚地证明了,随着人类活动对环境影响强度的增加,ARG污染的的程度也随之增加

但是,在这些前人的研究中,对ARG准确的溯源跟踪一直受到各种因素的影响,例如环境中原发性ARG水平、不同环境的时空差异、环境抗性组的复杂性以及方法学的局限性。

快速发展的宏基因组学结合基于机器学习的分类技术为追踪环境中ARG污染的来源开辟了一条新途径。

在这篇综述中,将讨论有关环境ARG污染溯源追踪研究中的挑战和进展,并且会特别关注近期宏基因组学的方法进展。

本篇综述提出了一个基于宏基因组学的综合框架,在该框架中结合了实验设计和宏基因组学分析,将有助于实现在ARG污染换几个闹钟功能中进行可靠的溯源追踪。

引言

自从20世纪初期第一种有效的抗生素(即磺酰胺和青霉素)被发现到现今为止,在细菌和抗生素之间的“军备竞赛”中,人类医学开始衰落,细菌开始了反击。

世界银行警告说,到2050年,抗生素耐药性可能导致全世界每年死亡超过1000万人并会带来超过100万亿美元的全球经济损失。

然而,抗生素耐药性的控制策略尚处于起步阶段,目前,人们越来越关注生态环境可能是临床领域之外导致抗生素耐药性问题的重要介质。

长期以来,研究人员一直提出将ARGs作为污染物,在环境的常规污染物监测中通常不包括ARGs,但是其有可能造成不利的生态和人类健康影响。

与其它化学污染物不同,ARG在环境中的行为通常与其生物学特征有关,例如垂直(从父母到后代)和水平(从兄弟姐妹或同伴)的遗传流动。

实际上,直到21世纪初,将环境中的ARGs作为污染物来看待才得到普遍的认同。

Pei和Pruden等人(2006)首次在科罗拉多州北部的不同环境中将ARGs作为新兴污染物进行了研究,他们发现在城市/农业直接影响的环境中,几种四环素和磺酰胺抗性基因的浓度明显高于原始环境和受人类影响较小的环境。

随着更多的调查研究,人为活动与ARG环境污染之间正相关的证据被发现,因此,识别可能的来源并了解它们与ARG发生的关系对于控制ARG在环境中的传播至关重要

多种方法已经被应用于鉴定环境中ARG污染的可能来源。

由于大部分环境细菌无法被分离培养以及不确定的基因型与表型的关系,依赖于培养的方法几乎无法有效追踪ARG的污染。

尽管这些缺点可以使用一些非培养的方法得以解决,例如基于PCR的技术,单由于需要专用的引物,因此只能从样品中检测或定量某些特定的ARG。

快速发展的高通量测序技术提供了一种全新的方法,可对样品中遗传元件的多样性和丰富性进行前所未有的观测,为通过统计学分析定量对环境中ARG污染水平进行溯源跟踪提供了机会。

鉴于环境中的抗生素耐药性与临床领域之间的联系日益实现,迫切需要一个ARG溯源追踪平台,来有效地评估和处理环境ARG污染。

在这篇综述中,我们提供了方法开发的概述,并重点介绍了环境中ARG污染定量来源跟踪的最新进展,讨论了作为一种新兴污染物的ARGs的相关特征以及在环境中追踪其归驱的挑战。

环境中的抗生素、抗生素耐药性和ARGs

作为微生物生长必不可少的防御体系,抗生素是微生物生态系统的的天然组成成分之一,在疾病控制发现并使用抗生素引发了医学革命,极大地促进了天然和合成抗生素的发现和生产,据估计,全球每年会生产约100,000吨的抗生素。

与抗生素一样,抗生素耐药性也是细菌中一种古老的保护机制,可以防御细菌自身或者群落中其它微生物产生的抗生素。

抗生素耐药性通过多种机制来抵抗抗生素,包括防止抗生素与靶标物质接触、直接对抗生素进行修饰或改变抗生素的靶标结构等等,这些抗生素抗性功能主要由突变或外源获得的ARG编码。

多年的研究表明,抗生素消耗量的增加会导致细菌中抗生素耐药性和ARG的快速发展,这说明抗生素、抗生素耐药性和ARGs之间可能存在明显的相关性

然而,在复杂的环境中,这种关系可能会被人为或其自身相关的化学、生物学特征所破坏。具体而言,ARGs作为遗传单元可以通过由接合转移、转导和转化等遗传机制进行传播,此外,检测方法的局限性也可能会影响这种相互关系。

我们经常会在不同的研究中发现相互矛盾的陈述,一方面,在城市河流等典型的抗生素污染环境中,抗生素浓度与ARG含量之间存在正相关,另一方面,在有限的抗生素污染环境中,甚至在没有抗生素的情况下,也可以发现很高的ARG的多样性和污染水平。

这些研究表明,抗生素、抗生素耐药性和ARG并不总是直接相关的,因为它们之间的关系一直在环境中不断受到各种复杂条件的影响

追踪环境ARGs的挑战

一旦将ARGs或携带ARG的细菌释放到环境中,它们将通过与原生微生物群落在生理和生态相互作用促进遗传物质的交换。此外,ARG的归驱将在一定的时空范围内受到动态环境条件的影响,所有这些条件或过程都会对环境中ARG的追踪造成困难。

原生ARG水平的干扰

抗生素耐药性是一种自然现象,其出现早于现代医疗中抗生素的使用,因此,某些类型或含量的ARGs是环境中天然存在的。为了精确地识别由其它来源导致的ARG污染,首先就必须要排除这些环境与安生ARG的干扰。

实际上,已经在自然环境中发现了具有临床重要性的ARG,在自然土壤甚至3万年前的永久冻土沉积物中,已经发现了编码β-内酰胺、四环素和糖肽抗生素抗性的基因。此外,在一项跨地理梯度的污染区域研究中,确定了背景环境中存在一个本地tet基因库,维持这些库的生态压力可能独立于污水处理厂和泻湖等污染源。

为了解决背景影响,Storteboom等人对位于落基山的Cache-La-Poudre河原始上游地区与下游受城市和农业影响的地区的ARG水平进行了比较。因此,在环境研究中包含本土区域的对照样本以区分本地和异源的ARG对ARGs污染的溯源跟踪至关重要

此外,原始环境可能非常容易受人为干扰的影响,这种原始环境的微生物群落在受到低水平人类污染干扰的情况下就会发生快速的变化。因此,对环境ARG的来源跟踪需要进行全面调查以识别真正的本土原始环境对照。

具有任何人为干扰历史记录的环境都应排除在自然环境对照之外,因为就算污染已经被控制了很长时间,其造成的ARGs污染依然可能会持续存在。

时空差异的影响

在大多数ARG源追踪研究中,通常情况在是特定区域的特定时期内采集样品,作为覆盖污染梯度的代表性样本,为了确保这些样本中的ARGs反映了环境中的人为干扰程度,在实验设计阶段综合的考虑时间和空间的变化是非常有必要的

气候效应和季节性人为活动等季节性因素可能会在某些地区稀释或富含ARG的过程中施加额外的作用力。此外,如果不考虑其他重要的水文地质特征,可能会高估或低估人为因素对ARG的影响。

除环境条件的变化外,生物量密度沿时空尺度的变化同样可能会对ARG的发展产生影响,当将ARGs进入到高生物量密度的受体环境中时,强烈的微生物相互作用可能会增强水平基因转移和随后的ARG传播,但是在低生物量密度的环境中情况并非如此。

由于共选择物质导致的ARG流程

近年来,其它共选择压力对ARG增殖和传播的重要作用也已被大众接受

反复观察到的的遗传物质共存表明,金属暴露(例如铜,锌和汞)可以促进对多种抗生素的抗性。目前,已经提出了一些金属驱动的对抗生素抗性的共选择的机制,主要包括:
i)共抗性,编码不同抗性表型的基因物理连接在一起;
ii)当抗生素或金属可以触发常见的生理反应时可能发生的交叉耐药性;
iii)共同调节,其可以协调对抗生素和金属的抗性的转录和翻译应答。

此外,杀菌剂,例如季铵化合物,在其作用机理上可能显示出与抗生素的相似之处,这也可能促进ARG在环境中的持续存在。

这些关联性的研究表明,抗生素以外的其它污染物可能代表了广泛的、顽固的选择压力,从而导致环境中ARG的传播和维持

这种现象已在污水处理厂和农业污染地区的ARG污染源追踪中得到了例证,其中ARG的增殖与非抗生素药物显着相关,而ARG对应的额抗生素却机会未被检测到。

因此,由于基因单元携带的基因不仅只是ARG还包含多样的其它基因,任何能够对这些其它基因发生选择的压力都会间接选择AEG,所以ARG的富集并不总是需要抗生素的选择压力,取而代之的是,其它因素的供选择可能是ARG在环境中普遍存在和持续的主要驱动力。

环境ARG污染的遗传多样性

过去,对环境中的ARG污染进行溯源追踪的重点一直是环境中流行的某些特定ARG,但是,在大多数情况下,这些研究都忽略了环境中抗生素抗性组的总体情况

在一个给定环境中,整体抗生素耐药性是所有ARGs的集合,被称为“抗生素抗性组”,既包括固有的和获得的ARG(通过固有的微生物特征编码具有固有耐药性的蛋白质以及通过突变或水平转移获得耐药性基因),也包括前体和隐性ARGs(编码具有适度抗生素抗性活性的蛋白质和未表达或表达不足的抗生素抗性的蛋白质)。

基于宏基因组学的大规模研究已经证明了临床环境意外的ARGs具有极高的深度和生态位,特别是在承受人为压力的环境中通常具有大量的ARG。与其他环境相比,这些环境中相对较高的生物密度大大增加了ARG的转移和增殖的机会。

基于标志基因的环境ARG污染溯源

自从在21世纪初意识到环境ARG污染对公共卫生的潜在威胁以来,在过去的几十年中,针对鉴定ARG可能来源和促进风险管理方法的开发一直都没有停歇。

由于缺乏详尽的工具来测试涵盖所有抗生素类别的抗性基因,因此通常采用传统PCR方法检测特定标志基因的频率,以指示某个区域内的总体ARG污染。

目前,已经提出了几种ARG标志基因(即用于环境检测的经过充分研究的ARG),例如使用tetW和tetM指示四环素抗性基因、sul1和sul2指示磺胺抗性基因、blaCTX-M和blaTEM指示β-内酰胺抗性基因等等。最近,有研究人员提出临床第1类整合子的整合酶基因intI1可以作为人类活动ARG污染的指示者。

但是,传统qPCR技术在通量上的限制很大程度上阻碍了人们对各种不同环境中抗生素抗性组的全面了解。最近发展的qPCR芯片技术允许同时对数百个目标基因进行定量,并大大提高了定量能力,它已成功地用于多种环境体系的研究中。

除此之外,Gatica等人开发了一种高通量的扩增子技术,可以对环境样品中所有整盒子的基因盒基因进行表征,并将其应用于污水处理厂废水对下游受体环境的影响的研究中。

在使用单个或多重标志ARG的技术进行ARG污染溯源追踪时,一个主要问题是对如何识别背景环境的干扰。理想情况下,此类标志基因应在人为来源中丰富,而在天然生态系统中则很少,然而,由于在各个生境中报告了重叠的ARG库,并且在原始地区频繁出现一些典型的标志ARG,因此,在一定的时空范围内,缺乏对标记ARG分布图的严格预先测量,可能会在很大程度上造成混淆溯源跟踪结果

除了检测频率外,还可以通过从潜在的污染源与受影响的环境之间的标志ARG系统发育关系来解决对ARG污染的跟踪

在微进化的背景下,独特的环境选择性压力可以产生特定的ARG辩题,从而为ARG污染溯源提供了有用的遗传信息,以区分环境中不同的人为干扰所引入的ARGs。

这一假说最近在一项比较受污染和未受污染的河流抗生素抗行足的研究中得到了证实,研究人员发现blaCTX-M基因的核苷酸序列在被污染的和未被污染的抽水生态系统之间存在明显不同。此外,污水处理厂和牲畜场特有的典型标记ARG的序列变体tetW和sulI也已用于识别下游/邻近环境中相应的ARG污染情况。

为了明确地识别来源,各种统计分析已应用于基于标记基因观察结果的解释。除了基本的丰度增加/减少和不同环境的主坐标分析之外,目前还开发了强大的工具来解释生物/非生物现象引起的ARG变化。

通用线性回归(GLR)模型被证明是一种有效的工具,在一项应用GLR模型追踪河流ARG的研究中,对sul1和tetW基因的数量进行了建模,通过评估详尽的GLR模型集解决了上游人类活动与河流ARG之间的相关性,最终该研究的研究人员建议使用tetW:sul1的比率作为评估河流上游污染的指标。

高通量qPCR芯片的应用也鼓励使用合适的高通量工具来同时处理标记ARG,例如RandomForest预测分析。

尽管做出了这些努力,在ARG污染溯源跟踪研究中,精确的定量仍然是重大挑战。而且,在标记物-ARG定量分析中,PCR方法固有的偏差(如扩增效率和引物特异性)是不可避免的,迫切需要有效的新型工具来准确追踪ARG来源。

新的方法和未来的路

高通量测序技术的发展可以大规模并行定量捕获样本的遗传信息,其可以规避传统基于PCR的方法的局限性。

通过在序列处理和功能注释中生物信息学工具结合,基于高通量测序的宏基因组学技术已被广泛用于各种生境的ARG分析。并且,多项宏基因组学研究表明,ARG的组成特征与人为干扰水平显着相关,证实了宏基因组学有能力跟踪区域性ARG污染。

宏基因组学在环境污染跟踪中的成功应用,以及不断发展的计算方法和流程,建立精确的ARG溯源跟踪框架铺平了道路。

宏基因组溯源的早期工作

在探索宏基因组学在源跟踪中的早期工作中,主要关注于可能的ARG来源(如污水处理厂和农场)的存在或不存在相关基因丰度的增加或减少之间的关系。

将宏基因组学纳入框架中以监测环境中ARG的水平也为早期风险管理提供了一种新颖的方法。科学家探索使用宏基因组数据进行环境健康检测的潜力。他们使用了基于宏基因组流行病学的方法来开发了一种多变量指数,以量化水生环境的抗生素耐药性的潜在风险。

机器学习在定量溯源中的可能应用

尽管宏基因组学在评估和跟踪ARG污染方面得到了早期的示范效用,但仍然没有充分利用大量的信息数据,并且溯源跟踪中的定量框架问题仍然有待解决。

为了通过宏基因组学实现精确的来源判定,需要一种新颖的统计上稳健的分类方法,以解密嵌入在包含数千个ARG的丰度矩阵中的定量信息。

通过利用全面的数据来获取样本唯一的模式,机器学习分类方法已成为当今大数据时代的宝贵工具。最近,随机森林、SouceTracker和FEAST等机器学习的方法已经成功的应用在微生物群落研究中。特别是其中的SourceTracker方法,已经被成功的应用于ARG污染溯源追踪的研究中,因此,使用机器学的方法对环境ARG污染进行溯源追踪是十分有前景的。

由于机器学习分类使用源库作为训练数据集来识别不同源之间的唯一模式,因此,进行仔细的实验设计以包括代表性的高质量源样本是进行精确源跟踪的前提,应该进行包括地理和时间可变性在内的详细调查,以明确识别可能的污染源。

任何源跟踪分析中的一个主要干扰是背景噪声,这会导致假阳性信号和不必要的关注,通过在源库中包含原始环境,可以识别本地ARG的背景污染信号,在下游溯源分析中将其排除

基于源库的训练,可以通过体外实验进一步检查和改进机器学习分类的性能,通过按特定比例混合源样品和测试环境样品最为分析方法的输入,可以有效的评估方法的准确性和有效性。

为提高分析结果的准确性,应该考虑SourceTracker预测的源贡献比率的相对标准偏差,尤其是对于对样本的贡献较低的源,并且应该以多次运行为基础来确定结果。

诸如增加稀疏深度之类的参数设置更改已显示出可增强运行一致性并区分假阳性来源,但是,仍然需要更严格的评估,包括重新启动次数、吉布斯采样的burn-in、稀疏深度、alpha和beta Dirichlet超参数等等,在不久的将来对这些技术参数进行系统评估,将可以充分利用机器学习分类的潜力,以高特异性和高灵敏度从而更好的量化ARG污染的多源贡献。

其它基于宏基因组的溯源研究

除了总体ARG图谱之外,宏基因组学还提供了环境样本中基因组水平上每个个体ARG的高分辨率结果,从而指导基于指示ARG的分析。此处,指示ARG的定义是通过统计方法,例如使用R包“labdsv”中的“indval”函数对频率和丰度进行分析,从而从宏基因组数据集中检索到的特定ARG。

为了识别表征针对每个不同污染源的指示剂ARG,首先要排除那些在不同源中同等流行或目标源样品中偶发检测到的ARGs。因此,应同时考虑来源检测的特异性和敏感性,仔细选择合适的统计方法。

与传统标志基因相比,从宏基因组学数据中选择的ARG指标在区分不同来源方面效率更高。作为一种补充方法,这些指标ARG将有助于解决ARG污染溯源追踪所面对的一些问题。

在污染源占比比较低的污染环境中,使用SourceTracker的结果通常会有很大的变异幅度,基于这些指示ARG的PCR技术可以作为高灵敏度的补充方法。此外,SourceTracker在区分相似成分的来源时可能会遇到一些问题,该问题可以使用具有高度特异性的经过统计验证的指标ARG来解决。

通过使用适当的工具,宏基因组学可以通过将短读长篇度组装到连续片段,来检索完整的基因及关联的上下游信息,因而具有特定核苷酸改变和系统发生关系的污染源源特异性ARG变体可以在污染的环境中进行被识别和跟踪,无需依靠额外的繁琐的PCR和测序,宏基因组学就快速的完成基于ARG变体的溯源追踪过程

此外,组装的contig可以在编码的ARG的附近提供基本的上下游信息,可以检索出可移动的遗传单元和与宿主相关的特征,从而进一步评估ARG污染的风险,其中含有高可移动性和致病性的ARGs污染在环境风险评估中将成为需要特别关注的问题。

通过进一步的序列处理,可以获得样品中存在的高质量的ARG的完整或原始宿主基因组,一次来追中携带ARG的种群。

宏基因组ARG分析的工具和数据库

不断降低的测序成本以及生物信息学分析技术的发展极大地促进了宏基因组学在各个领域的广泛应用,在宏基因组学的ARG分析中,对ARG基因的准确注释对于下游分析至关重要,这一过程现在可以在reads和contigs水平上进行。

可以使用诸如BLAST、BWA或Bowtie2之类的比对工具将测序平台产生的reads直接与参考数据库进行比对,然而,这种方法可能会增加注释的假阳性比例,因为从局部序列同源性出发,一个特定ARG的reads可能会与其他ARG出现虚假的匹配。

仔细的比对参数测试将有助于减少这种注释偏差,其中相似度之类的参数如果过高(例如>90%)会减少检测基因同源性,而过低(例如<70%)会增加基因注释背景噪音。

随着多种拼接工具(MetaSPAdes、IDBA-UD、MEGAHIT)的发展,使得通过长连续contig进行深入的遗传特性分析成为可能。但是,不恰当的装配,尤其是在测序深度不足的样品中,基于拼接的方法可能会丢失那些低丰度的ARG

与基于拼接的分析相比,基于reads的方法可以更广泛获得复杂群落中丰度较高和较低的ARGs,并且,基于reads的分析通常需要更少的分析时间和计算资源,这对于ARG污染的快速检测和管理是至关重要的。

在ARG污染的溯源跟踪研究中,作者建议利用基于reads的注释捕获整个样品中ARG的总体图谱,之后进一步使用基于拼接的分析来考察特定的ARG

无论是基于reads的还是基于拼接的ARG分析在很大程度上都要依赖于经过整理的数据库来进行ARG注释,因此,开发和维护高质量的公共ARG数据库对于在ARG污染中实现有效的溯源追踪至关重要。

通用的并持续更新的数据库,例如CARD和SARG涵盖了大量不同类型的ARGs,此外,还有专门针对特定基因家族的特定ARG数据库,例如专注于β-内酰胺酶的LacED、Lahey和CBMAR。还有诸如PointFinder和CARD-RGI之类的工具,用于检测能提供细菌耐药性的染色体突变。

鉴于在各种功能宏基因组学研究中发现了越来越多的新型基因,FARME和ResFinderFG中包含一些其它数据库中没有的经过筛选的ARGs。

最近,使用隐马尔可夫模型进行ARG分配,显着提高了检索那些具有抗生素抗性功能域而通过相似性又无法识别的的基因的能力,SARGfam和Resfam中包含着ARG家族的蛋白质及其隐马尔可夫模型。

在不同的数据库中,所包含的ARG的数量和多样性可能相差非常多,这将在很大程度上影响注释的结果,在分析环境和临床起源的样本时,这一点尤其明显。因此,建立数据库和开发具有足够检索能力的算法对于检查环境抗生素耐药性至关重要。

在以上数据库中,作者建议研究人员根据样本类型和研究目的选择合适的数据库,全面的数据库包含所有ARG变体,在从复杂的环境群落中识别ARG时特别有用,而专门的数据库可以更好地为表征特定和新型ARG服务

结论

本文提出一个基于宏基因组学的综合框架,用于对ARG污染进行溯源跟踪,宏基因组是框架中的核心部分。

在建立定量溯源追踪框架中有3个关键的问题:

1) 需要非常仔细的确定研究的地理和时间尺度,从而确定研究中作为源和用于溯源的样品,并且还要认为的制作特定比例混合的测试样品用于方法的验证;

2) 使用高质量的参考数据库对宏基因组数据集进行注释,对样本的ARG的丰度矩阵以进行机器学习分类,使用源样品训练分类模型,使用人造样品评估分类模型,之后应用其分析污染环境样品,在此过程中要进行多次的机器学习并不断优化调整参数;

3) 使用宏基因组分析识别指示ARG、靶标ARG的序列变体和携带ARG的基因组,基于这些特定基因/基因组的互补分析将有助于解决在跟踪低比例和重叠源上的挑战。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多