分享

如何更好的监控代谢组检测过程中的数据质量?

 bio_ww 2019-12-16

代谢组学是涉及生物体中所有代谢物质定性定量分析的一门科学,每一个生物体样品,涉及的物质成分在几百到几千不等,为了分析比对生物体代谢差异,实验设计中的样品数量一般也有几百到上千,产生的数据量非常庞大数据质量的好坏直接影响分析目标结果的科学性和准确性。对于如此庞大的数据,很难通过简单直观的分析进行判断筛选,所以在代谢组学研究中,数据监控是非常重要的环节,需要贯穿整个检测过程,以达到确保数据质量的准确性和稳定性的目的。


 那影响数据质量的因素有哪些,又如何更好的监控代谢组学中的数据质量呢?


影响数据质量的因素非常多,前处理环节的一致性、仪器设备的稳定性、实验环境的影响,方法学的稳定性、样品本身的特性等。 


为了更好的监控检测过程中的数据质量,一般引入QC样品的概念,加入质控样品、标准样品等进行在线分析,或通过数学软件工具等进行辅助。以下以代谢组学中常用研究方法LC-MS(液质连用)技术为例,从样品前处理和上机检测环节进行说明,并简述数学处理软件在质控中的应用。



 采用内标进行质控 

内标可以作为定量分析的校正依据, 也能反应样品前处理环节的一致性以及仪器设备的状态信息。在样品前处理环节,提取溶剂中添加固定浓度的内标,可以达到监控的目的。


例如,在正常情况下,添加的内标浓度和体积均一致,质谱图中内标的响应值原则上应处于同一水平线,根据内标响应的波动情况,可以监控在多样品的情况下,人员操作水平是否一致,是否按规定的体积添加溶剂,是否漏掉特定的操作步骤等。



内标物的选择,原则上是完全化学惰性,但由于样品的个性化差异及复杂的基质效应干扰,不可能避免的会产生一些特异性变化,单一内标会带来误判。为了避免此类情况,同时采用多种内标可以有效的防止此类误判,例如下图:



从图中可以看出,A内标有3个样品的响应值异常,按常规判断属于前处理环节出现问题,但同时添加的B内标对应的响应正常,表明前处理环节是准确,仅说明此部门内标物和样品之间存在特异性的反应,样品提取制备环节的错误或偏差需要多个内标同时判断。


需要注意的是,采用内标监控前处理环节的一致性,需要在前处理的初始阶段选择添加含内标溶剂。


内标物质的添加,还可以对液质分析中离子源响应值进行监控判断,质谱响应信号是否存在系统性偏差,也是数据分析的一个重要参考。



 通过质控样品重叠图监控
 

代谢物检测,对数据质量非常敏感,仪器设备的稳定性直接决定数据质量,质谱检测中,特别是对大队列样品检测过程,时间跨度大,色谱行为的稳定性受很多因素的影响,例如温度的变化、流动相中气泡的干扰,泵的稳定性,柱压波动等,如何有效的监测这些异常,可以通过标准品重叠图进行分析判断。


即在连续进样过程中,每间隔一定数量的样品,插入一个质控样品,通过该质控样品的重叠情况判断仪器状态。正常情况下,由于是同一份样品,总离子流图应该完全重叠。如果发生漂移,则表明检测过程中,仪器出现较大的波动,数据存在问题。


 对于较为稳定的数据,如下图,从进样开始到结束的过程,色谱行为基本稳定,保留时间基本一致:



对于异常情况 ,通过重叠图,可以很直观的反映,如下图:同一成分的总离子流图的时间坐标偏移较大,物质成分不能重叠和对应,仪器的状态有较大的波动和疑问,数据质量不可靠。




查看重叠图的质控样品的类型,可以根据实际选择,医学类样品中,可以参考国际上通用的美国NIST标准品 SRM 1950  Metabolites in Human Plasma(血浆中的代谢物),也可以选择成分已知标准物质。


 另外,对液质分析而言,柱压也是监控数据稳定性的一个重要方面,很多情况下,重叠图的异常,伴随柱压的异常,不可避免会产生波动。



 通过柱效监控 
 

液质分析中,色谱分离是重要的环节,由于样品污染,色谱柱柱效会持续降低,对积分结果会产生很大的偏差,甚至会引起严重的漂移,导致检测错误,影响数据质量。有效的监控柱效,是确保数据质量的重要方法。


 柱效好坏可以通过峰型直观的判断,也可以采用拖尾因子等参数辅助分析,对大队列样品而言,柱效不可能一直保持初始状态,随着样品数量的增加,会在某个节点产生质变。


例如对于一个一千多例样品的代谢组分析,在初始阶段,峰型正常,对称、峰宽较小,在进样量达到800多例时,峰型有明显变化,峰展宽,拖尾,不对称,在后期阶段,保留时间也随着偏移,表明柱效已经发生显著改变。




以上情况,拖尾明显,以及保留时间发生漂移,均可判定为异常数据,严谨的分析情况下,需要采取策略,让柱效恢复到初始值,对该部分数据重新测量。下图为重新冲洗色谱柱后,柱效恢复的结果:




如果采用拖尾因子分析,也可以起到监控数据的效果,拖尾因子是反映柱效变化的直观指标, 对以上实验过程的综合分析,结果如图所示:(其中横坐标为样品计数,纵坐标为拖尾因子),可以看出,质谱分析中,在大队列样品的情况下,在一定的节点位置,柱效不可避免的会出现衰减,通过连续的数据监控,可以有效的杜绝此类异常数据。






 数学分析工具的应用

代谢组学分析中涉及的数据量非常庞大,数据分布有一定的规律,可以借助数学工具进行统计学分析,例如主成分分析、聚类分析、归一化处理等等,下图显示了采用PCA主成分分析不同组别样品的分布情况,可以看出红色标注符号的样品可能存在异常。




  结 语  


数据监控是代谢组学中非常重要的环节,数据监控没有最全面的方式,需要多种方法结合,根据不同类型样品的特点,综合采用多种方法同时进行。避免多人同时操作的个体差异、尽量使用同一种仪器设备、在上机检测前对仪器状态有较为清晰的认识、在样品中穿插不同类型的质控样品、也可借助数学工具来辅助诊断数据的异常等,都是确保数据质量的关键。


但做好代谢组分析,更为重要的是提高分析人员的专业素质,严格按照规范的操作步骤统一进行。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多