内标可以作为定量分析的校正依据, 也能反应样品前处理环节的一致性以及仪器设备的状态信息。在样品前处理环节,提取溶剂中添加固定浓度的内标,可以达到监控的目的。
例如,在正常情况下,添加的内标浓度和体积均一致,质谱图中内标的响应值原则上应处于同一水平线,根据内标响应的波动情况,可以监控在多样品的情况下,人员操作水平是否一致,是否按规定的体积添加溶剂,是否漏掉特定的操作步骤等。
内标物的选择,原则上是完全化学惰性,但由于样品的个性化差异及复杂的基质效应干扰,不可能避免的会产生一些特异性变化,单一内标会带来误判。为了避免此类情况,同时采用多种内标可以有效的防止此类误判,例如下图:
从图中可以看出,A内标有3个样品的响应值异常,按常规判断属于前处理环节出现问题,但同时添加的B内标对应的响应正常,表明前处理环节是准确,仅说明此部门内标物和样品之间存在特异性的反应,样品提取制备环节的错误或偏差需要多个内标同时判断。
需要注意的是,采用内标监控前处理环节的一致性,需要在前处理的初始阶段选择添加含内标溶剂。
内标物质的添加,还可以对液质分析中离子源响应值进行监控判断,质谱响应信号是否存在系统性偏差,也是数据分析的一个重要参考。
代谢物检测,对数据质量非常敏感,仪器设备的稳定性直接决定数据质量,质谱检测中,特别是对大队列样品检测过程,时间跨度大,色谱行为的稳定性受很多因素的影响,例如温度的变化、流动相中气泡的干扰,泵的稳定性,柱压波动等,如何有效的监测这些异常,可以通过标准品重叠图进行分析判断。
即在连续进样过程中,每间隔一定数量的样品,插入一个质控样品,通过该质控样品的重叠情况判断仪器状态。正常情况下,由于是同一份样品,总离子流图应该完全重叠。如果发生漂移,则表明检测过程中,仪器出现较大的波动,数据存在问题。
对于较为稳定的数据,如下图,从进样开始到结束的过程,色谱行为基本稳定,保留时间基本一致:
对于异常情况 ,通过重叠图,可以很直观的反映,如下图:同一成分的总离子流图的时间坐标偏移较大,物质成分不能重叠和对应,仪器的状态有较大的波动和疑问,数据质量不可靠。
查看重叠图的质控样品的类型,可以根据实际选择,医学类样品中,可以参考国际上通用的美国NIST标准品 SRM 1950 Metabolites in Human Plasma(血浆中的代谢物),也可以选择成分已知标准物质。
另外,对液质分析而言,柱压也是监控数据稳定性的一个重要方面,很多情况下,重叠图的异常,伴随柱压的异常,不可避免会产生波动。
液质分析中,色谱分离是重要的环节,由于样品污染,色谱柱柱效会持续降低,对积分结果会产生很大的偏差,甚至会引起严重的漂移,导致检测错误,影响数据质量。有效的监控柱效,是确保数据质量的重要方法。
柱效好坏可以通过峰型直观的判断,也可以采用拖尾因子等参数辅助分析,对大队列样品而言,柱效不可能一直保持初始状态,随着样品数量的增加,会在某个节点产生质变。
例如对于一个一千多例样品的代谢组分析,在初始阶段,峰型正常,对称、峰宽较小,在进样量达到800多例时,峰型有明显变化,峰展宽,拖尾,不对称,在后期阶段,保留时间也随着偏移,表明柱效已经发生显著改变。
以上情况,拖尾明显,以及保留时间发生漂移,均可判定为异常数据,严谨的分析情况下,需要采取策略,让柱效恢复到初始值,对该部分数据重新测量。下图为重新冲洗色谱柱后,柱效恢复的结果:
如果采用拖尾因子分析,也可以起到监控数据的效果,拖尾因子是反映柱效变化的直观指标, 对以上实验过程的综合分析,结果如图所示:(其中横坐标为样品计数,纵坐标为拖尾因子),可以看出,质谱分析中,在大队列样品的情况下,在一定的节点位置,柱效不可避免的会出现衰减,通过连续的数据监控,可以有效的杜绝此类异常数据。
代谢组学分析中涉及的数据量非常庞大,数据分布有一定的规律,可以借助数学工具进行统计学分析,例如主成分分析、聚类分析、归一化处理等等,下图显示了采用PCA主成分分析不同组别样品的分布情况,可以看出红色标注符号的样品可能存在异常。
结 语
数据监控是代谢组学中非常重要的环节,数据监控没有最全面的方式,需要多种方法结合,根据不同类型样品的特点,综合采用多种方法同时进行。避免多人同时操作的个体差异、尽量使用同一种仪器设备、在上机检测前对仪器状态有较为清晰的认识、在样品中穿插不同类型的质控样品、也可借助数学工具来辅助诊断数据的异常等,都是确保数据质量的关键。
但做好代谢组分析,更为重要的是提高分析人员的专业素质,严格按照规范的操作步骤统一进行。