分享

基于质谱技术的非靶向代谢组学数据处理基础之谱图获取-数据依赖型采集谱图的获取(1)

 Jessiee_ 2018-09-24

作者:omicsPie管理员 尹岩东(对话框输入名字获取联系方式)


在此先对上次留言的同学说声抱歉,由于RAMClust暂时还未能进行深入研究,暂时无法撰文介绍其使用技巧及细节内容,争取尽快出炉吧,软件的基本使用可以先参考RAMClustR的的示例文档(https://github.com/cbroeckl/RAMClustR/blob/master/vignettes/RAMClustR.Rmd)。如果有同学对RAMClustR有比较深入的了解或者使用经验也欢迎投稿。

回归正文,我们知道,在代谢组学数据处理中其中非常重要的一个目标便是代谢物鉴定,在这里面,其中获取采集到的代谢物的二级谱图是基础。而质谱数据采集方式有很多种,各具优势,且数据处理复杂度也各有差异。在实际应用中,我们会根据不同的实验目的,选择不同的数据采集模式。在这些数据采集模式中,数据依赖型采集(DDA)获取的数据由于涵盖了母离子和子离子的对应信息,所以在谱图获取方面也最为简单。下面就为大家介绍几种不同的谱图提取思路和方法。

直接转换法

对于DDA数据,我们可以利用ProteoWizard中的MSConvertGUI工具直接将仪器采集的数据转换为MGF格式,在数据转换的过程中选择peakPicking(用于数据质心化, centroiding)参数,并设置MS Level为‘2 - ’,输出格式选择MGF,开始转换即可,关于MSConvertGUI的具体使用方法,可以参考一片题为“Employing ProteoWizard to Convert Raw Mass Spectrometry Data”的文章,有条件的同学可以观看官方提供的视频教程(需要科学操作)。

转换之后的MGF文件记录了采集到的每一张谱图的母离子,保留时间,碎片离子的m/z和intensity等关键信息,在R/Python等开发语言中按照文本文件进行读取,然后做进一步的处理。 再利用MGF记录格式进行谱图获取的时候需要注意以下几点:

  • 由于在DDA采集过程中,可能会出现同一碎片被多次打碎的情况,所以MGF记录中会出现在相近时间内母离子m/z相同或非常接近,对于这种来自于同一母离子的谱图,大家可以采用几种不同的方式得到一张唯一的谱图作为该母离子打碎后得到的最终谱图:

  1. 对谱图做consensus,将同一m/z的碎片离子合并,并根据每一个碎片离子在其母离子对应的不同谱图中的出现频率确定是否保留该碎片

  2. 选择在打碎时母离子强度最高的谱图,由于DDA无法直接获得,所以可以利用碎片离子的强度信息推断每张谱图采集时其母离子的相对强度,从而达到该目的

  • MGF格式数据无法进行峰面数据并不能之际进行相对定量,因而如果需要定量信息,则需要对MS1进行峰检测,然后根据峰检测结果把转换得到的MS2谱图根据MS1的m/z和RT归属到某一个检测到的峰(feature)。关于如何进行峰检测,请参见之前的系列文章:基于质谱技术的非靶向代谢组学数据处理基础之xcms(链接见文末)。

  • 对于直接转换得到的MGF文件可以按照文本文件使用R或其他编程预言进行读取,从而进一步进行自动化分析处理。

利用xcms3进行二级谱图数据进行处理

关于如何利用xcms3进行二级谱图数据处理,在我们组学拍之前的文章(2018代谢组年会 WORKSHOP精彩内容播报)中曾经提到过,在此再次分享一下链接,大家可以以此为参考做以预习,下一篇文章中再对此做更加详细的介绍吧,以此也算做下篇文章的预告。

参考阅读




如果有问题直接问我们管理员,请直接在对话框中输入管理员名字即可获得管理员的微信号。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多