分享

蛋白质组QC流程介绍

 生物_医药_科研 2019-03-24
    如果一件事情分为20个步骤,每个步骤都包含5%的不确定性,而我们没有在每一个步骤都进行有效质控的话,那么最终得到的结果有什么用处就只有天知道了。

     研究者提高自己的操作水平和经验可以把5%的不确定性降低再降低到如1%,而同时有效的QC则可以把这1%再进一步控制的更低。这样我们在发表文章、报告结果的时候也自然是信心满满。

    我们在之前的文章中已经专门介绍了如何寻找污染物:污染物防控专题

    而本文则着重以一次非标记定量实验为例介绍整合实验流程的质控步骤。希望对您的研究有所帮助。

    同样的,当您看到其他实验室做个样品动不动就检测到7000、8000甚至上万的蛋白,而自己实验室却一直在3000、4000徘徊,那么您也可以从QC开始,逐步排查自己的质谱系统到底有哪些可以改进的。

QC的重要性

充分有效的QC步骤可以保证实验结果的

  • 可靠性

  • 可重复性

  • 科学性

    样品制备质控是整个实验的起点,决定了整个实验的成败,其包括:提取质控、酶解质控、富集质控

色谱质谱的稳定、有效、高灵敏保证了样品中的信息得到充分且正确的采集

    通过数据分析不但可以协助前面两步骤质控,同时也需要对结果进行各类质控以确保整个分析流程所使用的数据库、分析参数、过滤参数、生信方法合理有效

实验及QC流程
设计一个最佳的实验结合QC的分析流程

上图为我们推荐的一次实验分析流程

蛋白提取QC

    目前主要的蛋白提取QC还是依赖于SDS-PAGE进行蛋白条带可视化,这块大多数人应该都非常熟悉了解了,我们不在此进行展开了。

主要保证:

组内样品条带均一
无降解
无干扰杂质
条带复杂度符合预期

重复性较好的样品

重复性略差的样品

仪器状态质控准备

    相信经过厂商培训及长期摸索,各个实验室都有自己一套成熟丰富的仪器状态矫正、质控的流程,在此介绍仅介绍我们的相关经验供参考。

我们选择的质控方式主要依赖于iRT标肽和hela标肽进行

iRT进行保留时间矫正

iRT= 通过标肽的保留时间、信号强度和M/z等信息对所有样品进行质控,保证各个样品的出峰整体保留时间、强度、质量偏离度均在理想范围内

Kit= 该标肽试剂盒含不同理化性质11条标肽,分布于色谱系统不同出峰时间,可有效建库整个样品出峰期间的质谱表现

    通过在所有上机样品中加入iRT我们可以对质谱色谱系统进行一个统一的QC和问题排查,iRT标肽试剂盒信息可以在厂商官网了解 www.biognosys.com

Hela可以自行培养制备,也可以在thermo,sigma等公司采购

质控方法

通过在每个样品中加入iRT标肽,每隔一定数量(一般较为稳定的系统建议3-5天)样品间插入hela标肽,我们使用专业质控软件(如QUIC)就能够简单有效的对LCM系统进行质控了。

仪器状态质控(基于iRT肽质控)

先看下相关关键字的的图解,我们需要关注的Resolution,由质谱分辨率决定,Accuracy则有质谱稳定性决定。

  • 高分辨质谱的质量检测分辨率和精度往往能够达到ppm级别(百万分之一)

  • 由于仪器本身固有特性,其在长时间工作后会出现质量精度的偏移

  • 如不及时矫正,则会出现信息遗漏、错报等问题

  • Orbitrap类型仪器应实现10ppm内的分辨率,同时质量精度不能超过±10ppm的偏差。

  • 峰宽由样品中蛋白丰度分布、色谱柱效能等因素决定,较窄且恒定的峰宽能够得到较好的定性定量效果

  • 肽段碎裂信号的好坏决定了定性结果优劣,因此保证较高的碎裂强度及一致性是保证结果的重要因素

  • iRT标肽的出峰均匀说明色谱流出的一致性较高,保证了定量信息的最高覆盖及准确性

  • 色谱半峰宽(FWHM)是衡量色谱效能的重要指标,我们建议大规模蛋白质组定性定量检测中采用25-50cm柱长,FWHM尽可能在0.15~0.25分钟的色谱柱,FWHM过长会大大影响定性定量效果

QC质谱MS1质量精度稳定性

QC质谱MS2质量精度稳定性

iRT峰宽分布

iRT肽段碎裂效果

iRT标肽出峰一致性分布

色谱半峰宽(FWHM)分布

仪器状态质控(基于Hela鉴定的质控)

    以上质控均基于iRT肽段对所有上机样品质控,但是毕竟iRT仅11条肽,而且受到同时上机的样品干扰,单独插入Hela则可以更高的评估质谱表现。

  • Hela标肽经常用于评估质谱表现和稳定性,但对于高性能质谱来说纯粹的蛋白数量评估并不能真实反映其实际表现;

  • HelaMS1强度分布的均一性反映了色谱喷雾、质谱灵敏度的一致性

  • HelaMS2强度分布的均一性反映了碎片离子检测的灵敏度一致性

  • HelaScan数量分布的均一性反映了色谱梯度、进样稳定性

  • PSMCharge分布一致性反映了ESI电离、系统中PEG等污染物干扰的情况

    Hela MS1强度分布

Hela MS2强度分布

Hela MS Scan数分布

PSM的电荷数分布

LCMS分离效果质控

    除了保证FWHM在高效范围,我们也需要考察当前设置的色谱梯度、样品杂质等情况。在此我们可以利用各种LCMS可视化工具进行查看,此处我们采用PEAKS Studio进行质控:

    原始数据导入Peaks后即可看到LC-MS 两维展开图,X轴为m/z,Y轴为retention time,图中每个黑点线条代表一个肽段母离子

我们判断该LCMS图是否合格的方式简单介绍如下:

  • 预检色谱分离时间为20-80min(以90min为例),强度未出现明显的暴增暴减现象(说明色谱梯度控制理想)

  • 存在少量高强度的肽段谱峰,但不是很多,符合该样品蛋白组成特性(根据样品实际情况判断)

  • 没有观察到杂质污染、PEG污染(条纹状斜线分布)

  • 无喷雾中断,喷雾不连续(明显白色横条纹)

  • .肽段的m/z vs rt分布符合正常样品预期(密度分布从左下较为均匀的向右上展开) 

结果质控(定性)

    定性、定量实验归根到底是最后得到足够多的、可靠的结果。我们通过多个软件分析(pFind、Peaks、Spectronaut等,对应于定性、非标、DIA实验等)来综合评判该实验是否成功。

    定性质控(pFind结合Peaks分析)

  • 基于Target-Decoy策略的得分分布图分析,如下图:蓝色Target结果分布密集,相关性高,ppm(质量精度偏离)理想,绝大多数不超过3ppm;

  • De Novo结合搜库结果分析

    如下图,单个样品预实验检测47712张质谱图,1%FDR质控标准下鉴定成功26662张,鉴定率超过50%,对应定性蛋白数量为3790个,Group2292个,符合预期,正式实验结果可以预期蛋白Group能够超过5000个。De Novo only spectra(即高质量且无法匹配到目标物种的谱图数1127张,占比不超过10%,说明绝大多数高质量谱图都成功与目标物种匹配。样品不存在高含量的污染蛋白。如果De Novo Only结果占比较高,则说明数据库使用不当或者存在高含量的非预期修饰。

  • 以pFind定性报告为例,我们可以进行:

    • 酶切特异性分析(绝大多数肽段应为特异性酶切)

    • 修饰比例评估(不同类型修饰富集的效果不同,但同一次实验的结果互相
      之间应该相似)

    • 肽段长度评估(评估酶切效率,KR修饰的结果会出现高频数的长肽段)

    漏切比例评估(KR修饰的样品漏切率较高,常规样品0漏切比例应占绝大部
    分)

    结果质控(非标定量)

        非标记定量实验的质控主要考察样品间一致性,包括:

    平行实验总体保留时间差异(虽然软件会进行矫正,但最好小于1分钟)

    平行实验总体质量偏差差异(虽然软件会进行矫正,但最好小于10ppm)

    平行实验样品定量相关系数,组内应该保证0.9甚至0.99以上,组间最好不要小于0.5

    • TIC谱峰对齐效果(组内尽可能相似)


    归一化(分别为归一化前后,虽然归一化可以消除强度差异,但尽可能不要差异太大,建议不超过50%强度)

CV组内变异系数取决于样品类型、技术还是生物学重复

更多有关质谱实验相关的知识和课程,我们会在今后陆续撰写推出,如您发现有写的不够严谨或者错误,欢迎向我们提出。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多