由于做蛋白定性的客户经常在拿到检测结果后,需要对表格进行信息解读。因此,本文对定性相关的蛋白检测结果做个基本的说明。 一般此项目样品类型包括蛋白溶液、胶条、泳道、Co-IP样品等,下机数据经过合适的数据库搜库,会得到一些检测结果表格。搜库结果表格通常有三种:Proteins、Peptide、PSMs,分别对应鉴定到蛋白的表格、匹配到肽段的表格、匹配到二级图谱的表格。 proteins表格对应含义 不同的搜库软件得到的proteins表格略有不同,基本信息如下: Accession:数据库中蛋白对应的ID号,是不同蛋白特征性的编号; Description:蛋白名称的详细描述; Coverage:鉴定到的肽段在蛋白上的覆盖度; # Peptides:鉴定到不同肽段的总数目,即有多少肽段匹配到此蛋白上; # PSMs:肽段匹配到二级谱图的数目; # Unique Peptides:此蛋白包含的特异性肽段数目; # Protein Groups:该蛋白出现在几个group里,一般为1; # AAs:该蛋白包含的氨基酸数目; MW [kDa]:理论分子量; calc. pI:理论等电点; Score Sequest HT:对蛋白匹配度的打分,分数越高可信度越高; -10lgP:蛋白可信度得分,值越大表表明该蛋白包含的可信肽段越多; PTM:修饰类型; Avg. Mass:平均分子量; 说明: 关于Accession号: 不同的软件对不同数据库搜库结果中显示的Accession号形式可能会不同,下面以uniprot数据为例。 搜库软件PEAKS Studio 8.5得到的Accession号一般是J9TAY5|J9TAY5_IPOB或者sp|P10965|SPORB_IPOBA格式。则可以用“|”前面的编号J9TAY5或者“sp|” 和“|”之前的P10965在uniprot网站http://www./uniprot搜取此蛋白编号对应具体蛋白、基因、氨基酸序列等信息。 搜库软件ProteomeDiscoverer 2.1得到的Accession号如P10809。则客户直接用P10809在对应数据库网站搜索对应蛋白详细信息,如图: 关于Description: 例如,对P10809蛋白编号的Description如下: 60 kDa heat shock protein, mitochondrial OS=Homo sapiens GN=HSPD1 PE=1 SV=2 60 kDa heat shock protein, mitochondrial :蛋白名称 OS=Homo sapiens:物种的拉丁文名称 GN:表示gene name,基因的名称 PE:ProteinExistence,即蛋白的可靠性,分5个等级,数据越小代表可靠性越高。 SV:SequenceVersion,蛋白序列版本; 可参考上图显示。 关于Coverage: 表示该蛋白鉴定肽段的氨基酸个数占该蛋白序列氨基酸总数的比例。一般越高可以表示蛋白可信度越高。 关于# Unique Peptides: 表示蛋白中含有的特异肽段数(或唯一肽段数)。文章一般要求2个及以上;是蛋白的特征肽段,可以用此肽段的二级图谱作为鉴定到某蛋白的标志。有些搜库软件得到的protein-petide表格中会注明哪些是唯一肽段,或者可以参考在protein groups 中数目为1的肽段。 关于Protein Groups: 当某些肽段匹配到多个蛋白时,软件会根据蛋白中是否存在唯一肽段、匹配肽段的多少等权重进行打分,得到一个protein group蛋白,其余的蛋白会被group掉。因此经常看到鉴定到的蛋白数为上千个,protein group数目只有几百个,这几百个即实际鉴定到的蛋白。 最后,如果想确定蛋白可信度,可根据蛋白匹配到的肽段数目、唯一肽段数目、肽段对应的PSM数目、及覆盖度和蛋白的打分值等来综合考虑。肽段和PSM数目越多越好,覆盖度越高越好,Score Sequest HT/-10lgP值越大越好(值要看相对大小,没有最高最低之说)。当然这些都基于数据库合适的情况下。 Peptide表格对应含义 Peptide/Sequence:肽段序列; Modifications:修饰类型; # Protein Groups:肽段归属的protein group数; Master Protein Accessions:该肽段归属的主要蛋白名称; # Proteins:该protein group内蛋白数; -10lgP:该肽段对应谱图鉴定的可信度,值越大表明匹配结果越好; Mass:此肽段单同位素质量; Length:此肽段氨基酸数目; Ppm:此肽段质量与理论值偏差; m/z:该肽段质荷比; RT:保留时间,以min为单位; Area Sample 1:肽段在实验结果中所有谱峰的峰面积加和; #Spec/# PSMs:该肽段匹配谱图数; PTM:肽段修饰类型; Percolator q-Value Sequest HT:该肽段q值,越小越好; # Missed Cleavages:漏切位点(一般≤2),过大会导致错误匹配; 说明:可以根据此表,查找感兴趣的蛋白对应的肽段序列、唯一肽段序列。有些文章中,会添加目标蛋白对应肽段的一级或二级谱图,一般质谱图上也会出现保留时间和质荷比信息。 PSMs表格对应含义 Annotated Sequence:二级谱图匹配到的肽段序列; Modifications:修饰类型; # Protein Groups:归属的protein group数; # Proteins:该protein group内蛋白数; Master Protein Accessions:该肽段归属的主要蛋白名称; Protein Accessions:该肽段归属的所有蛋白的名称; Charge:该肽段序列带电荷数; m/z [Da]:该肽段的质荷比; RT [min]:该肽段对应的保留时间; XCorr:PSM 可信度的打分,仪器设备有一个可信度标准,带不同电荷得分标准不同,此得分高低会直接体现在肽段和蛋白的可信度上。 说明:此表格主要是二级谱图PSM对应肽段的信息,由于个别的搜库软件Peptide表格信息较少,因此可参考此表格的结果说明。另外,在Annotated Sequence此列搜取肽段序列,可以得到某个肽段序列对应的全部PSM信息。 小编提示 一般来说,想了解鉴定到蛋白的信息,只参考proteins表格即可。想了解关注的肽段的信息,需要参考peptide表格。而PSMs表格一般用不到,可看做是peptide表格的补充。 以上信息,是做蛋白定性项目的客户经常咨询的问题。仅希望此文能满足检测表格的解读需求。 蛋白与代谢事业部 文案|陈东莉 |
|
来自: 昵称64122435 > 《待分类》