分享

这大概是我最想推荐的蛋白结构预测网站了:Phyre2

 新鲜Q酱 2020-09-23

在过去的几十年里,人们开发了许多用于蛋白质结构预测的计算工具,其中 Phyre2 因其强大的分析能力与简单的操作被生物科研人员广泛使用,据统计每天都有约 1000 个任务提交到 Phyre2 服务器上。

Phyre2 分析能力强大,结果界面丰富直观,可以预测和分析蛋白质的结构、功能和突变

相比之前的版本 Phyre v 1.0,Phyre2 使用更先进的远程同源检测方法来构建蛋白质三维模型,预测配体结合位点,并分析氨基酸突变(如 SNPs)对目标蛋白序列的影响。

接下来让我们一起来感受下。

登录 Phyre2 主页,复制并粘贴目标氨基酸序列到框中。填写提醒邮箱。选择 Normal(普通)或 Intensive(强化)模式。提交任务后页面会显示任务进度和预测所需时间。

提交 Phyre2 任务

结果页面分为几个主要部分:

总结

序列分析

二级结构预测

结构域分析

模板的详细信息

在某些情况下结合位点预测和跨膜螺旋的预测。

1. 序列分析

序列分析

2. 二级结构(α-helix, β-strand 或 coil)的预测

模块的第一行显示了序列的位置。残基基于氨基酸性质进行着色:极性的氨基酸 A,S,T,G,P 为黄色,疏水性的氨基酸 M,I,L,V 为绿色,荷电性的氨基酸 K,R,E,N,D,H,Q 为红色,芳香性的氨基酸 W,Y,F,C 为紫色。

置信度线评估区域预测的可信度,红色表示高置信度,蓝色为低置信度。只有在序列数据库中检测到大量不同的序列同源序列时才能达到 78 - 80% 的准确度。一般不考虑置信度

二级结构类型的预测

3. 结构域分析

通过 Phyre2 与已知结构序列的匹配,上传序列和已知序列结构之间对齐,框的宽度表示比对上的长度,用颜色显示对同源性的置信度(红色表示高置信度,蓝色为低置信度)。

将鼠标悬停在它们上面,会弹出模型的图片和详细信息。单击此链接可转到详细结果表中对应的条目。能够看到上传序列是否有一些区域是无法建模,或者是否有多个模板覆盖上传序列的不同区域,指示上传序列可能的蛋白质结构域。

结构域分析

4. 详细模板信息表

显示使用的 PDB 模板及其代码,从 PDB 文件中提取关于蛋白质模板的信息、对模型的置信度和上传序列的覆盖率、3D 模型、置信度、百分比序列标识和文本描述。

如果对匹配的模型特别感兴趣,可以通过单击「Phyre Investigator」在弹出的页面中点击 submit 按钮提交。

模板信息

5. 使用 Phyre Investigator 深入分析

Phyre Investigator 界面由几个部分组成,点击「Analysis」部分中的「Quality」选项卡,可以看到包括 ProQ2(模型质量预测系统)、clashes、rotamers 和 Ramachandran 分析等在内的选项按钮。

点击这些按钮可以比较模型区域的质量。如果建模质量低的残基与您要研究的残基相距很远,或者处于在功能上不太重要的环(loop),则不需要考虑它们。

但是,如果质量低的残基位于功能位点附近,则应谨慎考虑,并研究其他可能避免这些问题的替代模型或方法。

单击 Analyses(分析)部分的 Function(函数)选项卡,可以显示保守区域、接触界面、口袋和突变敏感区等选项。保守区域可以为查找功能残基提供线索。如果高度保守的残基恰好存在于口袋中,这就能确切说明其功能是十分重要的。

使用 Phyre Investigator 查看模型质量

使用 Phyre Investigator 查看蛋白功能

随着光标在序列视图中移动,模型上的红色指示点以及右侧的序列谱(Sequence Profile)和突变倾向图(Mutations)也会随之移动或改变。

如果某些残基被预测为质量较低,但又可能具有重要的功能,可以在序列视图中悬停它,查看它们的突变情况和突变图示。

进而可以探究一下突变是否对某些类型的氨基酸有强烈的偏好,某些突变敏感度高的残基可能具有显著表型效应,而这些信息可以指导进一步的突变实验,帮助解释单核苷酸多态性(SNPs)的作用。

Phyre2 具有预测点突变表型效应的功能,但不能准确地确定点突变在超出侧链估计位置之外结构上的影响。

序列视图的使用

6. 模型叠加分析(Superposition)

在选择一个主模型之后,还可以勾选多个从模型来进行叠加。点击主表的底部 Generate superposition of selected models(生成所选模型的叠加)的按钮。

叠加使用 MaxSub 算法 m33 执行。该算法能够找出在 4.5A 范围内叠加的两个结构之间原子的最大子集。一般情况下,会选择得分最高的模型作为主模型,或者根据之前的一些生物学知识背景来判断值得研究的模型。

生成所选模型的叠加

点击表格下方的 Generate superposition of selected models(生成所选模型的叠加)的按钮,选中的模板将叠加在主模型上。

进入的页面中有一个 JSMol 窗口,用于交互查看叠加的模型,右侧有相应的一些描述和帮助信息。其中 RMSD(均方根偏差)显示了叠加构象与目标构象所有原子偏差的加和,其值越小,构象差异越小

手动旋转叠加的模型,在三维空间中可以寻找模型的哪些区域是一致的。通常可以观察到一个保守内核(core)具有可变的表面环(surface loop),它可以表明哪里可能存在建模错误或具有结构灵活性。

交互查看叠加的模型

7. 结合位点预测

如果给得分最高的模型预测出的概率 >90%,则模型和序列会自动提交给 3DLigandSite 服务器进行配体结合位点预测。蛋白质通常作用于配体 (如酶底物) 上或受配体调控。3DLigandSite 将类似结构的配体叠加到目标蛋白的结构模型上,并将残基保存映射到蛋白质表面,结合两种方法产生的数据进行预测。

3DLigandSite 的结果分为四个主要部分。第一个提供了使用的 phyre 模型信息。第二部分显示了已识别的配体簇表。后两个部分显示 3DLigandSite 预测。表中列出了所有预测的结合位点残基,详细说明了它们所接触的配体数量、残基与残基保存分数 (JSD) 之间的平均距离。

结合位点预测

Jmol 对建模的蛋白质、配体集群和预测的结合位点进行了可视化。用户还可以对预测残基进行标记,以便研究预测的结合位点。

结合位点可视化

8. 跨膜螺旋的预测

Phyre2 通过支持向量机(一种机器学习工具)处理上传的序列和 PSI-Blast 检测到的同系序列,会确定上传序列是否包含跨膜螺旋,并预测它们在膜中的拓扑结构(平均准确率为 89%)。

如果预测跨膜螺旋,将显示每个跨膜螺旋的开始和结束以及膜的胞外和胞质侧示意图,并用数字表示残留指数。

此外,在结果页面顶部有一个包含基本信息及有效期的框。如果任务即将到期,文本变成红色,这时点击「续领 30 天」链接,可以重置结果的有效期。也可以将结果全部下载保存(点击 Download zip of all results)。

任务信息

Phyre2 主页:

图片来源:作者提供

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多