分享

预测蛋白质亚细胞定位的方法

 微笑如酒 2019-04-05

(基于推荐系统的蛋白质多位置预测)是一种预测蛋白质多个位置的方法。 PMLPR基于称为NBI的众所周知的推荐方法和STRING蛋白质 - 蛋白质相互作用数据库预测每种蛋白质的位置。对于每种蛋白质,PMLPR提出可靠性分数(最佳分数等于1)。

蛋白质亚细胞定位问题的重要性是由于蛋白质在不同细胞部分中的功能场所。此外,亚细胞位置的预测有助于识别药物的潜在分子靶标,并且在基因组注释中具有重要作用。大多数现有的预测方法仅为每种蛋白质分配一个位置。但是,由于一些蛋白质在不同的亚细胞位置之间移动,它们可以具有多个位置。我们引入了一种方法PMLPR来预测蛋白质的位置。 PMLPR基于推荐系统预测每种蛋白质的位置列表,并且它可以正确地克服多位置预测问题。我们将算法应用于8种蛋白质,这些蛋白质在癌症研究中很重要。与其他方法的比较结果表明了PMLPR的效率。

下载

http://facultymembers./eslahchi/en/portfolio-items/subcellular-protein-localization/

iLocator法
基于于图像的多标记人蛋白亚细胞定位预测器
在蛋白质的正确时间处于正确的位置对于正常细胞功能是至关重要的。蛋白质错误定位是癌症生物标志物的典型特征之一。为了揭示这些与癌症相关的错误定位,我们开发了一种基于图像的多标记亚细胞位置预测器,称为iLocator,其涵盖7种细胞定位,即细胞质,内质网,高尔基体,溶酶体,线粒体,细胞核和囊泡。

Fig. 1. The flow chart of creating iLocator and screening biomarkers.

Software 

The interface of the iLocator software is shown in Figure 2. The software can work at two modes. Mode1 can output the prediction of images in the given path, and Mode2 can output the predictions of images in normal and cancer paths and compare these two conditions.
If you have installed Matlab 2011a under Windows operating system, please click 32bit or 64bit to download the software.

Fig. 2. The interface of iLocator.

Code and dataset 

The data and code are contained in the following compressed files:
Click here to download the image dataset (5.21Gb), and click here to download the source code for academic use only (313Kb). The code package has been tested using Matlab 2011a under Windows 7 in a 64bit architecture.

BUSCA法:

   这是一种新颖的网络服务器,集成了不同的计算工具(http://busca.biocomp.)用于预测蛋白质亚细胞定位。 BUSCA结合鉴定信号和转运肽(DeepSig和TPpred3),GPI-锚(PredGPI)和跨膜结构域(ENSEMBLE3.0和BetAware)的方法,以及区分球状和膜蛋白(BaCelLo,MemLoci和SChloro)亚细胞定位的工具。处理和整合来自不同工具的结果,用于注释真核细胞和细菌蛋白质序列的亚细胞定位。我们将BUSCA与最近的CAFA实验和其他特定数据集得出的蛋白质目标进行比较,报告了最新技术水平。 BUSCA得分优于CAFA2的2732个目标的所有其他评估方法,F1值等于0.49,是预测CAFA3目标的最佳方法之一。我们建议将BUSCA作为蛋白质亚细胞定位注释的综合和准确资源。

The Eukaryotic BUSCA workflow. The different methods are organized in a rooted computation graph. The query sequence is processed by different methods whose outputs determine the path from the root (the query sequence) to one leaf (a predicted subcellular location). Chloroplast-related localizations (and the respective tools), are highlighted in green and are relevant only for plant sequences. Overall, up to sixteen and nine different compartments are predicted for plants and other eukaryotes (i.e. animals and fungi), respectively.

操作流程:

Output

The typical BUSCA output looks like the following:

The user can zoom in by left-clicking and selecting the area of interest:

This allows to see feature annotation at residue-level:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多