分享

POCASA在线预测蛋白活性口袋

 翌然生物 2023-04-24 发布于广东

POCASA (Predicting Of Catalytic Active Site Architecture) 是一种基于序列和结构信息进行蛋白质活性位点预测的软件。它可以预测蛋白质分子中的活性位点,以及识别这些活性位点中的催化残基。


POCASA主要使用了模板比对、位置特异性矩阵、序列和结构特征等方法来进行预测。详细流程包含以下三步:

(1)POCASA通过模板比对方法寻找已知蛋白质中的结构域与待预测蛋白质中的结构域的相似性,从而推断出待预测蛋白质的可能功能和催化机制。

(2)POCASA通过构建位置特异性矩阵来识别活性位点中的催化残基。

(3)POCASA利用序列和结构特征来评估催化残基的重要性,并对催化残基进行分类。

预测过程可以指定的参数有:

1. Grid Size(晶格的大小): 这个参数决定了三维的晶格的大小。推荐使用的值为1埃。

2.Probe radius(探针半径) : 这个输入的参数值应该是一个非负的整数值,经验的取值范围为1-4埃。在大多数情况下建议使用探针的大小为2埃。当然,你也可以任意的更改探针的大小,原则上配体分子比较大的话可以用大的探针,配体分子比较小的话用小的探针。

3. Single Point Flag (SPF)  单独点的参数:SPF用于移除搜索结果中的噪声,这个参数的值是一个非负值,取值范围为0-28埃。当晶格的取值大小为1埃或者0.5埃时,建议的取值大小为16或者9埃。

4. Protein Depth Flag(PDF) 蛋白深度的参数:PDF用于回复那些被SPF去除的点中的有用的口袋中的点,输入的值的取值范围为0-28埃.对于晶格大小为1埃或者0.5埃的取值时,PDF的建议的取值分别为18和10埃。

5. Top-N:通常情况下,对于一个给定的目标蛋白会发现多于1个的口袋,这个参数定义了输出的前N个的口袋和孔洞,大多数情况下建议使用的参数值是N=5.并且,如果指定了vale的值为0,所有的口袋和孔洞将会被输出。

6. Chain ID:默认的参数值为NULL, 将使用PDB文件中的的第一条链,Chain ID用户可以自己指定"A","a,b","1,2" 或者“ABC”(输入时不用加引号)

程序输出结果:

1. XXXX_simple.pdb

这个文件包含了部分的输入文件用于POCASA来检测口袋和活性中心,如果结果并不是你想要的,你可以检查这个文件来确保是不是使用了正确的部分。

2. XXXX_Parameters.txt

这个文件存储了用户的输入参数,从POCASA中获得的口袋和活性中心的信息也存在这个文件中,包括体积,VD值和平均的VD值,预测的所有的口袋的排名也存在于这个文件中。

3. XXXX_TopN_pockets.pdb

这个文件保存了前N个口袋的原子坐标。原子坐标的格式与标准的PDB文件相同。口袋的数量应用残基的数量来表示,口袋中的每一个点用一个氢原子来代表。

4. XXXX_PocketCenters.pdb

这个文件指定了前N个口袋中的几何中心。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多