分享

利用NCBI和Pfam数据库查找基因家族保守结构域相关信息

 九色枫林 2019-08-15

相近功能基因的检索方法

在做数据分析的时候很多老师经常需要搜索某一类功能的基因,有两种思路可以实现这一目标。第一种是直接序列比对,认为序列相似即具有相似的功能;第二种是利用这一类基因共有的蛋白保守结构域搜索,如果含有相同的蛋白保守结构域,就认为他们具有相似的功能。

在使用第二种方法的时候往往要用到蛋白保守结构域的隐马尔科夫模型文件,这个文件可以在pfam数据库得到。今天分享如何在pfam数据库下载该文件

获取蛋白保守结构域在pfam的索取号

下图即为pfam数据库的主页,首先需要获取蛋白保守结构域在pfam数据库中的索取号(格式一般为"PF"+阿拉伯数字)。常用的获取方式有两种:第一种是从文献中查找;第二种是从NCBI获取。本文主要展示从NCBI获取蛋白保守结构域在pfam数据库的索取号。

attachments-2018-04-LIZa0l3N5add76cc645bf.png如下图所示,从NCBI查找一个含有所需要的蛋白保守结构域的蛋白:在红框所示选择蛋白、输入名称+物种然后搜索。

attachments-2018-04-SihH9Pab5add76e32db0c.jpg如下图所示会出现很多相关的蛋白信息,选择一条点击进去。

attachments-2018-04-pJaJW0tW5add76ffa5520.jpg
跳转至蛋白信息的主页(下图),点击右上方的Identify Conserve Domain 就会跳转之这个蛋白的保守结构域的主页 。

attachments-2018-04-cruh4Bd55add772d80aed.png

蛋白保守结构域的主页(下图),红色框标注的地方是domain list(就是这个蛋白含有那些蛋白保守结构域) 。点击想要获取pfam数据库的索取号的蛋白保守结构域的条目,例如NB-ARC会跳转到它的主页。
attachments-2018-04-fhPM3UNr5add773727e93.jpg下图就显示了NB-ARC在pfam数据库的登记号,不过是以pfam开头,后面跟数字,想要在pfam数据库使用这个登记号,将pfam改为大写的PF后面数字不变。

attachments-2018-04-ajD3vI005add774af1cca.jpg
下载蛋白保守结构域的hmm文件

进入pfam数据库主页,输入上一步获取的索取号。

attachments-2018-04-D9mLngHA5add7766bdc39.png 点击 Go 进入到蛋白保守结构域的主页,点击右侧的 Curation&model ; 

attachments-2018-04-QjJW64SL5add77777bf75.jpgCuration&model 页面的最下方有 download 按钮, 点击 download 会弹出下载窗口,然后就可以下载了。

attachments-2018-04-oYVewkKO5add7787a6014.jpg
你有没有get到?快去数据库试试吧!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多