分享

[重磅]KEGG API, 你会用吗

 徐晓鱼 2018-08-03

听说看到这个标题你是一脸懵逼的状态!那就让omicsPie的老司机们带你飞吧!点赞关注打赏组学派的小伙伴们早就走上人生巅峰了,你还在等什么?仔细阅读文章哦,文中有彩蛋,看你有没有发现!


在组学研究课题中,如果提起数据库,你会想到什么?小编敢肯定,KEGG数据库(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)必将位列前几位。作为系统生物学的重要工具,KEGG系统地包含了基因组、酶促反应以及生物化学物质等等,为基因组、转录组、蛋白组、代谢组等组学研究的数据挖掘提供了重要的支撑。


虽然KEGG可以在线访问,但对组学研究的童鞋们来说,能够批量访问和使用才是王道。今天,小编给介绍KEGG中为批量访问而提供的一个重要工具,KEGG API接口。通过它,大家就可以方便地将KEGG整合到大家的工作当中。KEGG API是一个连接KEGG各类数据库的应用程序,主要以URL形式进行访问:http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]]<operation> = info | list | find | get | conv | link | ddi


1. 总体的调用形式:

URL 形式:

http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]]

<operation> = info | list | find | get | conv | link | ddi

总共7种操作可以选择,包括info, list, find, get, conv, link, ddi。后面会具体介绍。

Database 名称

KEGG数据库包括了三大类的数据库,包括 KEGG database; KEGG MEDICUS extension database; Outside database (主要用于ID的变换)。

Database entry identifier(标识符)

命名规则:

KEGG自身带有17个数据库,除了“genes”, 'enzyme', 'variant'均使用KEGG 标识符<kid>。

<kid>: 数据库前缀 5位数字组成,比如K number (kegg orthology), C number (kegg compound), D number (kegg drug)。例:ADP的kid为C00008

genes: <org>:<gene>, <org>为KEGG organism code或T number genome identifier,<gene>是基因编号,通常来自NCBI GeneID或INSDC Locus_tag。 例如hsa:10458为human的BAP2基因(NCBI-GeneID :1045)

enzyme & variant: <database>:<entry>, <database>为database缩写,<entry>是名称或编号。


KEGG database

Output: 纯文本格式

操作list, find,conv, link:Tab分隔的文本

操作get:数据库形式(flat file database format

操作info:文本消息


HTTP状态:

状态代码 200: 成功

状态代码 400: 请求失败 (比如语法错误)

状态代码 404: 未找到


举个简单的离子:

在浏览器中输入http://rest./info/kegg,可以得到整个KEGG数据库的统计信息




累了吧,送你一张实拍美图,休息一下


KEGG API操作

1. Info: 呈现数据库的统计信息

使用方法:

例:http://rest./info/kegg:所有KEGG数据库的数目统计信息


2. List: 获取每个条目的编号和定义

使用规范:

例: http://rest./list/pathway/hsa: 可以得到人类所有的代谢通路

也可以具体到某个或几个基因:http://rest./list/hsa:10458 ece:Z5100


3. Find: 通过关键词检索数据

使用方法:

例:

搜索含有NAD的compound: http://rest./find/compound/NAD

所有分子式为C7H10O5的compound: http://rest./find/compound/C7H10O5/formula


平均分子量为300-310的compound: http://rest./find/compound/300-310/mol_weight


4. Get: 得到数据库中的具体条目

使用方法:

例: 检索编号为C01290的compound: http://rest./get/cpd:C01290

检索人类编号为05130的pathway图:http://rest./get/hsa05130/image


5. Conv: 把KEGG的标识符转化为其他标识符

使用方法:

例:

把将KEGGID 转化为NCBI Protein ID: http://rest./conv/ncbi-proteinid/hsa:10458 ece:Z5100

把编号为C00003的compound转化为pubchem ID: http://rest./conv/pubchem/C00002

6. Link: 在不同数据库之间进行检索,把KEGG的各个数据库连接在一起

使用方法:

例:检索pathway 00010中的compound:http://rest./link/cpd/map00010


检索hsa10458基因参与的pathway: http://rest./link/pathway/hsa:10458


7. DDI: 药物与药物之间的作用

使用方法:

例:检索药物D00564的已知相互作用:http://rest./ddi/D00564

检索药物D00564、D00100、D00109相互之间的作用: http://rest./ddi/D00564 D00100 D00109




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多