听说看到这个标题你是一脸懵逼的状态!那就让omicsPie的老司机们带你飞吧!点赞关注打赏组学派的小伙伴们早就走上人生巅峰了,你还在等什么?仔细阅读文章哦,文中有彩蛋,看你有没有发现! 在组学研究课题中,如果提起数据库,你会想到什么?小编敢肯定,KEGG数据库(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)必将位列前几位。作为系统生物学的重要工具,KEGG系统地包含了基因组、酶促反应以及生物化学物质等等,为基因组、转录组、蛋白组、代谢组等组学研究的数据挖掘提供了重要的支撑。 虽然KEGG可以在线访问,但对组学研究的童鞋们来说,能够批量访问和使用才是王道。今天,小编给介绍KEGG中为批量访问而提供的一个重要工具,KEGG API接口。通过它,大家就可以方便地将KEGG整合到大家的工作当中。KEGG API是一个连接KEGG各类数据库的应用程序,主要以URL形式进行访问:http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]]<operation> = info | list | find | get | conv | link | ddi 1. 总体的调用形式: URL 形式: http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]] <operation> = info | list | find | get | conv | link | ddi 总共7种操作可以选择,包括info, list, find, get, conv, link, ddi。后面会具体介绍。 Database 名称 KEGG数据库包括了三大类的数据库,包括 KEGG database; KEGG MEDICUS extension database; Outside database (主要用于ID的变换)。 Database entry identifier(标识符) 命名规则: KEGG自身带有17个数据库,除了“genes”, 'enzyme', 'variant'均使用KEGG 标识符<kid>。 <kid>: 数据库前缀 5位数字组成,比如K number (kegg orthology), C number (kegg compound), D number (kegg drug)。例:ADP的kid为C00008 genes: <org>:<gene>, <org>为KEGG organism code或T number genome identifier,<gene>是基因编号,通常来自NCBI GeneID或INSDC Locus_tag。 例如hsa:10458为human的BAP2基因(NCBI-GeneID :1045) enzyme & variant: <database>:<entry>, <database>为database缩写,<entry>是名称或编号。 KEGG database Output: 纯文本格式 操作list, find,conv, link:Tab分隔的文本 操作get:数据库形式(flat file database format) 操作info:文本消息 HTTP状态: 状态代码 200: 成功 状态代码 400: 请求失败 (比如语法错误) 状态代码 404: 未找到 举个简单的离子: 在浏览器中输入http://rest./info/kegg,可以得到整个KEGG数据库的统计信息 累了吧,送你一张实拍美图,休息一下 KEGG API操作 1. Info: 呈现数据库的统计信息 使用方法: 例:http://rest./info/kegg:所有KEGG数据库的数目统计信息 2. List: 获取每个条目的编号和定义 使用规范: 例: http://rest./list/pathway/hsa: 可以得到人类所有的代谢通路 也可以具体到某个或几个基因:http://rest./list/hsa:10458 ece:Z5100 3. Find: 通过关键词检索数据 使用方法: 例: 搜索含有NAD的compound: http://rest./find/compound/NAD 所有分子式为C7H10O5的compound: http://rest./find/compound/C7H10O5/formula 平均分子量为300-310的compound: http://rest./find/compound/300-310/mol_weight 4. Get: 得到数据库中的具体条目 使用方法: 例: 检索编号为C01290的compound: http://rest./get/cpd:C01290 检索人类编号为05130的pathway图:http://rest./get/hsa05130/image 5. Conv: 把KEGG的标识符转化为其他标识符 使用方法: 例: 把将KEGGID 转化为NCBI Protein ID: http://rest./conv/ncbi-proteinid/hsa:10458 ece:Z5100 把编号为C00003的compound转化为pubchem ID: http://rest./conv/pubchem/C00002 6. Link: 在不同数据库之间进行检索,把KEGG的各个数据库连接在一起 使用方法: 例:检索pathway 00010中的compound:http://rest./link/cpd/map00010 检索hsa10458基因参与的pathway: http://rest./link/pathway/hsa:10458 7. DDI: 药物与药物之间的作用 使用方法: 例:检索药物D00564的已知相互作用:http://rest./ddi/D00564 检索药物D00564、D00100、D00109相互之间的作用: http://rest./ddi/D00564 D00100 D00109 ![]() |
|