分享

代谢数据库之KEGG你所不知道的那些秘籍

 生物_医药_科研 2019-06-07

1 KEGG数据库是啥?

KEGG(Kyoto Encyclopedia of Genes and Genomes)是由日本京都大学和东京大学联合开发的数据库,可以用来查询代谢途径、酶(或编码酶的基因)、产物等,也可以通过BLAST 比对查询未知序列的代谢途径信息。这对做代谢组学的小伙伴来讲是居家旅行必备呀。

KEGG 的网址是https://www./,界面小清新,使用很是方便。

小清新如我

2 如何查询某一特定的代谢途径(pathway)的信息?

来公司做代谢组学检测分析的小伙伴通常会收到差异代谢物代谢通路注释及富集分析结果,如下图代谢通路富集分析气泡图所示,如果想搞清楚某一个代谢通路的具体信息,如Tryptophan metabolism时,我们该怎么做呢?

来搞我呀

步骤非常简单,直接在搜索框中输入pathway的名称查询即可。

查询结果如下:

当找到具体的pathway后可以在图上查看具体的代谢物和酶基因的信息,在此就不赘述了。

要说你这都不会,我能杀了你吗?

3 如何查询某一特定的化合物的信息?

拿到了代谢组学检测分析结果后,面对一堆不熟悉的化合物,学生物、医学的同学表示一脸懵逼呀!

完全不懂你在说什么

我们可以通过KEGG数据库去了解这个化合物的来龙去脉,比如最近热门的物质Phenylacetic acid,你可以直接在KEGG COMPOUND中检索。

也可以在LIGAND页面中检索化合物,LIGAND页面在哪里呢,看下面的说明。

检索的结果会给出结构式,同时匹配结果标红,方便查看,使用更友好。

这个很不错,要学会使用

当然,LIGAND页面还可以查询某个化合物参与的所有生化反应。不懂生化的小伙伴拿走不谢!

4 如何查询某一代谢途径所涉及的所有代谢物和酶?

要清楚的阐述代谢物的生物学机理,不把代谢物上游的酶搞清楚是万万不可行的,那么如何查询某一代谢途径所涉及的所有代谢物和酶呢?

这就要用到KEGG中的一个模块叫LinkDB,它藏的比较深,可以通过以下方式实现。

首先,首页找到LinkDB。

然后选择LinkDB页面,输入想要查询的pathway。

最后获得想要的代谢物和酶的信息。

哇,这神一般的操作

5 如何查询某一疾病相关的pathway和基因?

对于做医学代谢组学的小伙伴而言,搞清楚自己研究的疾病相关的pathway和基因很重要,但对于新手来讲这真的很难。

这怎么办呢?

KEGG数据库中的DISEASE模块可以用起来了。

比如说研究肝细胞癌,直接输入HCC即可查询。

查询结果显示出肝细胞癌相关的pathway和基因。

当然,你可以直接输入代谢组学研究分析出来的感兴趣的pathway,看看有哪些疾病可能和这个pathway相关。

遗憾的是,数据库中目前没有收录疾病和代谢物之间的关系,这个只能依赖于强大的IPA软件了。

6 结语

代谢组学常见的通路注释数据库有很多,如:

1)KEGG: https://www.

KEGG是“京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes)”的英文缩写。是当今数据最完整,使用最广泛的数据库之一,其中包含了来自各种各样的生物(超过4700个)的495个代谢通路,含有17000多种化合物(来自动物,植物和细菌)。这些通路都与代谢产物和蛋白质/酶信息链接。

2)SMPDB: http:///

SMPDB为“小分子通路数据库(The Small Molecule Pathway Database)”的缩写,它含有超过618种发现于人体中的小分子通路,其中70%(超过433条)是该数据库特有的通路。

3) MetaCyc: https:/// 

MetaCyc是一个阐明通过实验手段阐释代谢通路的数据库。MetaCyc的数据来源于科学实验文献,含有初生代谢和次生代谢通路,还包括相关的化合物、酶和基因,比如:与大多数的微生物和植物中发生的通路有关的2,844种不同生物;带有14,051种酶反应和52,446个相关文献引用的2,526种代谢通路;MetaCyc收集了所有的由国际生物化学与分子生物学联合会命名委员会(NC-IUBMB)分配EC编号的所有酶催化反应;MetaCyc并不会为特定有机体系建立完成的代谢模型。

4) Reactome: https://www./ 

Reactome包含的生物学通路经过同行评议,是一个知识数据库,除了包括代谢通路之外还有蛋白质转运与信号通路。Reactome包含了经过实验证实,手动推断和电子推断的反应路径图集合中几种不同的反应类型。Reactome含有超过20种不同有机体的通路数据,但是最基本的有机体为智人。数据库有9,600多个蛋白通路图和数据,9,800种反应和2,000个人体通路。

5)Wikipathways: https://www./index.php/WikiPathways 

Wikipathways是一个开放式协同平台,用于数据可视化和分析所用的生物学通路模型的收集和传播。它是一个类似维基百科一样的数据库,用户可以自行编辑更新当中的数据,网站的布局也与维基百科非常类似,使用起来也很容易入手,网站会统计每月新增的代谢通路。数据库配备了超过20个物种的通路,其中七种物种的通路多达100多条,人类通路集包含了800多个通路,涵盖了7500种基因,除此之外,Wikipathways还有超过1000代谢产物的通路。Wikipathways由美国格莱斯顿研究所(Gladstone Institutes)维护与科研数据支持。

6) The Medical Biochemistry Page: http:/// 

The Medical Biochemistry Page主要提供人体通路数据信息,虽然网站页面简单,但是在人体通路方面也做到了极致,比如每条通路都有非常详细的人体代谢过程、激素和代谢产物/蛋白质复合物相互作用信息。除此之外,网站还包括疾病状态与代谢先天性错误的临床信息。

当然还有很多其他的数据库,作为科研界冉冉升起的一颗新(行)星,熟练掌握了这些数据库的应用后,妈妈再也不用担心我的学习了。

终于可以睡个安稳觉了!

学无止境!听说阿趣生物暑期开设了专业的代谢组学及数据分析培训班。

(培训班详情请点击图片)

不仅可以学习代通路图的绘制,还可以学习下机数据处理和差异代谢物筛选、多组学关联分析等多种技能。我得赶快去报名啦!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多