我叫骨头,是万事屋的NPC,好吧,我最近已经学会了用KEGG来分析信号通路了,真的是美滋滋啊…… 莫愁:你真的知道KEGG么? 骨头:一般一般吧,基本我已经会用了。 莫愁:是么?那你知道KO是什么嘛? 骨头:嗯,这个我知道,最近很流行这样的: 然后就KO了。 莫愁:呃……不是太极拳好么……首先我们来看看KEGG: KEGG里有很多数据库,包括分层分类数据库,还有基因数据库,信号通路数据库等等,比如我们搜一个TP53,会获得这样的结果: 红框内的是KEGG分层数据库,这里面包括对所有基因的功能注释和信号通路注释这种分析有点类似GO分析,就是按照不同的功能以及信号通路进行分类,然后打上KO(KEGG Ontology)的标签。蓝框中的呢,是KEGG的蛋白质或者酶的一个分类体系,他们吧序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(KEGG Orthologs)标签。 所以在KEGG上这两种KO标记其实是不一样的,本体论分层分类(KEGG Ontology)的用小写“ko”标记。KEGG同源物(KEGG Orthologs),缩写成K。 比如我们打开P53的KEGG gene数据库,可以看到它在信号通路的分层分类编号。 那么问题来了知道KEGG同源物有啥用?用处在这里,比如我们打开KEGG的信号通路图,会发现,有一个同源物按钮: 点进去之后是这样的: 在这个信号通路上的所有基因,都被用KEGG同源物编号进行表示,包括在不同物种中的同源基因,或者同一物种序列相似,并且参与这个信号通路的基因。所有物种的信号通路,都可以通过蛋白序列比对分析。也就是说,只要你有蛋白序列,无论是什么物种,通过比对,都可以猜出这个大概是参与什么具体功能的。 当然这也是有工具的,比如用这个KAAS,就可以对所给出的蛋白序列,进行KO分析,当然,需要填入蛋白序列和你的邮箱号: 然后你就会收到一封结果邮件,我就bia了一个Example序列,就算了有十几分钟: 点开后,你就可以看到这段序列所具有的KO注释了: 李莫愁博士:是不是觉得KEGG变得有点陌生了?好了,今天就先策到这里吧,回复“KAAS”给你两个相似的KEGG注释网站。好了,今天就策到这里吧。 |
|
来自: 海陵岛的鱼 > 《Biotools》