KEGG,(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)。是一个整合了基因组、化学和系统功能信息的数据库,旨在揭示生命现象的遗传与化学蓝图。它是由人工创建的一个知识库,是基于使用一种可计算的形式捕捉和组织实验得到的知识而形成的系统功能知识库。另外,KEGG具有强大的图形功能,它利用图形来介绍众多的代谢途径以及各途径之间的关系。 通过与世界上其他一些大型生物信息学数据库的连接,KEGG可以为研究者提供更为丰富的生物学信息(LinkDB)。KEGG提供了Java的图形工具来访问基因组图谱,比较基因组图谱和操作表达图谱,以及其他序列比较、图形比较和通路计算的工具。 KEGG是一个综合数据库,它们大致分为系统信息、基因组信息和化学信息三大类。进一步可细分为16个主要的数据库。可以通过不同的颜色编码来区分。 KEGG三类数据库之间的关系: KEGG对象标识符。数据库中包含各样的数据对象,这些数据对象是为了用来对生物系统进行计算机模拟的。因此,各个数据库中的数据记录都被称为KEGG对象。这些 ![]() KEGG PATHWAY Database(代谢通路数据库) KEGG GENES Database(基因数据库) KEGG LIGAND Database(配体数据库) KEGG PATHWAY数据库是一个手工画的代谢通路的集合,包含以下几方面的分子间相互作用和反应网络:PATHWAY的五种类型:map 对于通路在中,一个表示一个基因、这个基因编码的酶及这个酶参加的kec -Reference pathway (EC):ec通路中的点只表示相关的酶 ):Reaction通路中的点只表示改点参与的某个反应、反应物对及反应类型 对于KpathwayKEGG BRITE是一个层级分类的数据库,包含生物系统各个方面的知识。相对于KEGGPATHWAY仅限于分子间相互作用和反应,KEGGBRITE包含了许多不同的关系类型。例如,可以查询酶和底物之间的关系,也可以查询某种酶的同源基因。 四种的模块: (糖酵解,与三碳化合物相关的核心模块) (寡糖转移酶) (氨酰基-tRNA合酶,原核生物) (肠出血性大肠杆菌致病性特征,志贺毒素) KEGG参考通路图,BRITE功能层次以及KEGG模块都是以一种广泛的方式来表示,都可以用于所有物种。而直系同源与旁系同源: (1).在进化上起源于一个始祖基因并垂直传递的同源基因; (3).功能高度保守乃至于近乎相同,甚至于其在近缘物种可以相互替换; (5).组织特异性与亚细胞分布相似。 系同源paralogy基因是指同一基因组或同系物种的基因组中,由于始祖基因的加倍而的几个同源基因与旁系的共性是同源,都源于各自的始祖基因区别在于:在进化起源上,直系同源是强调在不同基因组中的垂直传递,旁系同源则是在同一基因组中的;在功能上,直系同源要求功能高度相似,而旁系同源在定义上,可能相似,但也可能并不相似尽管结构上具一定程度的相似,甚至于没有功能如基因家族中的假基因。 ko编号表示一个通路,这个通路是不分物种的,相当于所有物种的这一通路的并集。 K编号表示一个基因,是ko通路中的基本单位,某一K编号代表的不是某一具体物种的基因,而是所有物种的某一同源基因的统称。 KEGG GENOME Database:中了中物种eukaryotes, bacteria, 153 ),EST。 1.KEGG GENES是所有已知全基因组序列的基因目录的集合。这些全基因组信息主要参考可得到的公共数据库,尤其是NCBI RefSeq数据库。这些基因从属于SSDB(SequenceSimilarity Database)并通过KOALA工具进行计算和KO编号的分配(基因注释)。 3.KEGG EGENES是一个包含大部分植物的EST数据集的补充基因目录,以上数据都随着GENES被当做一个参考数据集的使用被KAAS自动分配上KO编号。 5.VGENES表示病毒基因目录,还没有全部整合到KEGG系统中。 1.KEGG SSDB(序列相似性数据库)包括全基因组中的所有蛋白编码基因的氨基酸序列相似性的信息,这些信息是从KEGG中的GENES数据库计算得到的。所有可能的成对基因组比较由SSEARCH程序来执行,并且Smith-Waterman相似性分数大于或等于100的基因对会被选入SSDB数据库,数据库中还包括最佳匹配(besthits)以及双向最佳匹配(best-besthits)序列的信息。 <span microsoft="" yahei";="">2.SSDB是一个如此巨大的加权的有向图,这使得该数据库可以被用于查询直系同源和旁系同源基因,还可以在额外考虑染色体上位置正确性的情况下查询保守的基因簇。 转载本文请联系原作者获取授权,同时请注明本文来自庞哲科学网博客。 链接地址:http://blog.sciencenet.cn/blog-3307279-1057291.html |
|