National Cancer Institute (NCI)pathway interaction database是一个经过校对的权威通路互作数据库。数据库中收录了322个来自BioCarta和Reactome的通路数据。
并对其进行校对,到2012年9月,已经完成了136个通路的校对过程。除了通路以外,数据库还收录了丰富的通路相关基因信息,便于我们查询基因和通路之间的相关性。
NCI主页地址http://pid.nci./search/#content

在NCI主页上,我们可以看到左侧工具栏,有根据分类浏览通路,根据字母排序浏览通路,高级检索,连接分子搜索,批量查询,下载数据等。中间为数据库统计信息。
到目前为止,数据库收录了来自BioCarta和Reactome的322个通路,其中136个已经完成校对,包括9248个互作关系。下方是搜索界面,我们可以通过分子ID,生物学过程ID进行查询。

例如我们根据通路分类进行浏览,这里NCI讲通路划分为两个大类,即调控通路和信号传导通路,每个大类下又可细分为不同的小类,因此我们可以非常直观的观察出通路之间的从属关系。
在检索过程中,通过help我们可以看到检索模式非常丰富,我们可以通过不同平台的基因命名原则进行查询。
如Entrez id, molecule id, uniprot accession numbers, symbol等等。右侧有三种检索类型,包括高级搜索,连接分子搜索,批量查询。

我们以EGFR为例,可以查询到上述结果页面,第一列为匹配的基因,第二列为通路,第三列为校对信息。可以看到查询到的基因相关通路信息已经全部的到NCI校对。
对于每一个校对通路结果,我们都可以查询到通路的数据来源,以及校对信息,更新日期,数据类型分类等。同时可以提供不同格式的在线view graphic展示,并且提供两种格式的下载,分别是XML code和BioPAX。
在批量检索过程中,我们可以通过上传具有批量基因列表的文件,然后选择展示的结果,如通路或网络图等。
数据源可以选择NCI校对数据,BioCarta导入的数据, 或Reactome导入数据,需注意,下面两个数据源是未经过校对的。
对于分析结果的输出格式,这里提供了四种选项,分别是JPG,SVG,XML,BioPAX。点击GO即可进行分析。

在批量查询界面,用户可以输入一组由逗号分隔的基因列表。基因的名称可以是多样化的,例如uniprot id, HUGO, gene symbol, entez id, CAS number, compound name等等。
DATA source数据员提供了三种选择,即NCI nature校对数据,或来自BioCarta和Reactome的原始数据。下面是可选的输出格式,包括文件和文本格式。
最后,NCI数据库提供了丰富的数据下载接口,这里可以下载到的数据包括来自BioCarta和Reactome的原始数据,包括level2和level3的。
同时也可以下载经过校对的NCI curated数据。最后用户也可以下载通路ontology注释信息。
|