一. 美国国立卫生研究院NIH
1. 概况 NIH作为美国唯一的国家级公立医学科研机构,不仅本身作为一个庞大而先进的研究机构代表美国医学科研最高水平,更负有规划全美医学研究课题的任务,每年向全美各地包括医学院校、医院批核美国联邦政府医学研究经费。在资源共享方面,在“信息自由法案”的框架下,NIH发布了“数据共享原则和实施指南”,另外,2000年开始,为了促进整个医疗卫生领域的资源共享和系统化发展,发起了国家卫生信息基础工程(National Health Information Infrastructure,NHII)。 NIH的观点是,所有的科技成果和数据都应该考虑共享。在保证参与人的私密、机密性和数据准确的情况下,数据应该尽可能广泛和自由地共享。 2. NIH人类遗传多样性的研究 哺乳动物基因收集项目(Mammalian Gene Collection,MGC)是主要由NIH的多个研究所参与的研究项目,提供人和小鼠克隆的全长的开放阅读框(FL-ORF),所有的序列都收录在著名的基因数据库GenBank。目前已经克隆得到了11542(人)和8855(小鼠)的基因序列。其cDNA通过授权的公司可以购买。 MGC已收集的资源:
MGC克隆在IMAG集团分销网络可不受限制。订购时,须拥有IMAGE ID和可用的GenBank编码。
GenBank序列数据库
GenBank是美国国立卫生研究院(NIH)维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个纪录代表了一个单独的、连续的、带有注释的DNA或RNA片段。目前GenBank中所有的纪录均来自于最初作者向DNA数据库的直接提交。 蛋白质数据库: 60年代初,Dayhoff和他的同事们收集了所有当时已知的氨基酸序列,这就是《蛋白质序列与结构图册》。这一蛋白质数据库后来成为蛋白质信息资源PIR。 核苷酸数据库: 1982年在欧洲分子生物学实验室(EMBL)诞生,随即就开始了一个数据库爆炸的时代。后来NIH搞了GenBank。日本的DNA数据库(DDBJ)加入了数据收集的合作。国际DNA序列数据库合作计划。规定了数据记录和更新的规则。 国际核苷酸序列数据库合作成员GenBank--DDBJ--EMBL。GenBank指的是DDBJ/EMBL/GenBank 开发利用这些信息的工具(如NCBI的信息检索系统 Entrez http://www.ncbi.nlm./Entrez/) 编码序列(CDS):
大多数蛋白质序列都不是直接由实验确定的,而是通过DNA序列得到的。这种方法需要进行大量的实验、计算以及相似性比对工作。他也赋予一个产物名称,或者功能说明(通过主观的对相似性比对的分析)。 |
|
来自: 千里 > 《科技资源共享模式研究》