分享

癌症基因表达数据库(二)

 teszsz 2017-06-10

这一期小编和大家一起学习一下癌症芯片表达数据相关的数据库。尽管目前转录组深度测序技术被广泛应用,基因芯片技术依靠其低成本和癌症研究的大样本量需求使得芯片数据目前仍在不断的产生。RNA-seq数据产生的方式有所不同,芯片数据产生的平台多样,平台之间的数据往往不能直接比较。这对于芯片数据跨平台的比较和整合分析是不利的。幸运的是,一些很好的芯片数据库和分析平台被开发。


       GEO https://www.ncbi.nlm./geo/)ArrayExpresshttp://www./arrayexpress/)存储了大部分已公开的基因芯片表达原始数据和归一化数据,主要是来源于全世界科学家的科研工作。当然,这也包括大量的癌症研究工作。对于GEO,用户可以利用关键词进行搜索,如Humancancer。图1.1是搜索结果页面。用户可以通过左边栏选项对查询结果进行过滤。图1.2是一个数据集的下载页面。对于ArrayExpres,用户也可以利用关键词进行搜索,如Cancer,图1.3是结果页面。同样用户也可以进行数据过滤和数据下载(图1.4)【1-2】。


图1.1 GEO 查询结果页面



图1.2 GEO 数据集下载页面


图1.3 ArrayExpress查询结果页面


图1.4 ArrayExpress数据集下载页面


       GENThttp://medicalgenome.kribb./GENT/)收集了41000个癌症组织、癌症细胞系、和正常组织的芯片表达数据。并通图形化展示了在组织、细胞系中的表达模式。用户可以基于表达模式,找到一些表达异常的基因。用户可以根据基因名或者Affymetrix ID搜索。图1.5展示了ERBB2在癌症和正常组织中表达情况。此外,用户还可以同时搜索多个基因在多个组织中的表达模式情况【3】。


图1.5 ERBB2基因在癌症和正常组织中的表达


        Oncominehttps://www./resource/login.html是一个癌症芯片数据库和整合型的数据挖掘平台。该数据库收集了715套芯片表达数据集,共包含了86733个样本以及相关的临床数据。用户既可以得到一个基因的差异表达分析,也可以得到某一个研究工作中所有差异表达的基因。差异表达分析可以在癌症与正常组织之间、不同癌症亚型组织之间、基于临床和病理数据分类的样本之间进行。此外,用户还可以进行多基因搜索、依据Gene ontology和临床的注释信息进行过滤。图1.6是Oncomine主界面,图1.7是Oncomine数据呈现界面【4】。


                                    图1.6 Oncomine主界面


图1.7 Oncomine数据呈现页面


       CancerMAhttp://www./)一个芯片数据meta-analysis分析平台。其芯片数据来源于GEOArrayExpress。目前,包含了来自13种癌症的80套数据集。用户上传关心的基因名列表之后,该数据库会基于基因表达信息进行meta-analysis来找到新的候选癌症生物标志物。图1.8是数据最后的提交页面,用户需提供邮箱地址。图1.9CAV1基因在肺癌中meta-analysis分析部分结果【5】。

1.8 CancerMA数据提交页面


图1.9 CAV1基因在肺癌中分析结果


参考文献

 

1.      BarrettT, Edgar R: Gene expression omnibus: microarray data storage, submission,retrieval, and analysis. Methods in enzymology 2006, 411:352-369.

2.      ParkinsonH: ArrayExpress--a public repository for microarray gene expression data at theEBI. Nucleic acids research 2004, 33(Database issue):D553-D55

3.      Seon-YoungK, Gwangsik S, Kang, Sungjin Y, Su-Jin B, Yong-Su J: GENT: Gene ExpressionDatabase of Normal and Tumor Tissues. Cancer Informatics 2011:149.

4.      RhodesDR, Yu J, Shanker K, Deshpande N, Varambally R, Ghosh D, Barrette T, Pandey A,Chinnaiyan AM: ONCOMINE: a cancer microarray database and integrateddata-mining platform. Neoplasia 2004, 6(1):1-6.

5.      FeichtingerJ, McFarlane RJ, Larcombe LD: CancerMA: a web-based tool for automaticmeta-analysis of public cancer microarray data. Database : the journal ofbiological databases and curation 2012, 2012:bas055.




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多