众多生物信息分析资源的出现,给我们提供了便捷、高效的在线数据处理工具,省去了生物信息工具难以安装的过程,让众多科研工作者的数据查询、处理、分析和绘图更加方便。 但具体该如何好好利用这些在线的生物信息资源?这便是我们今天要分享的重点。 来源于百度图片 在线生物信息资源按照其资源类型,大致上可以分为查询类、数据类、分析类和综合类等。 查询类资源大致可以分为核苷酸序列数据库、RNA序列数据库、蛋白质序列数据库、结构数据库、基因组学数据库(非脊椎动物)、代谢和信号通路数据库、人类和其他脊椎动物基因组数据库、人类基因和疾病数据库、微阵列数据和其他基因表达数据库、蛋白质组学资源数据库、其他分子生物学数据库、细胞器数据库、植物数据库、免疫学数据库和细胞生物学数据库等;数据类资源比较集中,数量较少;分析类资源主要包含了序列分析、统计分析、功能分析、预后分析等。而综合类资源主要包含以上两个及两个以上分类的资源。 本文结尾处为大家提供了最全的常用在线生物信息资源,收藏之后,以后再也不需要苦苦寻找各种在线生物信息资源了! 为了更有效的使用在线生物信息资源,下面就按照常规实验思路展示部分使用频率较高的在线资源,为大家介绍各种在线生物信息资源。 数据来源 数据是生物信息分析的基础,没有数据,一切分析都是空谈。如果手头上没有现有的数据,在生物信息领域,是有很多可以用的资源的。其中最重要的数据库有:TCGA、 GEO、 SRA、ENA、ArrayEpress。 TCGA数据库对33种癌症、1万多个肿瘤病例的基因、表观遗传和蛋白质组学变化进行分析,确认约300种导致癌症的基因,并发现已经获批的疗法覆盖了超过半数肿瘤病例的基因突变;而GEO和ArrayExpress数据库存储了大量基因表达数据、蛋白丰度数据、表观检测数据等;SRA和ENA则是用于存储二代测序的原始数据数据库,其中ENA对保存的数据做了注释,界面相对于SRA更友好。总的来讲,TCGA是一个研究癌症的非常全面的数据库,如果研究的目标不是癌症,那么GEO、 SRA、ENA、 ArrayEpress等数据库就是最好的选择。 筛选基因 基因筛选是一项艰辛的工作,从上万个分子中筛选出目标分子需要做大量工作。 现有的筛选工具涵盖了基因组、转录组、蛋白组、代谢组、表现基因组、宏基因组和代谢组等多个组学领域,而这些筛选工具前期工作需要的计算量巨大,消耗资源极多,基本上找不到相关的在线分析资源,能够找到的主要集中在中后期的差异筛选、相关性分析,以及后期的功能筛选、分子网络筛选、疾病相关性分析、药物相关性筛选等等。 图片来源于Genematrix共表达分析工具 TCGA是癌症研究最好的数据库,与TCGA相关的cbioportal、 GEPIA和TCGA portal自然成为了研究癌症的不二选择,它们可以提供基因组、转录组、表观遗传、相关性分析、功能分析和生存分析等多层次结果。 常规的研究就需要从数据类资源中下载研究目标相关的数据,可以使用GeneMatrix分析平台进行差异分析,使用DAVID、GSEA、KEGG富集分析或者GO富集分析等工具进行功能富集,通过功能富集,共表达分析预测相互作用基因,筛选目标基因。 研究代谢物的全套分析工具MetaboAnalyst,研究疾病相关查询数据库有OMIM,研究药物相关数据库有DrugBank,中药分子与基因关系数据库 。 图片来源于MetaboAnalyst 证实功能 基因表达、翻译以及功能的验证是需要真实实验支持的一个关键步骤,大多需要自己亲自动手,在线的资源相对较少。其中proteinatlas提供全部24,000种人类蛋白质的组织和细胞分布信息,并可以免费提供公众查询。 图片来源于Reactome 寻找机制 分子机制是指生物机体结构组成部分的相互关系,从分子机制的角度解释疾病发生、发展等过程,并从中发展出相关的疾病风险预测、预防、诊断和治疗技术。 从生物信息角度来看,机制的寻找有两种方式:第一种是从现有的研究中搜索分子与分子、分子与疾病之间的关系,发现在不同疾病或者组织细胞中相同或者不同的分子机理;第二种是从现有的高通或者低通数据中,通过计算数据之间的关联,并推测可能存在的分子与分子、分子与疾病之间的关系。 图片来源于Reactome 图片来源于Reactome 当下,模式物种中分子机制的研究已经达到了一定高度,在已经有了很多相关的在线生物信息资源,比如:使用最多的KEGG信号通路、美观大方的Reactome , 以及单物种版信号通路数据WikiPathways等等。 除了使用现有的公共数据库可以进行查询外,还可以通过统计学计算的方法预测分子与分子、分子与疾病之间的关系,比如StringDB,它不仅包含现已发现的蛋白互作关系外,还提供了文本挖掘、共表达分析等方法获得分子相互作用。如果自己有现有的数据,也可以通过GeneMatrix 的共表达工具预测分子之间的相互作用关系。 GeneMatrix平台上还可以用很多SCI 级分析、绘图工具,Nature 、Science高端杂志配色一键完成,并可以输出高质量美图。研究中医的你们也是有福利了,中国药科大学开发了第一个专门为研究中药分子机制而设计的在线生物信息学分析工具BATMAN-TCM,直接可以检索中药以及靶向基因,是不是很厉害呢! 图片来源于Genematrix 图片来源于BATMAN-TCM 说了这么多,大家是不是等不及了呢,接下来的在线生物工具清单才是重点,各位看完后,千万别忘了收藏!!! 点击以下名称可直达↓↓↓
|
|