分享

包教包会,表观必备技能之Genecards查看基因信息

 昵称70100404 2020-09-24

很多老师会有这样的疑问,高通量测序后得到的结果太多,哪个基因是关键的?比如做完ATAC-Seq后,染色质开放性发生变化的基因很多;做完ChIP-Seq后,组蛋白修饰/转录因子影响的基因很多;做完MeRIP-Seq后,m6A修饰有差异的基因也很多。虽然可以通过一些方式缩小范围,比如调整分析参数,或者RNA-seq进行联合分析,但还是可能会得到很长的基因列表,究竟哪个基因值得进一步研究呢?这时候可以从基因的信息着手,通过基因的定位、功能、参与的通路等信息判断是否关键基因。今天给大家介绍可以查看基因信息的数据库-Genecards。

Genecards(https://www./)是一个人类基因的综合型数据库,汇总了网络上约150个相关的基因数据库资源(包括基因组,转录组学,蛋白质组学,遗传学,临床和功能信息等)。该数据库可提供人类目前已注释的、可预测的所有基因的详细信息(如基因与表型间的联系、基因互作、信号通路、基因的临床意义等),是我们开展人类基因研究的重要工具。下面以TP53基因为例讲讲具体的使用方法。
01
搜索感兴趣的基因
数据库的使用很简单,就是输入我们想要检索的基因即可。Genecards 有三种检索模式:1)直接基因检索模式;2)信息类型检索模式;3)高级检索模式。

02
搜索结果的呈现
检索完之后,我们就可以看这个基因相关的信息了。Genecards 在搜索结果的最上端给出了基因相关各部分信息的section。由于信息较多可通过 Jump to section 功能直接进入到自己感兴趣的部分。GeneCards中每个基因总共有18个section。

03
基因名称的信息
对于一个基因会有很多名字,我们查的可能是基因的曾用名,所以GeneCards中就有一项是Aliases(基因别名)。该网站收录了很多其它网站(HGNC NCBIuniprot…)的基因名而且你还可以点击对应名称到相应网站图红色方框

04
主要部分section内容的简单介绍
(1)Summaries

在Summaries 这个模块中,Genecards汇总了多个数据库(如 NCBI 、CIViC, UniProtKB等),对我们要查看基因功能的总结描述,可以让我们更方便更快速的了解这个基因,点击箭头可进入对应的数据库进行查看。

(2)Genomics

在基因组这个模块中,我们可以看到目标基因在基因组当中的位置及长度。

另外,由于基因组对于基因表达的调控,主要是通过转录调控来实现的,所以数据库总结了很多转录调控的信息。我们在这里可以查询到这个基因可能受到哪些转录因子的调控,包括转录因子结合位点、启动子和增强子等调控元件的信息,基因序列结构,基因定位图等一系列信息。

(3)Proteins
对于基因蛋白,同样的也是汇总了蛋白的基本信息,三维结构,可变剪切异构体等信息。另外关于蛋白的调控,也存在翻译后调控,所以 GeneCards 利用 UniprotKB,neXtProt 和 GlyConnect 三个数据库注释了相关的翻译后调控信息,另外还通过PhosphoSitePlus注释了其磷酸化位点。

对于蛋白相关的功能研究,我们会用到相关的抗体,所以这里也总结了各个公司抗体的型号,点击抗体的信息,可直接链接到抗体公司官网关于该抗体的详细信息。

(4)Localization

一个基因的功能经常是由他们的定位决定的,基因在细胞核和细胞质行使的功能是不一样的。在Location中,我们可以观察基因的定位。如图为TP53的基因定位。

(5)Expression

在Expression模块中可以观察基因在不同组织中的表达情况。图为TP53在各个组织当中的表达情况。

另外genecards旗下另一个数据库LifeMap Discovery还会提供mRNA在胚胎组织和干细胞中的表达情况,这些都是可以一键直连的。

(6)Transcripts

这部分主要是介绍基因相关的mRNA和cDNA的相关信息。除了传统的RNA,这里还提供流式细胞术产品信息,基因编辑产品信息,克隆产品等等。

(7)Function

这个模块中,该网站收录了基因的很多功能信息,如基因GO分析的功能、基因的临床疾病表型信息、动物模型,miRNA产物信息、InhibRNA产物信息等。图为TP53的功能介绍和Go分析。

(8)Pathways

这部分主要是介绍基因相关的信号通路及分子相互作用信息,大家常用的通路数据库,如KEGG、Sino、GeneTex、GeneGo都整理在这了。如图为P53涉及的信号通路。其中:R的为Reactome的通路信息,G为KEGG的信息。

 

(9)Disorders

在Disorders这个模块下,汇总了这个基因和哪些疾病是有关系的,这里的数据主要来自于malacards。

(10)Drugs

药物在体内发挥作用也是需要通过基因的变化来产生的,所以我们可以通过这个模块了解有哪些药物影响这个基因的表达。数据库总结了DrugBank,ClinicalTrials,ApexBio,DGIdb和Novoseek五个数据库的结果,我们可以很容易的看到这个基因和哪些药物有关系以及可能的激活机制。

包教包会系列链接

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多