每一个疾病的发生机制是不同的,这也就导致和这个疾病有关的疾病也会发生不同的变化。了解疾病相关的基因,一方面可以在选择研究基因的时候直接选择疾病相关基因,另外如果有了候选基因,可以尝试寻找候选基因和疾病相关基因的相关来进行后续实验设计。之前我们介绍过几个疾病相关基因的工具。 今天就来介绍一个大型的疾病相关基因综合性查询数据库:DisGeNET - a database of gene-disease associations: https://www./home/ 背景数据集介绍DisGeNET 中关于疾病相关基因的主要包括两个概念:疾病和基因的相关性(GDA)以及变异和疾病的相关性(VDA)。基于以上这两个概念。作者基于多个公共数据基因注释平台例如:[[Simple ClinVar -临床相关突变研究]], Uniprot 以及基于文献的文本挖掘,最终一共获得了 628 685 个 GDA,涉及 17 549 个基因和 24 166 种疾病,以及 210 498 个 VDA,包括 117 337 个变异和 10 358 种疾病。 数据库使用在 DisGeNET 点击Search即可进行结果的检索。DisGeNET 支持三种数据类型的检索,其中包括:疾病;基因以及变异。如果想要一次性检索多个基因,需要在两个基因之间输入** :: ** 作为分隔符。例如,我们在基因当中检索TP53 检索完之后,会得到四个不同的结果,其中包括 GDA 的总结和证据以及 VDA 的总结和证据。 其中在总结部分可以看到和 TP53 相关疾病的的一个表格结果。里面包括了这个疾病的分类,相关得分等等信息 同时在疾病相关的证据当中,可以看到在具体的文献当中基因和疾病的具体描述。 总的来说以上就是 DisGeNET 的基本使用方法了。对于高通量数据分成的结果解读而言。除了基本的 GO 和 KEGG 的功能富集分析之外。也是可以分析这些基因和疾病的关系。这样如果我们聚焦一个疾病的话。很容易就可以找到这个疾病有关的基因了。 |
|