这两个都是我们国家基因组科学数据中心发表建立的两个数据库。不同的是EWAS Atlas主要是基于甲基化相关的分析查询的,另外的EWAS Data Hub则是专注于下载具体的甲基化芯片的数据结果,所以其实我们主要能用到的还是EWAS Atlas的这个数据库。 关于这个数据库的纳入的信息,我们可以从下图看到,这个数据库纳入了306种疾病,其中的数据主要来自于GEO数据库以及TCGA的数据。至于甲基化芯片的类型,主要还是450K的芯片为主。 同时由于我们知道表观遗传的调控和生活事件是有关系的。所以关于检测样本的有的生活时间数据库也纳入了进来,比如吸烟、年龄等。 关于EWAS Atlas的检索,这个数据库提供了三种检索方式:样本特征(吸烟、疾病等)、基因名或者cg探针。关于cg探针的介绍,可以查看我们之前的帖子。 这里,我们输入AHRR这个基因当作检索基因。 首先我们可以看到关于这个基因在数据库当中的基本信息,其中包括关于这个基因其中的甲基化芯片检测的位置位于什么地方,基因是高甲基化还是低甲基化的,以及相关的临床特征。 由于一个基因会有很多的cg探针。所以我们可以在Probes里面查看具体某一个探针的结果。 进一步的,我们可以看到相关甲基化测序的研究结果以及和这个基因甲基化有关的文章。 除了最基本的检索功能,这个数据库也提供了,多甲基化位点的关联分析。这个部分主要包括两个具体分析的功能:富集和注释、网络可视化。 网络可视化这个部分主要就是通过把之前的检索的结果通过网络分析的过程展现出来。我们可以数据样本特征或者相关的基因都行。例如我们数据: gastric cancer。 在这个网络图当中,绿色的代表我们检索的中心关键词,红色的是基因,黄色的是相关的临床特征。通过这个网络图我们就可以看到在甲基化相关数据中和胃癌有关的信息了。 富集和注释如果我有一些目标的cg探针。我想要了解这么目标cg探针的功能和信息的话,可以使用这个功能。在这个功能当中,我们需要做的就是数据目标cg探针即可。当然如果我们有目标的样本特征,也可以输入。 主要结果的话,我们可以看到以下这个结果信息。所有的结果一般都是通过一个图和一个表来进行展示的。
至此这个数据库的基本功能就介绍完了。相比较之前的甲基化数据库而言这个纳入的数据量会大很多,但是分析的类型就各有各的好处了。大家可以基于自己的目的来选择目标数据库即可。
|
|