分享

TFTG:human转录因子靶基因数据库

 生信修炼手册 2019-12-24

研究转录因子调控的靶基因有两种常用的手段,第一种就是利用chip-seq等方式,研究特定转录因子在基因组的结合位置,从而判断其调控的基因,因为有实验证据的支持,所以这种方式得到的调控基因会更加可信,存在的问题就是peak calling时的假阳性率问题。

另外一种方式是建立在转录因子的motif已知的情况下,可以采用FIMO等软件在基因的启动子序列上进行查找,如果能够匹配上,说明该基因可能是靶基因,这种方式就是单纯的通过计算手段来预测靶基因,相对而言,假阳性率会更高。

TFTG数据库全称是Transcription Factor Target Gene Databse, 是一个转录因子靶基因数据库,该数据库结合实验手段和分析手段来研究转录因子和靶基因之间的调控关系,示意图如下

对于转录因子USF1而言,其motif已知,首先利用FIMO软件在基因的启动子去查找对应的motif, 这里启动子区定义为转录起始位点TSS上下游5KB, 通过这种方式找到了3个候选的转录因子结合位点TFBS。

然后根据DNAse-seq的结果,可以排除第三个位点,因为其染色质不是开放状态,然后根据DGF印迹法的结果,排除了第一个位点,在该位点没有任何的印迹。最后结合该转录因子的chip-seq实验的结果,基本可以确定第二个候选位点是一个真实的TFBS。

该数据库综合利用上述多种实验和分析手段,最终构建出一个高可信度的转录因子靶基因调控数据集。通过官网的检索功能,可以查看某个基因或者转录因子的调控网络


对于转录因子而言,以TP53_MA0106.1为例,检索结果包含了以下信息

1. sequence logo

2. 转录因子对应的靶基因

对于基因而言,以AACS为例,检索结果包含了以下信息

1. 基本信息

2. TFBS

该数据库是免费下载的,提供了以下两种数据

excel文件中保存的是所有转录因子的名字,对应的基因信息,示意如下

压缩文件中保存的是每个转录因子对应的靶基因信息。通过该数据库,我们不仅可以得到转录因子对应的靶基因信息,更加值得借鉴的是它解决问题的思路,综合实验手段和计算手段来降低假阳性率。

·end·

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多