我们以前写过如何寻找基因的启动子和预测转录因子:(工具篇):如何查找基因的启动子及预测转录因子?,今天我们反过来做一个事情:根据转录因子来预测靶基因。 其实我们知道很多转录因子的结合序列是相对保守的,这样我们就可以根据保守的序列进行预测,但是由于一般序列比较短,所以会预测到很多靶基因,这时我们一般通过CHIP-qPCR来反过来进行验证。好下面我们来介绍这个数据库: GTRD (Gene Transcription Regulation Database):http://gtrd./我们可以直接通过单击Start开始: 界面右侧的红框里面是我们可以设置的。这里我们直接举例说明,比如我们想完成两个事情: (1)看lncRNA HOTAIR基因上转录因子SMAD1的结合情况; (2)预测转录因子SMAD1的靶基因; (1)我们在advanced search中输入物种、dataset、cell line、treatment、max gene distance和output type分别如图: 然后单击Run,在新打开的界面中可以看到HOTAIR和SMAD1的结合位点: 我们可以单击TF binding sites:open table: 查看具体信息: 如果我们想看所有转录因子的情况,在前面transcription factor里面选择any即可: 这样我们就可以同时看到转录因子结合位点与峰高(peaks)了: (2)预测SMAD1的靶基因: 直接在advanced search里面选择SMAD1, 单击Run: 上图红框就是预测到的靶基因,结果可以导出: 选择导出格式: 我们看到一共有33522条: 这是导出的结果: 我们可以通过ID转换工具进行转换,方法见这两篇文章: 转换过后的格式是这样的: 网站是好用,就是太多了,最后还是要结合ChIP-seq的数据来看。 |
|