转录因子通过特异性结合调控区域的 DNA 序列来调控基因转录过程。其中,关键的科学问题是为了回答在某些状态下(疾病)异常表达的基因受到何种转录因子的调控。对于发现的异常表达基因,最开始的想法就是基于基因的启动子序列来查找可以与其结合的转录因子位点。这一方面有很多的软件或网站进行生物信息学方面的预测分析,但还有更多的基于高通量实验结果的网站可供参考。本文从实验验证的角度,谈谈如何了解特定基因的调控信息。
1. 转录因子结合位点相关的数据库获取转录因子结合序列 被引用次数是指在Google Scholar 上的引用次数 还有其它的有用的网站,比如TRED和ITFP,可以提供受调控基因的序列信息,但是现在基本上不能访问,或是网站不能用了。好消息是有人把这些网站的数据制作成了tftargets包,坏消息是要了解R软件的使用。 以下用JASPAR为例,说明查找人的转录因子TP53的结合序列。 首先,打开网址后,输入Name TP53 及Species(物种名) human, 点击search: 然后,在图标处点击,查看更多信息: 接着,可以看到TP53结合的序列一共有三种模式(点击可以查看另外两种),这里给出的是用HTSELEX技术总结出来的模型。可以看到TP53结合序列长为18bp, 其中第6和16位相当保守: 2.获取人的特定基因调控序列 因为商业化公司会卖启动子和3‘UTR序列的载体,这为直接获取特定基因调控序列提供了不少便利。比如,我们可以直接通过(http:///products/promoter-reporter-collection) 查找TP53 基因的调控序列。 直接输入TP53,并点击Both: 点击Sequence and Clone Info 可以查看TP53的启动子和3‘UTR的序列信息: 可以将Sequence拷贝保存,方便以后自己构建载体验证:
3.获取人的特定基因调控序列上的转录因子结合信息 这方面也有SABiosciences公司提供的数据库(http://www./chipqpcrsearch.php?app=TFBS)。当然,公司提供这个服务主要是为了卖他们的Chip-qPCR的引物。
我们首先来看看TP53受哪些基因的调控。
首先,在Gene Symbol中输入TP53.左边的over 200 TF, 是指在200多个转录因子范围内,看哪些转录因子在TP53基因上有结合位点: 红色箭头表示的是转录起始方向,这里TP53是从负链开始转录。绿色字体表示转录因子的名字,点击可以查看更多信息。这里的转录因子,可以结合在基因转录起始的上游,也有不少是结合基因的转录以后的位置: 看来TP53可以调控自身的表达情况,再看看TP53的结合于自身基因的信息。表示有四个结合位点,如果是要做chip-qPCR的实验,可以直接点击: 可以看到在人17号染色体上,反向链从7578811位开始转录。而结合的位点中心是7578320的位置,可以基于此在UCSU上获取序列,并自己设计qPCR引物:
4.获取某一转录因子可以调控的所有基因 (http://www./chipqpcrsearch.php?app=TFBS)
再来看看TP53(网站提供了200左右的转录因子)可以调控哪些基因: 这里提供了10个最相关的调控基因,要看所有的调控基因,点击View More Genes: 可以得到10041个有TP53结合位点信息的靶基因,其中就有提到的TP53本身:
5.获取某一转录因子可以调控的所有基因 参考https://github.com/slowkow/tftargets 要有R语言的基础(了解什么是列表,会安装包就行了)。 |
|
来自: 昵称44726046 > 《文件夹1》