分享

干货 | 寻觅基因启动子,UCSC&Ensembl来助威!

 解螺旋 2020-08-27


作者:解螺旋·子非鱼

如需转载请注明来源:解螺旋·医生科研助手

导语

解螺旋不久前推出一篇针对用NCBI数据库来查找基因的启动子的文章,不少读者表示很受益,并希望我们对Ensembl等其他数据库也能加以介绍。读者的需求就是我们的追求,今天就是来满足大家的期望的。(所以您对解螺旋还有什么内容上的需求和建议,尽管给我们留言吧。)

启动子一直都是基因的重要组成部分,它就像开关,决定着基因的活动,是区分基因与“垃圾DNA”的关键成分,因而,其异常性突变往往会导致基因表达的调节障碍,目前对启动子的研究仍旧是一个热门话题。今天小鱼就用UCSC数据库及Ensembl数据库查找基因启动子的方法介绍给大家。回复“promoter”可查看如何用NCBI数据库来查找基因的启动子。

用UCSC数据库查找基因序列的启动子
方法一:
 
1.打开UCSC数据库网址:http://genome./

 

2.选择Tools中的“Table Browser”则出现以下界面,以人的CCKBR基因为例。
 
首先,在clade中选择Mammal,genome中选择Human,assmebly中选择最新的数据库,track中选择RefSeq Genes,output format中选择sequence。
 
其次,在position后面的方框内输入待查的基因名称,如CCKBR。点击get output。

 

3.可出现以下界面,点击目的基因的第一个链接,可出现Select sequence type for RefSeq Genes界面,并在该界面中选择genomic选项。



4.点击submit后,因一般启动子的长度大约为2kb,可选择Promoter/Upstream by 2000 bases。


5.点击get sequence即可得到结果。

 

方法二:

1.在打开UCSC数据库后,点击Genome Browser,可出现以下界面。在species中选择Human,assmebly中选择最新的数据库,Position/search term中输入CCKBR基因。

 

2.点击GO, 可出现以下界面,点击目的基因的第一个链接。可出现这个序列的图解概要。

3.为了获得这个区域更清晰的图像,可以点击紧靠zoom out的1.5×按钮,如下图所示,一般高的块状表示外显子,短的块状表示5’端和3’端非翻译区,起连接作用的内含子则用细线条表示,翻译的方向由沿着细线的箭头表示。

 

4.点击上图中的RefSeq Genes中,任一个条形方块,可进入新的界面。在该界面的Links to sequence中,选择Genomic Sequence即查阅该基因的启动子序列。

用Ensembl 数据库查找基因的启动子序列

1.打开ensembl数据库的网址:http://asia./index.html


2.以人的ANKH为例,在search中选择Human,for后面的方框中输入ANKH基因。

3.点击GO,在出现的新界面中,点击左侧的Gene。


4.点击第一个链接,可查看该基因的详细信息,点击左侧下端的export data。

5.在导出数据的界面中,将5’ Flanking sequence(upstream)后的方框里输入2000,即启动子一般长度。同时,将Genomic后的方框里选择5’ Flanking sequence,点击deselect all取消后续方框的对勾,再点击Next。

6.在新的界面里,点击text格式,即可获取启动子的序列。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多