分享

应用UCSC和ensemble查询基因的启动子序列

 勤劳的bee 2020-10-08

转录因子是通过结合特异性DNA序列控制遗传信息从DNA到信使RNA的转录速率的蛋白,转录因子可通过修饰(甲基化、去甲基化、乙酰化、去乙酰化等修饰)与启动子进行互作结合调控,产生促进或是抑制的效果。

启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件做出应答,对基因的表达水平做出相应的调节。

启动子是RNA聚合酶特异性识别和结合的部位。启动子方向性,位于转录起始点上游,本省并不被转录。启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。总结起来,也就是说启动子约在与mRNA所对应的DNA序列之前约2000个左右的碱基。

明白了启动子的含义之后,我们以人(homo spacies)的mettl3为例,应用UCSC和ensemble查询该基因的启动子序列。

(1)应用UCSC数据库查询基因的启动子序列。

首先,登录UCSC网站(https://www.genome./)。点击tools下的gene sorter。

在search中输入需要检索的基因,点击GO,其他内容默认即可。

选择第一个,点击sequence。按图设置。

我们可以通过以上四个选项获得该基因的蛋白,mRNA,promoter以及基因组序列信息,我们这里关注的是promoter,选中包含转录起始位点上游3000bp,下游1000bp碱基。最终获得如下启动子序列。

(2)应用ensemble数据库查询基因的启动子序列。

首先,登录ensemble网站(https://asia./index.html)。选择homo,输入查询的基因。点击GO。

点击基因。

点击sequence。

显示的序列橙色区域的为外显子,第一个外显子前的序列是启动子,默认为600bp,设置一下。点击左侧configure this page设置需要的启动子长度,保存。

将上游修改为3000-1000,点击对号,等待页面刷新。


根据需要复制启动子区域。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多