分享

【原创】寻找基因的CDS, 5'UTR,3'UTR及Promoter区等

 最后的大肠杆菌 2019-07-10

由于实验需要,最近看了很多这方面的资料,这里做个汇总。首先看下摘自WIKI的这张图有个大概的了解。

【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

一、CDS,5'UTR 和 3'UTR的寻找

由上图可知,5'UTR 和 3'UTR虽然是基因上不被翻译的区域,但他们本身属于Exon,因此找出他们的序列很简单。如我现在要寻找human LDLR(人源低密度脂蛋白受体)这个基因的5’UTR及3'UTR,我直接在NCBI的GENE里面输入LDLR,然后找human的这个GENE,显示如下:

【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

看到这个页面后,下拉寻找LDLR的mRNA序列信息 点击下图的NM_000527.4,便可得到LDLR的mRNA全序列。

【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

看到Homo sapiens low density lipoprotein receptor (LDLR), transcript variant 1, mRNA后,往下拉菜单,会发现CDS的信息,直接点击CDS,下方的CDS序列则被深红标出,而CDS前面180多bp则为LDLR的5’UTR,而CDS后面2000多bp的则为LDLR的3‘UTR:

【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

 

二、promoter区域

promoter怎么找?这个比较复杂,目前没找到一个软件或者网站可以精准的找到一个基因的promoter区。但是promoter本身其实就是转录起始点前的一段序列,也可以说是5’UTR上游的可以几百bp,也可以上千bp,但一般不会超过上游2000bp,有几个网站可以帮助寻找。

1.http://www./ 这个网站极简单,但搜索范围也很大,可以找到5’上游10KB,甚至100KB。只有填入基因的缩写名称和来源就行,比如LDLR human,然后search就列出一堆来,可以看到Promoter Genomic Refseq (5' up-stream 10 kb) 甚至Promoter Genomic Refseq (5' up-stream 100 kb)。下载下来的格式就是FASTA了,极快无比。

2.http://rulai./cgi-bin/TRED/tred.cgi?process=home 这个是冷泉港的一个数据库,专门用来查找基因的转录调节元素(Transcriptional Regulatory Element Database )。左边有个Retrieve Promoters,点击进入,输入基因缩写如 LDLR, 染色体号,如19,便可得到Promoter的信息。这里面显示了5'上游700的数据,和转录起始点开始300bp的数据,总共1000bp。但也可以自己调节位置,如我想知道-1000bp到0的就在右下角更改,再refresh就可以了。如图红色圈圈显示:
【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

对这个结果我在软件DNA MAN NCBI上 RUN BLAST来确认,结果显示是Accession number 为 FJ525879.1 的一段序列。但FJ525879.1 竟然显示的是LDLR complete CDS区,我就直接晕倒了,promoter怎么会在CDS区?而且这个LDLR CDS区怎么会有40000多bp那么长?难道NCBI也有错误的数据?!所以,基于这个不能解释的问题,我暂时不推荐用这个数据库。。。可能是我没研究彻底,欢迎来指正。

3.介绍个更靠铺的吧,UCSD的。http://genome./
UCSD这个有一个帖子专门介绍如何使用,点击页面左上角的Genome brower,然后进入基因信息输入页面。还是以LDLR为例。
【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

 点击submit就可以得到一系列LDLR的信息:
【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J

Ensembl Gene Predictions路径由Ensembl提供。若初次尝试得不到Ensembl,则可下拉菜单将Ensembl Genes选择为dense full模式,点击Refresh。如果可以得到以上的图,我们便可以直接点击Ensembl Genes里面第一个红色条带,便得到下面的信息:

【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J
 点击 Genome Sequence from assembly,便得到以下重要信息:

【原创】寻找基因的CDS, <wbr>5'UTR,3'UTR及Promoter区等--DR.J
promoter, 5'UTR, CDS, 3'UTR, INTRONS 啥都出来了,想要啥就打啥勾submit就行了。promoter的话,5’上游2000bp应该够了,这个结果我blast 过,是对的。


好吧,先记录到这里吧,应该会有很多方法来寻找的,欢迎指正补充哈~~~另外,推荐一个不错的网站:叫biology online,有什么问题可以发上去,会有人回复的,前提是这是个英文网站,so,ask questions by English!~

http://www./biology-forum/about10668.html


DR.J

2012.7.13










    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多