由于实验需要,最近看了很多这方面的资料,这里做个汇总。首先看下摘自WIKI的这张图有个大概的了解。 一、CDS,5'UTR 和 3'UTR的寻找 由上图可知,5'UTR 和 3'UTR虽然是基因上不被翻译的区域,但他们本身属于Exon,因此找出他们的序列很简单。如我现在要寻找human LDLR(人源低密度脂蛋白受体)这个基因的5’UTR及3'UTR,我直接在NCBI的GENE里面输入LDLR,然后找human的这个GENE,显示如下: 看到这个页面后,下拉寻找LDLR的mRNA序列信息 点击下图的NM_000527.4,便可得到LDLR的mRNA全序列。 看到Homo sapiens low density lipoprotein receptor (LDLR), transcript variant 1, mRNA后,往下拉菜单,会发现CDS的信息,直接点击CDS,下方的CDS序列则被深红标出,而CDS前面180多bp则为LDLR的5’UTR,而CDS后面2000多bp的则为LDLR的3‘UTR: 二、promoter区域promoter怎么找?这个比较复杂,目前没找到一个软件或者网站可以精准的找到一个基因的promoter区。但是promoter本身其实就是转录起始点前的一段序列,也可以说是5’UTR上游的可以几百bp,也可以上千bp,但一般不会超过上游2000bp,有几个网站可以帮助寻找。1.http://www./
2.http://rulai./cgi-bin/TRED/tred.cgi?process=home
对这个结果我在软件DNA MAN NCBI上 RUN BLAST来确认,结果显示是Accession number
为
3.介绍个更靠铺的吧,UCSD的。http://genome./
UCSD这个有一个帖子专门介绍如何使用,点击页面左上角的Genome
brower,然后进入基因信息输入页面。还是以LDLR为例。
Ensembl Gene Predictions路径由Ensembl提供。若初次尝试得不到Ensembl,则可下拉菜单将Ensembl Genes选择为dense
好吧,先记录到这里吧,应该会有很多方法来寻找的,欢迎指正补充哈~~~另外,推荐一个不错的网站:叫biology online,有什么问题可以发上去,会有人回复的,前提是这是个英文网站,so,ask questions by English!~ http://www./biology-forum/about10668.html
DR.J 2012.7.13 |
|