分享

如何在PubMed中查询基因信息 | 转录本以及CDS查询

 申栋帅 2018-04-04

作者:WEE

来源:科研小助手公众号


在质粒构建、qPCR等实验中我们经常需要查询一个基因的编码区序列,即CDS序列。在科研小助手微信交流群中有群友反馈还不是很清楚如何查询基因的CDS序列信息。其实在科研小助手之前推送的质粒构建三部曲质粒构建:从入门到精通之高手进阶』『质粒构建:从入门到精通之上下求索』『质粒构建:从入门到精通之初窥门径便讲解过如何查询一个基因的CDS区,今天我们再系统的为大家讲解一下如何以正确的姿势查询一个基因的转录本和CDS区。



我们以p53基因为例,在搜索栏输入p53,如果你要搜索人的也可以直接输入“p53 human”,这样可能更便于你查询基因的信息。或者利用PubMed右侧的Top Organisms选项筛选物种。



点开第二项TP53,可以看到该基因的信息页。首先是该基因的缩写『TP53』、全称『tumor protein p53』和物种信息『Homo sapiens (human)』。再下面就是该基因的ID和信息的更新日期。在Summary一栏则是该基因的官方名、官方全称、别名和功能的概述等信息。这些对于我们快速了解一个基因有很大的帮助。




再往下走我们就可以看到下图信息。这个图片我们可以看到p53有15个不同的转录本。很多基因都是有着多个转录本。我们都知道,基因转录之后,首先是形成前体mRNA,通过剪切内含子连接外显子,5’端加帽及3’端加尾之后形成成熟的mRNA。但是在剪切的过程中可能会剪切掉外显子,也有可能保留部分内含子,这样就形成了多种mRNA即多个转录本。



我们从上图可以看到每个转录本都有对应着一个NM号,那么NM、NP,甚至如果你做大鼠相关的基因你会遇到XM、XP,那这些缩写到底是什么鬼呢?好吧,如果你有此疑惑,那么下图应该可以回答你。



当你把鼠标放到绿色线上时会弹出一个窗口,该页面有该转录本的详细信息,当然也可以看到该转录本对应的CCDS,即该转录本的CDS序列。



当然,你继续往下拉就会看到下图,这里直接呈现了各个转录本的详细信息。



点击Consensus CDS后面的CCDS11118.1,即可查看该转录本对应的CDS区的序列了,而我们构建质粒、设计引物啥的就是用这个序列了。



有些基因没有Consensus CDS信息,那么你就只能点击NM号,按照质粒构建:从入门到精通之初窥门径讲的方法找到该基因的CDS区序列了。至于这么多转录本我到底应该选择哪一个,科研小助手也在『这个数据库送给你,一站式查询蛋白分子量、功能、结构域和经典转录本等信息!』中讲解过了,还不知道的可以直接点击进去阅读。


在基因信息页里面包含了大量的其他信息,也是非常有用,比如该基因在各个组织中的表达情况。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多