分享

利用NCBI学习生物信息学-winnieding's blog

 瓦娜儿 2010-12-06

winnieding's blog

  

利用NCBI学习生物信息学--------Map veiwer 该博文已被推荐

Map viewer提供基因组的遗传图谱,物理图谱。不同的物种可查询的图谱是不同的,包括序列图谱,细胞遗传学图谱,基因连锁图谱和杂交图谱。具体如下(来自NCBI)

在使用map viewer时会遇到两种图,一种是整个genome view,一种是map view。前者以染色体的形式提供物种整个的基因组的图像,后者只显示单一的染色体或是染色体上的一部分,但是提供细节。
先看下genome view:
Genome view的目的是根据你查询的结果提供基因组的整体形象,没有太多细节显示,提供与你查询相关的结果,并且给出他们在基因组中的定位,根据这些你可以找到你想要找的基因。具体看下吧,我找人的p53基因,在map viewer的search中输入相应的查询条件:
附:以下所列的都可以用来查询
也可以用BLAST查询。没用过,希望园子里用过的战友赐教。
居然有这么多和p53相关的基因,往下看这个网页就给出了所有hits具体都是什么基因,看看下边这一条一条的都是什么吧
Chr:染色体,下边是1,代表1号染色体
Assembly:是来源,除了reference,还有来自celera公司和HuRef-Primary(注释的人类基因组,谁能告诉我这个是什么啊)的结果。
Match:是相关基因的名称,种属来源,按在基因上的定位分类
Map element type:显示了最经常使用的鉴定相关基因的序列(原文:In the center of the results table, MapViewer displays the commonly used identifier for each match (e.g. gene symbol, marker name). )大概这个意思吧,如果不对还希望大家能帮忙纠正。点击可以看到详细的信息。
Maps:相关基因的来源,感觉点开后的结果和上边map element点开的结果差不多。
 
接下来精炼这么多结果,右边有一个quick filter,选择gene,只剩223个相关信息了,在页面上的assembly中选择reference(我们并不比较不同来源的p53有什么差异,所以选一个就可以了),on chromosome 中写17,很容易找到需要的基因:
 点map element 或maps就可以看到详细的信息了:
窗口master map下边有两个图,左边的是additional map,右边的是master map,可以通过additional map上的蓝色小箭头把additional map变为master map.
在最左边有maps&options,这个很有用,点开
 
可以利用这个设置map viewer中显示的图像,信息。
Available maps:列出了可以显示的图像,我在里边添加了CpG island
Move up,move down,make master/move to bottom这些按钮可以选择把那个图像作为master map.
Chromosome 和region和shown可以改变这条染色体显示的区域
Page length:例如这里是30,就说明在master map中显示的染色体中不论有多少markers都只显示30个。
Verbose mode和compress map控制是否在master map上显示细节,前者显示后者不显示。
 
文章一开始就说了一些物种能够查询到4种图谱,每种怎么看呢:
 
1. sequence maps:顾名思义,序列图谱直接给出相关序列的信息。有几种不同的序列图谱,一种是genbank map,显示经过同源比对的单一序列片段的DNA,这种图谱常常用来鉴定DNA克隆中含有的部分基因组序列。另一种是contig map(重叠群图谱)显示连续的序列称为contigs,是小序列的重叠序列。用这种图谱得到长的连续的DNA序列。还有一种是最复杂的annotated map(注释图谱)或者是genes sequence map,显示了特殊位点的序列相关特征,包括变异,STSs,预测的基因,基因模型,这种图谱对于精确定位,DNA序列的特性等也是最有用的。还是以p53为例:
最左边的是component map,由片段组成,每个片段在genbank都有对应得信息,这里只有蓝色的线,代表已经完成的序列,如果有橘黄色的则代表draft。
中间的是contig map:由genbank中同源的重叠序列组成连续的大的“contig”,同样橘黄色和蓝色分别代表draft和finished
右边的是sequence map:提供基因序列,基因来源和翻译模式。蓝色线代表基因序列和mRNA有很好的一致性,橘黄色则相反。
从这张图上可以看到TP53两侧的基因是ATP1B2和LOC100506809,TP53这条基因序列的可信度非常高,因为他是来自单一的一条GENBANK的序列(AC087388.9)
 
2. Cytogenic Maps:建立在染色体染色基础上的,主要有ideogram(G带图)。这种图对于研究染色体改变引起的生物表型和基因型的改变之间的联系很有用,染色体的改变包括缺失,复制,转位,插入等。例如我们都熟悉的21三体综合症。G带图一接触遗传就学了,所以忘得最快。从网上找了相关的内容(http://boyun./bio/?p=1405):
什么是染色体G带图
将染色体经过一定程序的处理,并用特定的染料染色后,使染色体在其长轴上显示出一个个明暗交替或深浅不同的横纹,这样的横纹就叫做染色体的带。染色体G带也称为G显带,是最常用的染色体检查方法,可以识别和分析每条染色体
人类染色体G带图
在许多基因组图谱中,染色体的G带图依然是染色体的表示,是染色体真实存在形态的一种描述。随着基因组注释的深入,基因组图谱系统成为人们了解基因组的常用方法,像NCBI的mapviewer、EBI的Ensembl、GBrowse等。将序列对应与G带图上,建立起核酸序列与染色体之间的联系,对于人们深入的了解染色体具有重要的意义,如同建立起一级结构与三级结构的联系。而G带图的数字化是关键步骤,如何将图变为数据库描述的记录,如果由数据库还原为图。本篇文章以NCBI的MapViewer为例,做一个介绍。
NCBI G带图(Ideogram)的保存格式:
  • chromosome
    arm
    band
    iscn_start
    iscn_stop
    bp_start
    bp_stop
    stain
    density bases
数据库中字段的说明:
  • am表示染色体的臂, 每个染色体有两个臂,am=q 或者am=p,am= cen表示两个臂的焦点。如果为空表示只有一个臂
  •  band表示染色体上的条带的编号,分为4级,比如染色体1的q臂分为3个区分别是1,2,3;1下面有分11,12,13;11下面又分为11.1,11.2,11.3;11.1下面又分为11.1a,11.1b,11.1c;
  •  iscn_start,iscn_stop表示条带开始与结束的位置;
  •  bp_start,bp_stop表示对于的碱基
  •  density表示条带的密度,其值分别为空,25,50,75,100
  •  stain=’acen’的band部分用斜杠图形表示
  •  stain=’gvar’的band部分用反斜杠图案表示
画图方法:
  •  按照iscn_start,iscn_stop的值,由上往下画图 如果有臂,则长臂短臂要分开显示
  •  band的四级不显示,如果只有2级,则标识2级,否则仅仅显示三级
  •  根据density的值,确定条带的颜色,空为白色,100为黑色,其他显示过度颜色
  • 图上要标识G带的编号,编号为chro+am+band 
背景知识
1968年,瑞典学者卡斯珀松( T.O.Caspersson,1910—)首次应用荧光染料氮芥喹叶因处理染色体标本,发现染色体因着色不同能够沿其纵轴显示出宽窄和亮度不同的荧光带。这种明暗相间的带纹被称为Q带。Q带受制片过程和热处理的影响较小,制片效果较好,带型鲜明。但是,由于荧光持续存在的时间很短,必须立即进行显微摄影。另外,必须有荧光显微镜才能进行观察,所以,不能为一般实验室所采用。后来,研究者发现染色体标本如果先经过盐、碱、热、胰酶或蛋白酶、尿素及去垢剂等的处理后,再用一种叫做Giemsa的染液染色,也能使染色体沿其纵轴显示出深浅相间的带纹,这个带纹称为G带。G带在各条染色体上显出的带型和Q带型基本相同。由于G带染色没有Q带的缺点,在普通显微镜下就可以进行观察,所以为一般实验室普遍采用。
 
Anopheles gambiae 的AGXH77为例:
Ideogram就不用说了
Sat_cyto全程microsatellite-cytogenetic:这个图的组成是细胞遗传图用G带对比已知的微卫星序列。
 
3. Genetic linkage maps:遗传连锁图谱,单位是厘摩(centimorgan,cM),这不是一个距离单位而是DN***段长度100次有丝分裂事件中有1次重组。所以对于物理图谱来说这是一个相对距离,当然连锁的基因都在一条染色上。遗传连锁图谱对于分析在同一连锁(linkage group)中基因的远近和顺序是非常有用的,但是单凭连锁图谱确定基因顺序是不够的还要结合物理图谱。
 
4. radiation hybrid(RH) maps:(翻也翻不对,所以不翻了) Radiation hybrid (RH) maps are very similar to genetic linkage maps in that they too are based on the frequency with which two markers are found in each other's presence; therefore, these maps show feature order and proximity. However, radiation hybrid maps are the result of induced DNA fragmentation and so can produce maps of higher resolution than standard genetic linkage maps. Basically, irradiation of the DNA donor cells fragments the DNA into small pieces which, upon somatic cell fusion, either form mini-chromosomes or integrate into the genomes of the recipient cells. The hybrid DNA can then be probed (by FISH or PCR) for the presence of select pairs of donor markers. Irradiation can be used to create very small fragments of DNA, producing very high resolution maps and providing a higher density of markers useful for positional cloning. Radiation hybrid maps have been generated for various types of markers including sequence tagged sites (STSs) and simple sequence length polymorphisms (SSLPs). Because of the high map resolution and marker density of RH maps, they are especially useful for positional cloning studies.
 
比如查Mus musculus的D2Mit472:
WT/MRC-RH:whitead-MRC RH mouse map
WT-YAC:whitehead mouse YAC map
WT-GEN:whitehead mouse genetic map
前两个是RH图,最后一个是遗传连锁图,可以看到不同的图谱给出的信息不同,即不同图谱给出的D2Mit472两侧的基因不同,也反映了不同作图方法给出的相关连锁基因的位置,数量等的不同。
 
以上内容来自NCBI
 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多