有朋友在后台留言让介绍下UCSC Genome Browser,其实小张很早就想介绍了,无奈这个数据功能太强大,就像NCBI一样,收录的信息太多了,不是一两次能说清楚的,大家用NCBI用的最多的还是pubmed、Blast等少数几个功能, 其他大部分工具用的还是比较少,比如GEO: 而UCSC就是一个类似于NCBI的航母,收录的各种各样的战斗装备: 今天我们挑UCSC Genome Browser拿出来讲,顾名思义,基因组浏览器,是根据基因组的位置、基因ID等信息进行浏览。我们从UCSC主页面(http://genome./)进去后,点击Genome Brower就可以了:
每部分功能框又包括几个数据源,比如在Genes and Gene Predictions中,就包括:GENCODE、RefSeq Genes等20个数据源,每个数据源显示结果可以包括hide、dense、squish、pack和full这五个不同的显示水平,按照前后顺序full是全部显示,hide为隐藏,即越靠下显示结果越多。
所以在显示窗口中只显示了mRNA和基因的信息。下面我们通过调节功能框查看不同的结果, Mapping and Sequencing:比对和序列信息,比如GC含量(五个碱基内GC的比例),我们把GC含量调整为full显示,然后单击右上角refresh:
Genes and Genes Prediction:这里我们把功能框的UCSC Alt Events(显示基因中可变剪接等可以导致产生不同转录本的事件)设置为full显示模式:
Phenotype and literature:表型和文献,我们把OMIM Pheno Loci(孟德尔遗传病和基因位点)设置为full: 刷新后
mRNA and EST: 我们把Human mRNAs设置为pack显示,SIB Alt-Splicing(可变剪接方式)设置为full显示:
Expression: 表达。我们把GNF Atlas 2(通过Affymetrix芯片对79对人组织样本进行的表达检测)设置为full:
Regulation: 表达调控,我们单击ENCODE Regulation,在弹出的界面中选择:Transcription,H3K4Me1,H3K4Me3和H3K27Ac四种,然后提交
当然 ,也可以选择物种显示:
Repeats:重复序列。这里我们设置repear Maskers为full模式,
基本上几个功能框的说明就到这里了,UCSC Genome Brower作为UCSC众多工具中的一种,我们简要的进行了介绍,从这些介绍中我们发现这个工具功能之强大,简直是包罗万象,不过每部分内容涉及到一些基本概念,需要有些了解。比如最后Repeats重复序列结果中,就有做微卫星序列与疾病相关研究的:
下次我们通过案例来说明如何从这个工具出发找思路。 That’s all. Thank you!
|
|