分享

WashU EpiGenome Browser的基本用法——跟着岳大师学ENCODE和RoadMap...

 yjt2004us 2018-05-09


一转眼岳大师系列到了第四篇,郭大侠看了之前一些小伙伴的留言,结合本实验室师弟师妹的疑问,发现很多小伙伴对组蛋白表观修饰缺乏了解,很多人对组蛋白修饰的理解就是某修饰是激活转录的、某修饰是抑制转录的。郭大侠的某师妹对于特定位点一甲基化(me1)和三甲基化(me3)的理解搞的一塌糊涂,甚至不知道这两个修饰是由不同的酶催化生成,感觉有必要简单说明一下。早在2002年就有科学家提出了histone code的概念,认为在遗传信息传递过程中,组蛋白修饰也可以组成特定的密码修饰来影响转录:如活跃基因的转录起始位点通常会发生H3K4me3H3K27ac的修饰;Gene body上的H3K36me3修饰可以促进基因转录;H3K9me3H3K27me3在启动子区域的修饰会介导转录抑制;H3K4me1H3K27me3H3K27ac修饰常常出现在增强子(enhancer)区域,分别调控着enhancer待发(primed)、准备(poised)和活化(active)三种状态,H3K4me1修饰与增强子的三种状态均有关联,可以作为增强子的标记,当增强子处于准备状态时,会发生H3K27me3修饰;当增强子活化后则会擦除H3K27me3修饰,发生H3K27ac修饰。建议想系统学习的小伙伴买这本书看看入门,虽然书有点老(2007年出版),但是个人感觉不是做遗传学单纯拿表观遗传做机制这本书足够了。


 

1


今天要介绍的数据库是WashU EpiGenome Browser,该数据库由圣路易斯华盛顿大学医学院的王艇教授小组(http://wang./)创建维护。王艇教授的研究主要是通过干湿实验结合研究表观遗传调控机制,paper十分高产,此外还构建了UCSC Cancer Genomics Browser,绝对是大神级人物。相比于UCSCBrowserWashU EpiGenome Browser在浏览表观遗传修饰数据中表现的更加专业,界面更加友好,容易上手学习,同时配色方案远优于UCSC;同时可以加载ENCDOERoadMap和用户自定义文件,实现数据的快速浏览比对。


WashU的主页链接:http://epgg-test./。打开后如图2所示,2-1链接到WashU EpiGenomeBrowser2-2链接到RoadMap EpiGenome Browser(我们会在岳大师第五篇中讲解该数据库使用)。2-3中有详细的教程,包含一份PDF说明文档(http://epigenomegateway./support/2015IEC/2015_IEC_tutorial.pdf)和视频教程(需要翻墙看)。这里我们先只看WashU的用法,点击2-1进入。


 

2


WashU的进入后会首先让用户选择参考基因组(图3),这里我们选择3-1红框中的hg19,这个参考基因组下数据量最大。做其他物种的也有相应的参考基因组数据,比如小鼠、斑马鱼,水稻等,可以在3-2中选择相应分组找到。

 

3


进入后,系统提示hg19基因组已经加载(图4.A),并提示接下来加载何种track。有三种方式,“Custom tracks”按钮可以加载用户自己的文件,比如ChIP-Seqbed文件或者bigwig文件;“PUBLIC hubs”可以加载GEO中的公共数据;“GENOME broeser”可以浏览整个基因组。这里多解释一下何谓track,其原始含义表示轨道,CD诞生后一首歌曲数据会存在一个音轨中,因此track也就表示一串储存好的信号文件;在WashU中每个数据信号会按照图4.B样通过数据波峰展示,因此加载一个ChIP-Seq文件也叫作加载一个track。这里我们使用Roadmap中的表观修饰数据,点击图4.C红框中的“Load”按钮,完成数据加载。

 

4


加载后系统显示图5界面,系统默认加载模式细胞系IMR90(人胚肺成纤维细胞)的数据。5-1显示的是当前显示位置,点击蓝色方框可以输入染色体位置、基因名或SNP位点来跳转到特定位置。5-2是当前染色体位置,可以用鼠标在此拖拽选取查看特定区域。5-3是相关的组蛋白修饰tracks,从上往下依次是input数据、H3K4me3修饰信号(两次重复)、H3K4me1修饰信号(两次重复)、H3K9me3修饰信号(两次重复)、H3K27me3修饰信号(两次重复),在5-3中每个track中点击右键,可以设置显示方式(未展示)。5-4中显示了染色体状态与顺式调控元件,上面的各种颜色代表不同的信息,将鼠标移上去即可显示:如深灰色代表被PolyComb抑制表达区域,明黄色代表enhancer,红色代表活化的TSS(转录起始位点),绿色代表转录本。5-5中展示了甲基化测序数据,背景中灰色代表了该区域CpG的丰度,蓝色代表甲基化CpG丰度。5-6中主要说明了基因组上一些重复序列情况,如短散在元件(SINE)、长散在元件(LINE)、Alu序列等,这些重复序列具有调控基因表达的功能。5-7中显示的是转录本情况,箭头代表了转录方向。这个图大家可能在帖子里看不清楚,我把原始图上传到了网盘里:http://pan.baidu.com/s/1slKlZ8h


5


在此基础上我们可以往图5中增加自己感兴趣的数据,点击图5右上角Tracks按钮,可以弹出图6.A所示界面,在文本框中录入自己感兴趣的关键词,我们这里输入liver。出现如图6.B所示界面,可见在liver中有30tracks,点击Add按钮。即可将图6.C中所示tracks加入。

 

6.


这样一个基本的数据可视化过程就展示完毕。WashU中所生成的图可以直接放到paper 中,接下来我们看一下怎么导出。点击图5右上角APP按钮(在Tracks按钮右边),选择Screenshot(图7.A),弹出保存界面(图7.B),点击Take Screenshot按钮,即可生成SVGPDF格式图片。


7


…华丽丽的分割线…


李莫愁博士:大概郭大侠讲的表观遗传学的工具,大家都会觉得太难懂了。其实表观遗传很好理解,什么是表观遗传呢?就是在DNA不变的情况下,基因表达发生变化。那具体怎么发生的呢?就是通过染色质的修饰,正常的染色质大概就是这样的:



如果没有修饰的话,染色质是组蛋白搅和着DNA的一条链子。但是组蛋白如果有了修饰,就会导致染色质产生变化,比如,H3K9me3和H3K27me3修饰后,染色质就变得紧致了,转录因子无法插入(好羞涩)。H3K4me3和H3K27ac修饰后,染色质就变得很松散,转录因子和RNA聚合酶就更容易结合到DNA上,就像下面这样:



你要问这是啥?傻孩子,这就是课题啊,表达差异如果做到转录调控,那就需要做到更深层的表观遗传,这样才好报下来课题。呃,不要这么功利吧……好了,郭大腿也已经带你们上路了,能不能在这条路上撒欢,就看你们自己了,今天就策到这里吧。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多