对于下图,很多人都不陌生。这是大家做家族分析时常用的MEME motif图。实话说,这图不(太)好(丑)看(了),所以我就想着R语言能不能重新做这个图呢,很早以前不太会用R的时候,就想做,无奈的是,基于自己的水平而放弃了。 借着知识的不断积累,现在觉得是时候重新拾起来了。 (1)上传我们的蛋白质序列到MEME网站(http:///tools/meme) (2)下载MAST.xml文件 (3)对文件解析得到两个文件 一是每一个motif在每一条蛋白上的位置文件,二是每一条蛋白的长度 (这一步在linux中处理) 文件一: 文件二: (4)再准备一个蛋白ID顺序文件(目的是让结果中蛋白的顺序按照你的想法输出) 文件为单列。 (5)主要使用的R包:ggplot2、gggenes、RColorBrewer 第三个包可要可不要,是为了颜色设置,如果不用这个包,默认颜色可能不太好看。 后期会整合到BItools中,本文主要为了学习而用。 有需要代码的,可以与我联系。
|
|