分享

SNP在染色体上的分布图怎么做?代码搞定

 育种数据分析 2022-09-02 发布于河南

想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子

本文绘制这种图:

每个SNP在染色体上的分布图,也称为SNP密度图,不同的颜色表示1Mb内包含的SNP个数。

用到的R包CMplot

安装方法:

install.packages("CMplot")

数据格式

plink的map格式:

1 1_320344 0 320344
1 1_342499 0 342499
1 1_509942 0 509942
1 1_538165 0 538165
1 1_565638 0 565638
1 1_612572 0 612572
1 1_722644 0 722644
1 1_791066 0 791066
1 1_813662 0 813662
1 1_865366 0 865366

也可以只包括三列数据:

  • 染色体
  • SNP名称
  • 物理位置

代码

library(data.table)
library(CMplot)
map1 = fread("re1.map",header = F)
head(map1)

mm = map1 %>% dplyr::select(SNP = 2,Chromosome=1,Position = 4)
head(mm)

CMplot(mm,plot.type="d",bin.size=1e6,col=c("darkgreen""yellow""red"),
       file="tiff",memo="",dpi=300,file.output=TRUE, verbose=TRUE)

CMplot(mm,plot.type="d",bin.size=1e6,col=c("darkgreen""yellow""red"),
       file="tiff",memo="",dpi=300,file.output=FALSE, verbose=TRUE)

结果

很简单有没有!!!

资源推荐:

编程+统计+数量遗传学,可以通过一个包含数据+R代码+原理解释的GWAS教程达到目的,上手一个项目,比着敲代码,一举多得。下面是我精心整理的学习资料,有我编写的GWAS学习教程,有我收集的入门数据分析资源,有我推荐的最新版R语言电子书,以及我翻译整理的统计遗传学分析导论。

这些资料的特点是:代码,数据,理论介绍都有包括,值得拥有:

1,快来领取 | 飞哥的GWAS分析教程

2,飞哥汇总 | 入门数据分析资源推荐

3,数量遗传学,分享几本书的电子版

4,R语言学习看最新版的电子书不香嘛?

想要有人带的小伙伴,毕竟老司机带,不迷路,更快到达!

扫码加入知识星球:

本星球分享和答疑内容包括:全基因组关联分析(GWAS),全基因组选择(GS),生物统计,数量遗传学,遗传参数评估,涉及R语言、Python等工具。2022年和2023年会加入机器学习和神经网络方面的内容,一起学习不孤单。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多