分享

不同版本坐标转换工具CrossMap

 Hobart_joe 2019-09-11

人类参考基因组有多个版本,在分析中,我们可能会用到不同的版本,抑或有事我们得到的bedbam或者vcf文件并非我们想要的参考基因组的,这时便可以通过CrossMap进行坐标转换。

1、安装

一般来说是可以通过conda来安装的,但是由于我的anaconda安装的是3.x版本的,而CrossMap需要Python2.7,因此未能使用conda进行安装。这里使用的是python2的pip工具进行安装的,CrossMap的依赖如下:

# 先创建Python2环境
$ conda create --name py2 python=2.7
# 激活py2环境
$ source activate py2
$ pip install CrossMap --upgrade

# 退出环境
$ source deactivate 

2、使用

CrossMap支持多种文件的坐标转换:

  • BAM or SAM format.

  • BED or BED-like format. BED file must has at least 3 columns (‘chrom’, ‘start’, ‘end’).

  • Wiggle format. “variableStep”, “fixedStep” and “bedGraph” wiggle line are supported.

  • BigWig format.

  • GFF or GTF format.

  • VCF format.
    将hg19的bed文件转换为b37(GRCH37)的bed文件:

# 在转换前需要先去官网(http://crossmap./)下载版本坐标对应文件
$  wget http:///projects/crossmap/files/chain_files/hg19ToGRCh37.over.chain.gz/download -O hg19ToGRCh37.over.chain.gz
# 坐标转换
$ which CrossMap.py
/usr/bin/CrossMap.py
$ python CrossMap.py bed  hg19ToGRCh37.over.chain.gz TruSeq_exome_targeted_regions.hg19.bed TruSeq.b37.bed

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多