在某篇评估转录组各个分析流程所用软件的文章中,fusioncatcher 被评为分析融合基因的最佳工具,该软件的网址如下
这个软件的安装过程比较繁琐,依赖很多第三方软件,为了简化安装,官方提供了自动化的安装脚本, 用法如下 wget http:///projects/fusioncatcher/files/bootstrap.py -O bootstrap.py
python bootstrap.py -t --download 该脚本会自动下载依赖的软件包并安装。软件的使用相对简单很多,分为以下两步 1. 准备参考基因组fusioncatcher也提供了准备参考基因组的脚本,该脚本会从Ensembl等网站自动下载数据,所以使用时需要联网,用法如下 fusioncatcher-build -g mus_musculus -o /db/mouse -w asia.ensembl.org
对于
该目录下每个物种对应一个文件夹,fusioncatcher就是根据 除了下载文件,该步骤还包括建立索引等费时较长的步骤,所以这一步的运行时间会比较久,需要5-10个小时。 对于 mkdir -p /some/human/data/
cd /some/human/data/
wget http:///projects/fusioncatcher/files/data/human_v90.tar.gz.aa
wget http:///projects/fusioncatcher/files/data/human_v90.tar.gz.ab
wget http:///projects/fusioncatcher/files/data/human_v90.tar.gz.ac
wget http:///projects/fusioncatcher/files/data/human_v90.tar.gz.ad
cat human_v90.tar.gz.* | tar xz
ln -s human_v90 current 2. 运行用法如下 fusioncatcher -d database_directory -i fastq_directory -o output_directory
对于原始序列所在的目录,在该目录下可以同时存在多个样本的结果,软件会自动识别不同样本对应的R1和R2端数据。 由于fusioncatcher内置了质量控制的程序,会自动对 在输出目录中,final-list_candidate-fusion-genes.txt 就是最终预测到的所有融合基因,这个目录下文件很多,每个文件的详细解释可以参考官方文档。 ·end· |
|