分享

新的可变剪切分析软件:McSplicer

 茶与生信 2020-08-16

依据RNA-seq数据进行可变剪切分析的新软件:McSplicer
下面对其使用步骤做一介绍:

(1) 需要准备的文件Files

GTF 文件:基因组自带的,或者是stringtie等软件生成的皆可

BAM文件:已排序,已建好索引(可以用samtools建索引)

(2) 操作步骤Steps

1‘  运行exonRefine将外显子集精炼为不重叠的连续子外显子区域,

./bin/exonRefine  <annotation.gtf> --prefix OUTPUT_PREFIX

2’  对上一步中生成的注释和输入的BAM文件运行SigCount

./bin/sigcount <alignments.bam> <annotation_refined.gtf> <outfile-prefix>

3'  运行McSplucer以获取剪切位点情况估计

python2 ./python_code/McSplicer.py \
        --gtf REFINED_GTF \
        --count_file SIGNATURE_COUNT_FILE \
        --out_dir OUTPUT_DIRECTORY\
        --bootstraps NUM_OF_BOOSTRAPS\
        --read_len READ_LENGTH\
        --prefix OUT_FILE_PREFIX

(3) 结果输出Outputs

输出的csv文件包含bootstrap step,剪接位点索引,基因链,染色体,剪接位点基因组位置和McSplicer剪接位点使用估计。

依赖Dependencies

McSplicer 在 python 2上运行(最好是python 2.7),另外需要:

  • numpy>=1.13.1

  • pandas>=0.20.3

软件背景Reference

文章目前发表在bioRxiv

题目为:McSplicer: a probabilistic model for estimating splice site usage from RNA-seq data

软件使用说明和下载地址:https://github.com/canzarlab/McSplicer

单位:德国慕尼黑大学

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多