分享

lncRNA组装流程的软件介绍之bamCoverage

 健明 2021-07-14

咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程

下面是100个lncRNA组装流程的软件的笔记教程

bamCoverage是deeptools下的一个工具,主要用于BAM转换为bigWig

deeptools是基于Python开发的一套工具,用于处理诸如RNA-seq, ChIP-seq, MNase-seq, ATAC-seq等高通量数据。工具主要用途:

- BAM和bigWig文件处理
- 质量控制
- 热图和其他描述性作图
- 其他

一、软件安装

使用conda安装

conda install deeptools

二、bamCoverage的用法

安装完成以后,可以使用bamCoverage -h来查看软件的帮助文档。

1. 软件用法:

image-20210505115314404

2.常用参数:

-b # 输入bam文件
-o # 输出
-p # 线程数
-e/--extendReads # 拓展了原来的read长度
-bs/--binSize # 设置分箱的大小

--filterRNAstrand {forward, reverse}: 仅统计指定正链或负链
--region/-r CHR:START:END: 选取某个区域统计

#为了其他结果进行比较,还需要进行标准化,deeptools提供了如下参数:
--scaleFactor: 缩放系数
--normalizeUsing {RPKM,CPM,BPM,RPGC,None}
--normalizeTo1x: 按照1x测序深度(reads per genome coverage, RPGC)进行标准化
--ignoreForNormalization: 指定那些染色体不需要经过标准化

三、输入文件

bam文件

四、软件运行命令

批量运行

ls /home/data/lihe/lncRNA_project/04.mapping/*.bam > 1
ls /home/data/lihe/lncRNA_project/04.mapping/*.bam | cut -d "/" -f 7 | cut -d "_" -f 1 | cut -d "." -f 1 > 0
paste 0 1 > config

cat > bw.sh

config=$1
number1=$2
number2=$3
cat $1 | while read id
do
    if((i%$number1==$number2))
    then
    arr=(${id})
    input=${arr[1]}
    sample=${arr[0]}
    bamCoverage -p 2  -b ${input} -o ./${sample}.bw 
    fi    ## end for number1
    i=$((i+1))
done


for i  in {0..4}
do 
(nohup bash bw.sh  config 5 $i 1>log.$i.txt 2>&1 & )
done

命令参数解读:

-p 2 # 设置线程数为
-b ${input}  # 输入bam文件
-o ./${sample}.bw # 输出文件

五、结果解读

输出文件为bw文件

bigWig是wig或bedGraph的二进制版,存放区间的坐标轴信息和相关计分(score),主要用于在基因组浏览器上查看数据的连续密度图,可用`wigToBigWig`从wiggle进行转换。

为什么要用bigWig? 
主要是因为BAM文件比较大,直接用于展示时对服务器要求较大。因此在GEO上仅会提供bw,即bigWig下载,便于下载和查看

文末友情推荐

与十万人一起学生信,你值得拥有下面的学习班:

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多