咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程! 下面是100个lncRNA组装流程的软件的笔记教程bamCoverage是deeptools下的一个工具,主要用于BAM转换为bigWig
deeptools是基于Python开发的一套工具,用于处理诸如RNA-seq, ChIP-seq, MNase-seq, ATAC-seq等高通量数据。工具主要用途: - BAM和bigWig文件处理 - 质量控制 - 热图和其他描述性作图 - 其他
一、软件安装使用conda安装 conda install deeptools
二、bamCoverage的用法安装完成以后,可以使用bamCoverage -h来查看软件的帮助文档。 1. 软件用法:2.常用参数:-b # 输入bam文件 -o # 输出 -p # 线程数 -e/--extendReads # 拓展了原来的read长度 -bs/--binSize # 设置分箱的大小
--filterRNAstrand {forward, reverse}: 仅统计指定正链或负链 --region/-r CHR:START:END: 选取某个区域统计
#为了其他结果进行比较,还需要进行标准化,deeptools提供了如下参数: --scaleFactor: 缩放系数 --normalizeUsing {RPKM,CPM,BPM,RPGC,None} --normalizeTo1x: 按照1x测序深度(reads per genome coverage, RPGC)进行标准化 --ignoreForNormalization: 指定那些染色体不需要经过标准化
三、输入文件bam文件
四、软件运行命令批量运行 ls /home/data/lihe/lncRNA_project/04.mapping/*.bam > 1 ls /home/data/lihe/lncRNA_project/04.mapping/*.bam | cut -d "/" -f 7 | cut -d "_" -f 1 | cut -d "." -f 1 > 0 paste 0 1 > config
cat > bw.sh
config=$1 number1=$2 number2=$3 cat $1 | while read id do if((i%$number1==$number2)) then arr=(${id}) input=${arr[1]} sample=${arr[0]} bamCoverage -p 2 -b ${input} -o ./${sample}.bw fi ## end for number1 i=$((i+1)) done
for i in {0..4} do (nohup bash bw.sh config 5 $i 1>log.$i.txt 2>&1 & ) done
命令参数解读: -p 2 # 设置线程数为 -b ${input} # 输入bam文件 -o ./${sample}.bw # 输出文件
五、结果解读输出文件为bw文件 bigWig是wig或bedGraph的二进制版,存放区间的坐标轴信息和相关计分(score),主要用于在基因组浏览器上查看数据的连续密度图,可用`wigToBigWig`从wiggle进行转换。
为什么要用bigWig? 主要是因为BAM文件比较大,直接用于展示时对服务器要求较大。因此在GEO上仅会提供bw,即bigWig下载,便于下载和查看 文末友情推荐与十万人一起学生信,你值得拥有下面的学习班:
|