CNVnator是一款CNV检测软件,基于Read-Depth的分析策略,通过对全基因组测序数据进行分析来预测CNV, 源代码保存在github上,网址如下
这个软件的安装比较复杂,我这里直接使用别人装好的docker镜像进行处理,这也是docker的方便之处,直接从源中下载别人已经装好的cnvnator的镜像,代码如下
具体的分析步骤如下 1. EXTRACTING READ MAPPING FROM BAM/SAM FILESCNVnator中依赖 这一步将比对的信息存储到后缀为root的文件中,代码如下 cnvnator -root file.root -tree chr1.bam -chrom 1
2. GENERATING A READ DEPTH HISTOGRAM这一步是按照固定大小的窗口对基因组进行划分,统计每个窗口内的read depth, 代码如下 cnvnator -root file.root -his 1000 -chrom 1 -d genome_fa_dir
3. CALCULATING STATISTICS这一步是必须的,代码如下 cnvnator -root file.root -stat 1000
4. Partition这一步进行segmentation,代码如下 cnvnator -root file.root -partition 1000
5. Call CNVs这一步分析每个segment区域的CNV, 代码如下 cnvnator -root file.root -call 1000 > cnv.call.txt
输出文件的内容如下 第一列为CNV的类型,包括了deletion和duplication两种类型,第二列为CNV的染色体区域,第三列为CNV的长度,第四列为归一化之后的read depth, 归一化到0-1的范围,第五列到第八列为不同的evalue值,最后一类为q0, 后五列对应的解释如下 对于原始的cnv call的输出,还可以通过软件自带的脚本转换为VCF格式,代码如下 cnvnator2VCF.pl cnv.call.txt >cnv.vcf CNVnator的功能强大,运行速度快,更多用法请参考官方文档。 ·end· |
|