分享

snakemake 学习笔记1

 育种数据分析 2021-11-18
snakemake是一个写流程的工具, 功能非常强大, 特别是针对批量化处理时, 效率很高, 而且语法非常人性化, 下面是一个简单的示例, 介绍怎么用snakemake书写自己的第一个程序. 

1, snakemake介绍

Snakemake是用Python3写的一个流程化工具, 非常方便. 官网上的例子有点难度, 这里用最简单的案例解释一下snakemake的应用方法.
安装方法

easy_install3 snakemake

或者:

pip3 install snakemake

也可以从源文件安装:

git clone https:///snakemake/snakemake.git
cd snakemake
virtualenv -p python3 .venv
source .venv/bin/activate
python setup.py install

2, 一个简单的案例

思路:

  • 1, 生成一个1.txt文件

  • 2, 生成一个2.txt文件

  • 3, 使用cat命令, 将两者合并为hebing.txt

echo "hello number1" >1.txt
echo "hello number2" >2.txt
cat 1.txt 2.txt
cat 1.txt 2.txt >hebing.txt

3, 生成snakemake脚本

生成一个名为:Snakemake的文件

(base) [dengfei@localhost example]$ cat Snakefile
rule test_cat:
input:
"1.txt",
"2.txt"
output:
"hebing.txt"
shell:
"cat {input} >> {output}"

这里有四个参数:

  • rule: 是名称, 这里命名为test_cat

  • Input: 输入文件, 这里是”1.txt”, “2.txt”

  • Output: 输出文件, 这里是”hebing.txt”

  • Shell: 这里是要执行的脚本, 输入文件是{input}, 输出文件是{output}

4, snakemake -np

使用-np查看转化后的命令

(base) [dengfei@localhost example]$ snakemake -np

rule test_cat:
input: 1.txt, 2.txt
output: hebing.txt
jobid: 0

cat 1.txt 2.txt >> hebing.txt
Job counts:
count jobs
1 test_cat
1

5, 执行命令 snakemake

snakemake默认执行的文件名是: Snakemake, 如果想要指定自己编写的文件名, 可以加上参数: —snakefile
比如: 文件名为a.snake

snakemake --snakefile a.snake

如果文件名是默认的Snakemake, 不用加参数, 直接运行snakemake即可直接执行.

(base) [dengfei@localhost example]$ snakemake
Provided cores: 1
Rules claiming more threads will be scaled down.
Job counts:
count jobs
1 test_cat
1

rule test_cat:
input: 1.txt, 2.txt
output: hebing.txt
jobid: 0

Finished job 0.
1 of 1 steps (100%) done

查看结果:

(base) [dengfei@localhost example]$ cat hebing.txt
hello number1
hello number2

可以看到, 使用snakemake, 成功的将1.txt 和2.txt 合并为hebing.txt.

6, 运行成功, 重新运行时

显示Nothing to be done, 即不会执行.

(base) [dengfei@localhost example]$ snakemake
Nothing to be done.

如果heibng.txt文件被删掉了, 再执行, 就会重新执行.

这是一小步, 也是一大步.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多