【原】snakemake 学习笔记1

育种数据分析 2021-11-18

展开全文

snakemake是一个写流程的工具, 功能非常强大, 特别是针对批量化处理时, 效率很高, 而且语法非常人性化, 下面是一个简单的示例, 介绍怎么用snakemake书写自己的第一个程序.

1, snakemake介绍

Snakemake是用Python3写的一个流程化工具, 非常方便. 官网上的例子有点难度, 这里用最简单的案例解释一下snakemake的应用方法.
安装方法

easy_install3 snakemake

或者:

pip3 install snakemake

也可以从源文件安装:

git clone https:///snakemake/snakemake.git
cd snakemake
virtualenv -p python3 .venv
source .venv/bin/activate
python setup.py install

2, 一个简单的案例

思路:

1, 生成一个1.txt文件
2, 生成一个2.txt文件
3, 使用cat命令, 将两者合并为hebing.txt

 echo "hello number1" >1.txt
 echo "hello number2" >2.txt
 cat 1.txt 2.txt 
 cat 1.txt 2.txt >hebing.txt

3, 生成snakemake脚本

生成一个名为:Snakemake的文件

(base) [dengfei@localhost example]$ cat Snakefile 
rule test_cat:
    input:
        "1.txt",
        "2.txt"
    output:
        "hebing.txt"
    shell:
        "cat  {input}  >> {output}"

这里有四个参数:

rule: 是名称, 这里命名为test_cat
Input: 输入文件, 这里是”1.txt”, “2.txt”
Output: 输出文件, 这里是”hebing.txt”
Shell: 这里是要执行的脚本, 输入文件是{input}, 输出文件是{output}

4, snakemake -np

使用-np查看转化后的命令

(base) [dengfei@localhost example]$ snakemake -np

rule test_cat:
    input: 1.txt, 2.txt
    output: hebing.txt
    jobid: 0

cat  1.txt 2.txt  >> hebing.txt
Job counts:
    count    jobs
    1    test_cat
    1

5, 执行命令 snakemake

snakemake默认执行的文件名是: Snakemake, 如果想要指定自己编写的文件名, 可以加上参数: —snakefile
比如: 文件名为a.snake

snakemake --snakefile a.snake

如果文件名是默认的Snakemake, 不用加参数, 直接运行snakemake即可直接执行.

(base) [dengfei@localhost example]$ snakemake
Provided cores: 1
Rules claiming more threads will be scaled down.
Job counts:
    count    jobs
    1    test_cat
    1

rule test_cat:
    input: 1.txt, 2.txt
    output: hebing.txt
    jobid: 0

Finished job 0.
1 of 1 steps (100%) done

查看结果:

(base) [dengfei@localhost example]$ cat hebing.txt 
hello number1
hello number2

可以看到, 使用snakemake, 成功的将1.txt 和2.txt 合并为hebing.txt.

6, 运行成功, 重新运行时

显示Nothing to be done, 即不会执行.

(base) [dengfei@localhost example]$ snakemake
Nothing to be done.

如果heibng.txt文件被删掉了, 再执行, 就会重新执行.

这是一小步, 也是一大步.

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：育种数据分析 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

育种数据分析

关注对话

TA的最新馆藏

单倍型分析：个体所对应的单倍型是？
如何利用系谱或者SNP数据划分家系？
如何利用DeepSeek的API搭建本地知识库
群体遗传三剑客第三篇：megacc和ggtree进化树分析
如何计算群体中的单倍型频率
R语言协变量的方差分析和Genstat结果对比

喜欢该文的人也喜欢更多

热门阅读换一换