分享

一文读懂LEFSE:组间Marker筛选好工具

 微微悦明 2021-12-13

LEFSE分析即LDA Effect Size分析,是一种用于发现生物标识(Biomarker)的分析工具,可用于两个或多个组的比较,所查找的生物标识可以是OTU、菌种、通路等各种类型。目前被广泛的应用于微生物多样性分析中。

LEFSE官方地址:

https://github.com/biobakery/lefse

https://pubmed.ncbi.nlm./21702898/

本文分为以下几个章节,详解了Lefse的使用和功能:

  1. LEFSE软件的下载及安装

  2. LEFSE输入文件的准备

  3. LEFSE运行命令详解

  4. 在线LEFSE运行方法

1、LEFSE软件下载及安装

方法一:

使用Conda安装的方法:

conda install -c biobakery lefse

Conda的安装方法,可参考前贴《善用Bioconda,管理好自己的Linux工具库

方法二:

使用Docker安装的方法

docker run -it biobakery/lefse bash

Docker的安装和使用方法,可参考前贴《Docker安装实战记录

2、LEFSE输入文件的准备

注:lefse其实运行起来很简单,但是其对于输入文件格式还是有一定要求的。如果输入文件错误,那无论是怎么都运行不出来结果的。因此对于输入文件的准备,本文单独列出强调。


请注意

注意1:输入文件建议是文本文件(*.txt)。其他格式也不是不可以,但对于不熟悉的同学使用时很容易出错误,txt比较保险。
注意2:输入文件内容一定是矩阵文件!每行为一个指标。每列为一个样本。
注意3:矩阵文件的间隔符(每列和每列的间隔)一定是tab键的制表符,不能是其他符号,比如空格、逗号等,都不可以。
注意4:对于在所有样本中总计为0的指标(简单的理解,就是该菌or物种在所有样本中都不存在),需要删除该行。
注意5:每行(每个指标)在样本中的数值应为百分比,而不是绝对数。如为绝对数,需要先行均一化。
注意6:输入文件的格式决定了后期分析时的参数。如第一行为样本名,则分析时-u参数需设置为1;第二行为分组名,则分析时-c 参数需设置为2.

示例输入文件如下所示:

3、LEFSE程序的运行及命令详解

第一步:启动运行环境(对于bioconda安装的用户,此步必需)

source activate lefse

第二步:处理输入文件

lefse-format_input.py <Inputfile> <Outputfile> -c 2 -u 1 -o 1000000##示例# lefse-format_input.py input.txt input.lefse -c 2 -u 1 -o 1000000

第三步:计算各feature的LDA值

run_lefse.py <Inputfile> <Outputfile>##示例# run_lefse.py input.lefse input.lda

注: 默认LDA值cutoff为2,如需调整,可使用-l 参数。

第四步:绘制LDA柱状图

lefse-plot_res.py input.lda input.png

如需要pdf格式的图,可使用参数--format pdf

柱状图只显示LDA大于cutoff(默认为2)的指标,如为两个组标记,则反向显示不同组的指标,但如果是多个组(3组及以上),则不再区分方向,仅用颜色标记。

两组比较LDA柱状图:

多组比较LDA柱状图:

第五步:绘制进化分支图

如我们使用的feature是菌种或菌属,那么筛选出来的具有组间特异性的marker(也就是某几个菌种)在进化上有可能是相同的或有一定的分布特点,我们可以通过绘制进化分支图来查看。

lefse-plot_cladogram.py input.res input.cladogram.png --format png

如需要pdf格式的图,可使用参数--format pdf

第六步:绘制各marker的丰度分布柱状图(一个marker一张图)

lefse-plot_features.py input.lefse input.lda outputfiledir#示例 lefse-plot_features.py input.lefse input.lda ./

4、在线运行LEFSE

不想或不会命令行操作的同学们可以选择在线运行LEFSE软件。方法如下:

第一步:访问网址 

http:///galaxy/

第二步:上传数据

点击左侧菜单页的"Get Data"上传数据。

再次提醒注意文件格式!

第三步:开始分析

点击左侧菜单栏“LEFSE”,安装ABCDEF的顺序依次操作

结果既可以在线查看,也可以下载保存。

每一天获得一点微小的收获和进步。小确幸的科研也很好。与君共勉! 


微信号:

Mypathogen

微微悦明

科学的乐趣是获得新知识的喜悦

高通量测序、大数据

病原微生物检测和监测

健康大数据行业资讯记录与分享

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多