LEFSE分析即LDA Effect Size分析,是一种用于发现生物标识(Biomarker)的分析工具,可用于两个或多个组的比较,所查找的生物标识可以是OTU、菌种、通路等各种类型。目前被广泛的应用于微生物多样性分析中。 LEFSE官方地址: https://github.com/biobakery/lefse https://pubmed.ncbi.nlm./21702898/ 本文分为以下几个章节,详解了Lefse的使用和功能:
1、LEFSE软件下载及安装 方法一: 使用Conda安装的方法: conda install -c biobakery lefse Conda的安装方法,可参考前贴《善用Bioconda,管理好自己的Linux工具库》 方法二: 使用Docker安装的方法 docker run -it biobakery/lefse bash Docker的安装和使用方法,可参考前贴《Docker安装实战记录》 2、LEFSE输入文件的准备 注:lefse其实运行起来很简单,但是其对于输入文件格式还是有一定要求的。如果输入文件错误,那无论是怎么都运行不出来结果的。因此对于输入文件的准备,本文单独列出强调。 请注意 3、LEFSE程序的运行及命令详解 第一步:启动运行环境(对于bioconda安装的用户,此步必需) source activate lefse 第二步:处理输入文件 lefse-format_input.py <Inputfile> <Outputfile> -c 2 -u 1 -o 1000000 ##示例 # lefse-format_input.py input.txt input.lefse -c 2 -u 1 -o 1000000 第三步:计算各feature的LDA值 run_lefse.py <Inputfile> <Outputfile> ##示例 # run_lefse.py input.lefse input.lda 注: 默认LDA值cutoff为2,如需调整,可使用-l 参数。 第四步:绘制LDA柱状图 lefse-plot_res.py input.lda input.png 如需要pdf格式的图,可使用参数--format pdf 柱状图只显示LDA大于cutoff(默认为2)的指标,如为两个组标记,则反向显示不同组的指标,但如果是多个组(3组及以上),则不再区分方向,仅用颜色标记。 两组比较LDA柱状图: 多组比较LDA柱状图: 第五步:绘制进化分支图 如我们使用的feature是菌种或菌属,那么筛选出来的具有组间特异性的marker(也就是某几个菌种)在进化上有可能是相同的或有一定的分布特点,我们可以通过绘制进化分支图来查看。 lefse-plot_cladogram.py input.res input.cladogram.png --format png 如需要pdf格式的图,可使用参数--format pdf 第六步:绘制各marker的丰度分布柱状图(一个marker一张图) lefse-plot_features.py input.lefse input.lda outputfiledir #示例 lefse-plot_features.py input.lefse input.lda ./ 4、在线运行LEFSE 不想或不会命令行操作的同学们可以选择在线运行LEFSE软件。方法如下: 第一步:访问网址 http:///galaxy/ 第二步:上传数据 点击左侧菜单页的"Get Data"上传数据。 再次提醒注意文件格式! 第三步:开始分析 点击左侧菜单栏“LEFSE”,安装ABCDEF的顺序依次操作 结果既可以在线查看,也可以下载保存。 每一天获得一点微小的收获和进步。小确幸的科研也很好。与君共勉! |
|