【原】16s分析之Tax4Fun功能预测使用笔记

微生信生物 2021-01-16

展开全文

有一天我在网上发现了这篇文章（当然我是后知后觉）：

看到了这张图片：

穷人总是想法多，处于做功能预测的需求，而且本人做的是土壤，我看到这里，就想尝试一下这种方法：

官方网址：http://tax4fun./

在readme这里下载

这份完整的教程这里也给出链接：

http://tax4fun./RPackage/Readme_Tax4Fun.pdf

我才用Qiime聚类，通过silva数据库注释：

# seqs.fna为拼接好（单端测序不需要），质控，并且去除嵌合体完成，将所用样本序列合并起来的文件如果没有合并，可以通过cat *.fna > seqs.fna合并

#聚类OTU

pick_otus.py -i seqs.fna -o picked_otus

#挑选丰度最高的OTU为代表序列

pick_rep_set.py -ipicked_otus/seqs_otus.txt -f seqs.fna -o rep_set.fna -m most_abundant

#注释代表序列文件：

assign_taxonomy.py -i ~/Desktop/rep_set.fna-b ~/Desktop/ silvasuuref123nr/SILVA_123_SSURef_Nr99_tax_silva.fasta -t ~/Desktop/silvasuuref123nr/SILVA_123_SSURef_Nr99_tax_silva.tax -m blast -o taxonomy

注意，这里给出参考命令，它使用的115的数据库，但是已经更新到123了，从上面网站下载最新数据库：

这里还需要注意的是：使用Qiime注释非常缓慢，因为默认注释使用单核，可以使用多核。

#这里四核采用如下命令:

parallel_assign_taxonomy_blast.py -i~/Desktop/Shared_Folder/rep_set.fna -b silvasuuref123nr/SILVA_123_SSURef_Nr99_tax_silva.fasta-t silvasuuref123nr/SILVA_123_SSURef_Nr99_tax_silva.tax -o cs_rep_set_taxonomy-O 4 -U start_parallel_jobs.py

# 添加物种信息至OTU表最后一列，命名为taxonomy,我修改了工作目录，请自行修改

biom add-metadata -i otu_table.biom --observation-metadata-fprep_seqs_tax_assignments.txt -o otu_table_tax.biom --sc-separated taxonomy--observation-header OTUID,taxonomy

# 转换biom为txt格式，带有物种注释：

biom convert -i otu_table_tax.biom -ootu_table_tax.txt --to-tsv --header-key taxonomy

#转化txt文件

biom convert -i cs_rep_set_taxonomy/otu_table.biom-o cs_rep_set_taxonomy/otu_table.txt --to-tsv --header-key taxonomy--table-type='OTU table'

最后文件就出来了：

#
#
#下一步进入R操作，这里主要还是安装Tax4Fun包和依赖的包，这里我遇到的问题居多，下面截图是readme文件的参考，请自行查看，但是这里我给出我自己的安装过程：