一、EGGNOG-Mapper网页注释
http://eggnog-mapper.embl.de/
注释完成之后会收到通知邮件,通过邮件中的链接下载注释结果 其中,out.emapper.annotations是最终的注释结果 其中,out.emapper.annotations是最终的注释结果 结果文件如下,其中我们最关注的是第十列的GO号以及第十二列的KO号。 这里以提取KO号为例,制作query2ko背景文件,可以以此直接使用TBtools进行富集分析。 提取基因及其映射上的KO号,KO号在第12列 cut -f 1,12 out.emapper.annotations > out.emapper.annotations.query2ko 查看提取结果发现有些基因没有被注释上,需要去掉没有注释的基因以及去掉KO号前面的 注意:需要保持ID的一致性,否则注释不出结果(例如拿来做注释的往往是蛋白序列,一般会包括可变性剪切的标识符AT4G36920.1 去掉没有注释的基因以及去掉KO号前面的 grep -v '-' out.emapper.annotations.query2ko|sed 's/ko://g' > out.emapper.annotations.query2ko.final 整理好的query2ko文件如图 直接使用TBtools进行富集分析 二、本地化EGGNOG数据库及注释
conda install -c bioconda eggnog-mapper
http://eggnog5.embl.de/#/app/downloads download_eggnog_data.py 使用emapper.py脚本进行注释 emapper.py --cpu 80 -i 待注释文件 -o 输出文件名 注释结果整理参考前述的结果整理 写在后面硕士三年匆匆而过,现在也步入新的研究领域,就如同三年前初到914一样。 |
|