絮语: IQ-Tree是2014年新推出的一款基于最大似然法(ML)的建树软件,具有准确、快速、灵活等特点,特别适用于大数据的系统发育分析。该软件的具体功能详见官方网站介绍(http://www./),本文不再赘述,下文简要图解应用IQ-TREE重建ML树。 流程: (1)数据准备: IQ-TREE支持多种序列数据格式,其中Phylip为该软件首选,但也可以直接读取FASTA,程序会自动转为Phylip格式,省去格式转换的步骤,对于新手非常方便。 (2)模型选择: 在应用ML法重建系统发育树前,需要进行核苷酸替换模型的选择,IQ-TREE整合了ModelFinder这个模型选择模块,可以快速获得目的数据的最佳进化模型,推荐使用其替换jModelTest等软件,示例数据基于BIC标准最佳核苷酸替换为GTR+R6,详细操作可见日志《图解核苷酸替代模型的选择 - ModelFinder篇(简明版)》,链接:https://user.qzone.qq.com/58001704/blog/1503471361 (3)ML树重建: 命令格式: ./iqtree-omp -s ./NLV.fas -m GTR+R6 -bb 1000 -alrt 1000 -nt AUTO ./iqtree-omp IQ_TREE的路径,可以是绝对路径,也可以相对路径(需要通过cd命令进入当前目录); -s ./NLV-sample.fas 参数-s 即 sequence,其之后为序列(含路径),可以将序列直接拖入命令运行窗口; -m GTR+R6 参数-m 即model,其后为选定的最佳模型; -bb 1000 参数-bb 即可bootstrap,其后为重复抽样次数,推荐默认1000; -alrt 1000 参数-alrt 即启SH-aLRT检验,其后同样为重复抽样次数,如果不启用该检验,可以直接删除; -nt AUTO 参数-nt即Number of Threads,用于IQ-TREE分析的线程数,可以用AUTO参数让系统自已分配,也可以自己指定 Raindy注:如果需要指定一个outgroup,可以在模型参数之后,添加一个-o 参数用以指定某一条序列为outgroup,如:-o NC_018093_SPVG即将示例中的名称为NC_018093_SPVG指定为outgroup。 (4)结果解析: IQ-TREE建树完成,会在序列目录下生成多个文件,主要包括程序运行日志xx.log、ML树文件(含有BP/SH-aLRT评估分支置信度)和一致树文件xx.contree,可以用Figtree进行查看,将Nodel Label标签下拉菜单选择label(打开树文件前提示,未修改为Label 为默认名称)。 下图为示例数据的最终结果,方法描述可参考:Gao et al, 2018, The first complete genome sequence of narcissus latent virus from Narcissus... Figure 1. Mid-point rooted phylogenetic tree based on the codon-aligned nucleotide sequences of the polyproteins of members of the family Potyviridae. 延伸阅读: 1.Nguyen L-T, Schmidt HA, von Haeseler A, Minh BQ (2014) IQ-TREE: A fast and effective stochastic algorithm for estimating maximum likelihood phylogenies. Molecular biology and evolution 32:268–274. 2.Kalyaanamoorthy S, Minh BQ, Wong TKF, von Haeseler A, Jermiin LS (2017) ModelFinder: fast model selection for accurate phylogenetic estimates. Nature Methods 14:587-589. |
|