分享

Newick Subtree | 获取目标物种树,快速从已发表进化树中提取

 生信药丸 2023-07-04 发布于贵州

写在前面

过两天,我即回贵阳陪家人( = 换个地方加班)。收到支持 TBtools 开发的老友发来一个 feature request。大体是前述我写了一个 notung 界面化插件,可以用于分析「基因在物种演化尺度上的获得与丢失」。这个插件,需要一个「物种树」。自然,我想起来的是,直接使用早前提到的 「基于物种科学双名直接重构进化树」。但这个功能似乎不够完善。于是有了今天的推文。

实际场景

首先,我们计划拿到下述列表对应的物种树

Hevea_brasiliensisPopulus_trichocarpaFragaria_vescaPrunus_persicaCucumis_sativusPhaseolus_vulgarisLotus_japonicusCicer_arietinumMedicago_truncatulaGlycine_maxArabidopsis_thalianaTheobroma_cacaoVitis_viniferaPhysalis_pubescensOryza_sativaZea_maysSetaria_italicBrachypodium_distachyonAegilops_tauschiiTriticum_urartuSorghum_bicolorLycoris_radiateHyacinthus_orientalis

于是我用 TBtools 早前功能,

结果如下,很多节点没有拆开,因为之前的方法主要基于界门纲目科,到了属水平,没有分清楚亲缘关系。

于是,我们需要另外想一个办法。

直接从公开发表的大型物种树提取

前述,李德铢老师课题组发表了一个基于质体基因组的超大型物种树。可以用起来。因为物种树放在 figshare 网站,我让网络环境比较好的朋友帮忙下载下来,得到结果如下。

逻辑上,从这个超级大树提取即可。由于这个树是基于保守质体基因构建的,每个物种可能纳入了多个片段,所以ID上比较复杂。为此,我优化了「Newick Subtree」功能,做了相应支持,于是现在可以这样。

会看到报错信息,意思是找不到 node。设置左下角 Contain Mode 参数。

写在最后

Emmm,怎么说呢。出来的进化树,枝长或许不是非常妥当,毕竟是子树。不过树结构是没问题的,逻辑上,用于「基因在物种演化尺度上的获得与丢失」完全足够。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多