|
作为最早分化的被子植物类群之一,睡莲不仅是探索“达尔文讨厌的谜题”(被子植物起源)的关键模型,更承载着深厚的文化与经济价值——比如芡实(Euryale ferox)的种子作为传统中药材,是富含淀粉的滋补佳品。近年来,睡莲全基因组测序、转录组、代谢组等多组学数据持续积累,但数据分散、难以整合分析的问题,一直制约着遗传育种与进化研究的突破。 在此背景下,由海南大学陈飞团队牵头,联合南京农业大学、浙江大学、比利时根特大学等14家单位,历经7年(2018年启动)打造的首个睡莲多组学数据库Water Lily Pond(WLP)正式发表于《Horticulture Research》。该数据库整合了9个睡莲物种的多维度组学资源与实用分析工具,为全球睡莲研究者提供了“一站式”研究平台!
数据库直达 https://bioinformatics.hainanu.edu.cn/waterlily/
WLP数据库概述 WLP的核心优势在于“数据全面性”,涵盖基因组、转录组、蛋白质组、代谢组、表型组等多维度资源,具体数据规模如下: ▶ 基因组数据:9个睡莲物种的11.14 Gb基因组序列,注释基因达 409,321个,同时包含基因家族、转录因子、KEGG通路、GO术语等3,034,356条注释信息;额外收录10个睡莲基因组的甲基化数据、线粒体与叶绿体基因组信息,实现“核-质”基因组全覆盖。 ▶ 转录组数据:213个睡莲样本的转录组数据,包括1.2 Tb从头测序(de novo)序列和1.235 Tb参考引导组装序列,配套141,932个基因表达谱;同时提供小RNA(miRNA)、长链非编码RNA(lncRNA)、环状 RNA(circRNA)的统计分析结果(以小睡莲Nymphaea minuta 为例)。 ▶ 蛋白质组与代谢组:13,467条蛋白质组条目(含小睡莲详细蛋白数据)、1,841个代谢物数据点,覆盖睡莲属(Nymphaea)、莼菜属(Brasenia)、萍蓬草属(Nuphar)等多个类群,包括王莲(Victoria cruziana)、长叶巴克兰睡莲(Barclaya longifolia)等特色物种。 ▶ 表型组数据:187个睡莲物种/栽培品种的表型图像,其中180个栽培品种的花、叶形态照片,5个野生种的花瓣、叶片、茎等组织特异性表型图,直观展示睡莲形态多样性。
七大功能模块WLP 设计了7个核心功能模块,同时配套“图书馆”与“社区” 板块,兼顾“数据查询”与“研究分析”。 ▶ Taxonomy——睡莲目系统分类与物种简介 ▶ Genomics——BLAST、JBrowse、共线性搜索、基因家族比对 ▶ Transcriptomics——eFP基因表达浏览器、热图、非编码RNA分析 ▶ Proteomics——GO/KEGG富集可视化 ▶ Metabolomics——分物种、分功能的代谢物查询与比较 ▶ Phenomics——花、叶等表型高清图像库(180栽培品种+5野生种) ▶ Breeding——病虫害图谱、分子标记设计(Primer)工具、园艺性状数据库 特色内容▶ Horticulture模块:整合花青素含量、开花时间、花香成分、花色变化等关键园艺性状数据,直接服务于观赏睡莲的分子育种。 ▶ 转录因子数据:9个睡莲物种的转录因子信息,为基因调控机制研究提供核心资源。 ▶ Library & Community:汇总睡莲研究相关的文献、专利、开放数据及数据库使用教程,同时搭建交流平台,促进全球研究者协作。 访问与数据共享▶ 所有数据与工具免费开放,支持FASTA、CSV、R脚本等多格式下载。 ▶ 数据已同步至中国国家基因组数据中心。 WLP 作为首个全面的睡莲多组学数据库,不仅填补了 “睡莲多组学数据整合”的空白,更将推动早期被子植物进化、观赏睡莲育种、功能成分开发等领域的研究突破。 参考文献 Water lily pond: a multiomics database for water lilies, Horticulture Research, Volume 12, Issue 6, June 2025, uhaf076, https://doi.org/10.1093/hr/uhaf |
|
|