分享

标本馆之旅 | 175岁的US标本馆如何一路走在学科前沿——开放与包容

 kibcat 2023-09-13

作者:刘广宁(国家植物园),刘彬彬(中国科学院植物研究所)

图片来源:美国国家自然历史博物馆网站

Image

美国国家自然历史博物馆与中轴线(National Mall)景观

在这个崇尚年轻化的时代,除了博物馆,还有什么地方能沉淀岁月并默默积累呢,那就是所有植物科学家和爱好者最熟悉的标本馆了。这些分布在世界各地,安静地坐落在大型博物馆、研究机构、植物园中的标本馆可能鲜为人知,但其实它们都扮演着重要的角色,为植物学研究、植物多样性保护和教育提供了宝贵的资源。其中很多著名的标本馆都是植物学家向往的科研殿堂,笔者有幸在美国国家自然历史博物馆的US标本馆学习工作了三年时间,相较于大家对标本馆古老、陈旧的刻板印象,这个历史悠久的标本馆巨人其实一直用她的开放与包容帮助着全世界的植物学家开展研究工作,并一直不断引领着学科前沿。今天我们就一起来认识一下美国的US标本馆。

美国国家标本馆成立于1848年,虽然不是世界上最古老的植物标本馆,但是这个具有175年历史的标本馆巨人在其快速成长的这一百多年里,凭借历史上多次的探险科考活动和殖民地占领,已经凭借500万份的馆藏跻身于世界上馆藏标本数量前十名的标本馆,(第一为收藏了约950万份标本的法国巴黎自然历史博物馆博物馆(P),成立于1793年,比US标本馆大了近50岁)。

世界上多数标本馆都是依托于博物馆、大学、研究机构和植物园来建设的,US标本馆也不例外,US标本馆所在的美国国家自然历史博物馆的上级主管部门是美国史密森研究院,Smithsonian Institution(SI)。SI号称是世界最大的,集博物馆、教育、科研于一体的综合体。它在美国的地位相当于我们中国的中国科学院。该机构成立于1846年,得名于英国科学家詹姆斯.史密森(James Smithson),他捐赠资金来建立这个机构,旨在“增加和扩散知识”。SI共包括了19个博物馆、21个图书馆、9个研究中心和动物园,以及分布于美国45个州以及波多黎各和巴拿马的200多个附属科研机构。其中11个博物馆和艺术馆集中在华盛顿特区(DC)的中轴线上,也是DC最主要的旅游打卡点。它们与最东边的美国国会大厦(U.S. Capital)、最西边的华盛顿纪念碑(Washington Monument)和林肯纪念馆(Lincoln Memorial)和旁边的白宫(White House)组成了华盛顿特区最著名的中轴线景观National Mall(图1)。秉承着“增加和扩散知识”的宗旨,这些世界首屈一指的博物馆和美术馆全部免费开放,无论你是普通游客还是专业的研究人员,都可以平等地获取所需要的信息和资源。

Image
Image

图1: 华盛顿特区的中轴线National Mall景点分布图

US标本馆所在的美国国家自然历史博物馆(The National Museum of Natural History)最早位于Smithsonian的城堡(图2),这是SI最早的一栋建筑(1849年),后来又转移到艺术与工业大楼,也就是现在的艺术与工业博物馆(Arts and Industries Museum),直到1911年6月,国家自然历史博物馆大楼正式启用,位于Smithsonian城堡的正对面,成为了世界上最大的自然历史博物馆之一(图3)。相较于博物馆的全景图,可能大部分人对那只位于博物馆一楼大厅的非洲象标本具有更多的印象,它是该博物馆的主要标志之一,在很多动画片和电影中都出现过(图4)。

Image

图2 史密森学会城堡“the Castle”

Image

图3 美国国家自然历史博物馆

Image

图4 美国国家自然历史博物馆内景与非洲象标本

美国国家自然历史博物馆包含了7个不同的系,人类系(Anthropology)、植物系(Botany)、昆虫系(Entomology)、无脊椎动物系(Invertebrate)、矿物科学系(Mineral Sciences)、古生物系(Paleobiology)、脊椎动物系(Vertebrate Zoology),每一个系的科研工作都是享誉世界。其中植物系和古生物系是与我们植物学研究工作最相关的,植物系的主体工作全都是围绕标本馆展开的。

接下来我们就从标本馆的机构人员组成、馆藏标本管理和科学研究三个方面来深入了解一下美国US标本馆,看它的开放与包容是如何让这位175岁的老者一直引领在学科前沿的。

PART.01
Image

US标本馆的全球化人员配置

植物系标本馆的人员主要分为4大类。Administrative staff行政管理人员,Research staff研究人员,collections staff采集人员,这相当于我们标本馆的管理人员,还有一类叫resident affiliates,这一部分包括退休人员和博士后。这里的退休人员名义上虽然退休,但是工作依然进行。在标本馆经常可以看到佝偻着背的白发老先生在办公室和标本架之间穿梭,有时不禁感叹,植物学研究可真是一个可以让人延年益寿的工作。

目前US标本馆目前在职的科研人员数量其实并不多,只有7个人,但他们每个人都是当前国际上几个大科的领导者,比如说,文军领导的葡萄科研究,Paul Peterson的禾本科,Eric Schuettpelz的蕨类植物,蕨类植物的PPG系统就是他领导的。还有Laurence Dorr的锦葵科,Warren Wagner的柳叶菜科,Kenneth Wurdack的大戟科(图5)。他们每个人不仅在做类群研究,而且也在开展世界不同地区的区系研究。Pedro Acevedo是波多黎各人,所以他就在加勒比海地区开展了很多工作,并采集了大量标本。文军教授的工作更关注东亚,所以也为美国国家植物标本馆贡献了很多东亚的标本。Warren Wagner的工作集中在太平洋岛屿,所以就采集了很多太平洋岛屿(主要是夏威夷群岛)上的植物标本。Laurence在南美洲的危地马拉和非洲的马达加斯加群岛开展了很多区系研究,同时采集了很多标本。这样的科研阵容极大的体现了US标本馆在人员布局上的多元性,几位顶尖植物学家不仅分布不同科、属,同时她们不同的种族背景也充分体现了研究地域的多元性。

Image

图5 US标本馆科研人员简介

相比于科研人员,US标本馆的管理人员就很多了(图6),得益于SI的管理机制,它们有足够的经费支持,来维护博物馆和标本馆的运行和支付管理人员的工资。标本的收集、保存、登记、管理是一项耗时又繁琐枯燥的工作,有了这些专职的管理和技术人员,标本馆才能维持正常的运行,这些专职管理人员的存在非常重要,他们既保障了标本馆的正常运行,也是科学家的得力助手。

Image
Image

图6:US标本馆的管理人员

PART.02
Image

US标本馆的馆藏标本的收集与数字化管理

介绍完US标本馆的基本情况,接下来我们要来看看这位175岁的巨人是如何积累了500万份标本(图7),又是如何管理并向全世界植物学者们提供帮助和服务的,以及这种开放性为标本馆带来的价值与收益。

Image
Image

图7:US标本馆内部与植物标本保存

US目前馆藏标本总数约500万件,约占美国植物收藏资源的8%。它尤其引以为傲的就是模式标本的收集量丰富,约115,000件。历史上许多次的探险科考活动为标本馆输送了来自全世界范围的大量的标本。尤其是新热带地区、北美、太平洋岛屿、菲律宾和印度大陆的收集特别丰富。通过标本分布的统计分析图(图8)和热图(图9)可以看出目前US标本馆收集到的标本在全球的分布情况:标本采集密度大的地方就是北美,其次是南美洲,再就是美国以前的殖民地地区,比如亚洲的菲律宾、日本、巴布亚新几内亚地区,还有非洲的南非和马达加斯加地区。US标本馆的标本收集在世界范围内分布也十分广泛,北美以外的标本数量与本地标本数量各占一半,分布相对平衡。

Image

图8:US国家植物标本馆标本分布

Image

图9:US标本馆标本分布全球热图

达到500万份分布全世界的标本馆藏对一个175年历史的标本馆来说如果还算是顺理成章,但接下来要说的,则真的是要让全世界的植物学家和爱好者们拍手称赞、欢欣鼓舞。近10年来,US国家植物标本馆花费大量时间和精力干的一件事,就是植物标本的数字化项目。为此,它们外包给德国的一个数字化公司(Dutch digitization company Picturae)来进行标本的数字化提取,以保证高质量的标本照片(图10),专业的事交给专业的人干,这种思路是非常可取的。截止2022年5月份,已经全部完成US标本馆所有标本的数字化任务。近500万份的馆藏标本的高清数字化照片全部上传到网上,全世界的植物爱好者都可以免费查阅(图11)。根据网站介绍,现在他们所有的原始照片数据存放在3个数据库。第一个数据平台是US标本馆自己的网站,https://collections.nmnh./search/botany/,所有数字化的标本已经全部上传到这个网站,统计显示有453万2576份数字化标本照片,而且有便捷的查询系统,通过输入相关的科属、采集时采集人等信息就可以方便的查询(图11,12)。

Image
Image

图10:US标本馆标本数字化工作间

Image

图11:US标本馆数字标本查询系统

Image
Image

图12 数字化后的高清标本照片

第二个数据库是全球生物多样性信息服务网络平台GBIFhttps://www./,这里显示有406万1174份,GBIF是一个综合的生物多样性信息平台,其网站上综合了很多动植物资源和信息,总部在瑞典的乌普萨拉。

第三个数据平台是美国国家自然科学基金委建立的iDigBio,https://www./portal/search,显示有448万9646份。最重要的一点,这些数字化的标本从这些网站都可以免费下载到高清的原始照片。美国其他的几个大馆,比如哈佛大学标本馆A还有纽约植物标本馆NY也都完成了这项工作,而且也都把高质量的照片放在了网上,供全世界的学者和爱好者们查看和下载。

US标本馆投入了巨大的财力来完成标本数字化这件事情,甚至直接压缩了其他科研上的投入。这不得不说是一个里程碑式的壮举,分类学家们再也不用把大量的时间耗费在标本的搜集和查找上了,甚至坐在家里的电脑前就可以轻松看到全世界的标本。那我们不禁要问,为什么国家自然历史博物馆要投入如此巨额的财力来完成一项在我们看来为他人作嫁衣裳的事情?笔者认为除了在秉承SI一直以来的对知识开放与包容的理念之外,也是在做一件引领和开拓植物学研究研究的大事情。接下来介绍US标本馆的科研情况就可以窥见一二。

PART.03
Image

开放平台为US标本馆的科学研究创新奠基

US标本馆在十年前就启动这个耗资巨大的标本数字化项目,如果说前几年我们还不明白它们想要干什么。从最近openAI公司推出的chatGPT来看的话,人工智能将在各个行业带来的技术革新已经不容置疑,深度学习肯定是未来各个行业的发展方向。我认为,US标本馆早在十几年之前就已经预测到了这个未来,并开始在这个领域布局筹谋,鼓励科研创新。早在2020年,佛罗里达大学的Pamela Soltis就在Applications in Plant Sciences这个杂志组织了一个special issue。Machine Learning in Plant Biology: Advances Using Herbarium Specimen Images。当时这个专辑中使用到的方法主要还是使用带有标签的有监督学习来进行分类,也是目前我们很多植物科普软件使用的手段,这一技术还不是最前沿的,无法让算法自我学习,所以说这个专辑的出现,并没有在业界掀起大的风浪,但也让大家嗅到了学科发展的新方向。

US标本馆主任Eric从2018年开始,连续主持了2个关于数字化标本和机器学习的项目。第一个是利用机器学习技术加深我们对数字化标本的认识;第二个是关于动植物互作的课题。Eric 2018年开始做关于机器学习的第一个课题的时候,他可能也不知道机器学习的未来在什么地方。这种探索性的研究需要耗费大量的时间和经费,经过长时间的积累才能取得成果。SI的科研环境给了科研人员充分的自由和经费,鼓励他们去探索未知的领域,并愿意为这些创新性探索性的研究提供基础保障,比如标本的数字化项目、可供科研人员免费使用的大型服务器(图13:Hydra: https://confluence./display/HPC/High Performance Computing)。这样的机制允许那些有想法的人尝试新的东西,可能几年甚至10年没有成果,也有可能某个人探索的某个方向恰恰与学科的发展方向相悖,最后销声匿迹。但是10个人的探索,有一个人成功了,他就引领了这个行业的未来。所以说,相信Eric从2018年到现在一定已经积累了如何使用机器学习处理植物标本图像的经验,在不久的将来也许就会可以推出一个令人震惊的成果。

Image
Image

图13:供科研人员免费使用的大型服务器

Image

在这个科技飞速发展的时代,即使是保存标本的标本馆也一样要不断追寻科技发展的浪潮,只有时刻引领在学科前沿,秉持开放与包容的态度,才会永葆活力、屹立不倒。
Image
Image

END

国家植物标本资源库

微信号 : cvh_wx

网址:https://www.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多