分享

一个开放源码的图像数据库,为海洋探索解锁人工智能的力量

 netouch 2023-04-30 发布于北京

Introducing FathomNet: New open-source image databa<em></em>se unlocks the power of AI for ocean exploration

MBARI和其他研究机构之间的一项新的合作努力是利用人工智能和机器学习的力量来加速研究海洋的努力。

为了应对气候变化和其他威胁的影响,研究人员迫切需要更多地了解海洋生物、生态系统和过程。随着科学家和工程师开发先进的机器人技术,可以可视化海洋生物和环境,以监测海洋健康状况的变化,他们面临着一个基本问题:图像、视频和其他可视化数据的收集大大超出了研究人员的分析能力。

FathomNet是一个开源的图像数据库,它使用最先进的数据处理算法来帮助处理积压的可视化数据。使用人工智能和机器学习将缓解水下图像分析的瓶颈,并加速有关海洋健康的重要研究。

“大海需要大数据。研究人员正在收集大量的视觉数据来观察海洋中的生命。如果没有自动化,我们怎么可能处理所有这些信息?机器学习提供了一个前进的途径,然而这些方法依赖于大量的数据集进行训练。建立FathomNet是为了填补这一空白,”MBARI首席工程师Kakani Katija说。

项目联合创始人Katija、Katy Croff Bell(海洋发现联盟)和Ben Woodward (CVision AI),以及扩展的FathomNet团队的成员,在《科学报告》最近的研究出版物中详细介绍了这个新图像数据库的开发。

机器学习的最新进展使得对视觉数据进行快速、复杂的分析成为可能,但人工智能在海洋研究中的应用受到了限制,因为缺乏一套标准的现有图像,可以用来训练机器识别和编目水下物体和生命。FathomNet通过聚合来自多个来源的图像来创建一个公开的、精心策划的水下图像训练数据库,从而解决了这一需求。

“在过去的五年里,机器学习在很大程度上是由大量标记数据的集合驱动的,它彻底改变了自动化视觉分析的领域。ImageNet和Microsoft COCO是陆地应用的基准数据集,机器学习和计算机视觉研究人员都在关注这些数据集,但我们甚至还没有开始触及水下视觉分析的机器学习能力的表面,”CVision AI联合创始人兼首席执行官、FathomNet联合创始人Ben Woodward说。

“通过FathomNet,我们的目标是提供一个丰富、有趣的基准,让机器学习社区进入一个新的领域。”

在过去的35年里,MBARI记录了近28000小时的深海视频,收集了超过100万张深海图像。MBARI视频实验室的研究技术人员对这些可视化数据进行了详细的注释。MBARI的视频档案包括大约820万注释,记录了对动物、栖息地和物体的观察。这个丰富的数据集对研究所的研究人员和世界各地的合作者来说是一个无价的资源。

FathomNet整合了MBARI数据集的一个子集,以及来自国家地理和NOAA的资产。

自2010年以来,美国国家地理学会的探索技术实验室一直在部署其自主底栖着陆器平台——深海摄像系统的不同版本,从所有海洋盆地和各种海洋栖息地的位置收集了超过1000小时的视频数据。这些视频随后被输入CVision AI基于云的协作分析平台,并由夏威夷大学和OceansTurn的主题专家进行注释。

2010年,美国国家海洋和大气管理局(NOAA)的海洋探索开始在NOAA的Okeanos Explorer船上使用双远程操作载具系统收集视频数据。超过271太字节的数据被存档,并可从NOAA国家环境信息中心(NCEI)公开访问。NOAA海洋探索最初通过志愿者参与的科学家众包注释,并在2015年开始支持专家分类学家更彻底地注释收集的视频。

“FathomNet是一个很好的例子,说明了合作和社区科学可以促进我们了解海洋的方式取得突破。有了来自MBARI和其他合作者的数据作为骨干,我们希望FathomNet能够帮助加速海洋研究,在了解海洋比以往任何时候都更重要的时候,”Lonny Lundsten说,他是MBARI视频实验室的高级研究技术员、合著者和FathomNet团队成员。

作为一个开源的基于网络的资源,其他机构可以贡献和使用FathomNet,而不是传统的,资源密集型的工作来处理和分析可视化数据。MBARI启动了一个试点项目,使用fathomnet训练过的机器学习模型来注释由远程操作水下航行器(rov)捕获的视频。使用人工智能算法减少了81%的人力投入,并将标签率提高了10倍。

用FathomNet数据训练的机器学习模型也具有革新海洋勘探和监测的潜力。例如,给机器人配备摄像头和改进的机器学习算法,最终可以实现对海洋动物和其他水下物体的自动搜索和跟踪。

“四年前,我们设想使用机器学习来分析数千小时的海洋视频,但当时由于缺乏注释图像,这是不可能的。现在,FathomNet将使这一愿景成为现实,为探险家、科学家和公众提供发现和工具,以加快海洋发现的步伐,”海洋发现联盟创始人兼总裁、FathomNet联合创始人凯蒂·克罗夫·贝尔说。

截至2022年9月,FathomNet包含84,454张图像,代表了来自81个独立集合的175,875个本地化,涉及2243个概念,其他贡献正在进行中。

FathomNet的目标是获得超过20万种动物在不同姿势和成像条件下的1000个独立观察结果,最终将获得超过2亿次的观察结果。为了达到预期的目标,FathomNet需要大量的社区参与——包括来自广泛群体和个人的高质量贡献——以及数据库的广泛利用。

Katija说:“虽然FathomNet是一个基于API的网络平台,人们可以下载标记数据来训练新的算法,但我们也希望它成为一个社区,在这里,来自各种背景的海洋探险家和爱好者可以贡献他们的知识和专业知识,帮助解决与海洋可视化数据相关的挑战,如果没有广泛的参与,这些挑战是不可能实现的。”

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多