国际瞭望|关于地理空间人工智能的五点思考

LibraryPKU 2019-04-24

展开全文

人工智能普遍存在于我们生活的方方面面，从语音识别软件（如iPhone上的Siri）背后的技术，到你的信用评分，或在假释听证会之前评估是否二次犯罪的算法。最近我一直在思考地理空间人工智能（GeospatialAI）的问题，特别是如何借助AI创建来自图像、激光雷达、视频、SAR和其他模式的地理空间数据。以下是我思索的5个话题：

图1.地理空间人工智能

1.地理空间人工智能已经出现而且正迅速发展

几年前，在图像中识别猫或狗的挑战被认为是非常困难的，但在短短几年内，现在用人工智能来做这些工作的成功率非常高（约98%）。正如那句经常被引用的名言：我们“在传感器中游泳，在数据中溺水”，我们的行业需要同样的能力，从可供我们使用的众多平台和传感器中提取数据。大量的地理空间人工智能正在发展，我们必须意识到它，跟踪它的发展，并明智地使用它。地理空间人工智能对所有地理空间专业人员都很重要，无论您是摄影测量师、测量师、工程师、数据科学家、CAD技术人员、数据库管理员还是GIS分析师。

图2.Lidar与正射影像的融合

2.我们需要有的放矢的地理空间人工智能

人工智能产业的最终目标是通用化的人工智能；它可以一次构建并在许多不同的场景中使用。不幸的是，这是相当困难的，而且目前仍然遥不可及。我们的重点是面向特定的问题集，比如从图像定义建筑物足迹。就像在图像中识别猫或狗的挑战一样，描绘建筑物的足迹是一项独特的挑战，与寻找消防栓或描绘道路中心线或水体截然不同。此外，地理因素也很重要，因为一个典型的美国城市的建筑足迹可能与你在欧洲、亚洲或南美所发现的有很大不同。为达到这一目标，我们必须有目的地训练人工智能，记录其优缺点，并审核其结果。

3.训练有素的人工智能开始激增

神经网络（NNs）是地理空间人工智能的基石。神经网络为了发挥作用，需要使用已知的数据集进行训练。就像教育孩子一样，必须给他们提供例子，并在正确的情况下进行强化，直到完成足够多的迭代，使成功率达到可接受的水平。典型的成功率可以远远超过60%，但是根据任务的复杂性可以达到99%。训练数据集是一个热门商品，因为数据必须结构化、加标记和已知。考虑到动态变化的问题集和令人望而却步的管理数据的成本和时间承诺，一些业内人士甚至正在开发综合训练数据的方法。

由SpaceNet等公司赞助的竞赛也在推动神经网络的发展。SpaceNet是一家由DigitalGlobe、NVIDIA和CosmiQWorks组成的联盟，它为开发地理空间人工智能提供现金奖励。SpaceNet基于一个定义的问题集发起竞赛，该问题集包含免费的训练数据和一种公开的评估结果的方法。像这样的活动和在人工智能领域的积极研究，引发了公开可用的地理空间人工智能的爆炸式增长，以及神经网络架构的多样性。总之，挑战在于如何随着时间的推移审核它们是否成功，并确定每种工具的优缺点。

4.地理空间人工智能审核和质量评估至关重要

人工智能审核在全球范围内越来越受到关注，因为人们越来越担心人工智能算法中可能存在的偏差。地理空间行业也不例外。一旦一个神经网络被训练并付诸实践，就没有确定的方法来确定人工智能的表现是否与训练时的水平相同。当然，神经网络将为它发现的特征提供一个置信区间（例如，找到的特征是路边资产的置信度为82%），但是那些被它彻底错过的特征呢？另外，如果神经网络能描述出它发现的特征（例如，那是一个让路标志的置信度为57%），我们怎么知道它是正确的？我们必须人工验证整个结果数据集吗？这在今天已经是一个挑战，因为数据集是由人类生成的，而人工智能将我们带入一个“在数据中游泳，在功能中溺水”的时代，这根本是不可行的。

我们面临着一个熟悉的挑战——我们需要消除在审查地理空间数据时的人为偏见，并提供一致的度量标准来评估数据的所有方面，包括定性问题，如遗漏、委托、主题准确性和属性准确性。一段时间以来，这一直是我们关注的焦点。我们开发了一种质量即服务（Quality-As-A-Service）的产品——数据适配——来解决迎面而来的问题。数据适合性度量地理空间数据的定性方面，提供统计上有效和可重复的质量度量，并帮助用户根据问题集评估数据使用的适合性。数据适配度等产品有助于审计地理空间人工智能，并通过将用户需求映射到统计有效且可重复的数据质量度量，确保数据适合使用。

图3.适配度中心：数据适配结果审核分析

5.我们需要对人工智能进行描述和分类

专门构建的地理空间AI会在你的工具箱中放置大量的AI工具来解决一个问题集。不幸的是，这可能会导致你不知道使用哪个AI工具的问题。想象一个场景，有8种不同的算法可以供您访问，它们都声称可以在RGB图像中找到建筑物足迹。你用哪一种？要做出明智的选择，您必须拥有可访问的AI元数据，这些元数据对算法的描述和分类与企业系统中的地理空间数据层没有什么不同。可以在不泄露知识产权秘密的情况下构建地理空间AI元数据，并帮助用户正确使用该工具。

以最近的一次SpaceNet挑战为例。他们的第二轮挑战集中在4个地点的建筑足迹描绘：拉斯维加斯、巴黎、上海和喀土穆。竞赛有许多提交的作品（见CosmiQWorks的博客）和几个明确的偏好。然而，即使是赢家也面临着某些特性类和子类型的挑战，而且在全球四个不同的城市中，成功率也大相径庭。要成功地使用这些公开可用的神经网络，您最好了解它们各自的优缺点。理论上，对于给定的问题集，应该根据需要保留许多AI变体。我看到在不久的将来，地理空间专业人员会整理他们的人工智能工具箱，找出最适合执行任务的算法。今天，一种尺寸并不适合所有人。

具有讽刺意味的是，当我们讨论地理空间功能的最佳算法时，类似的问题出现在地理信息系统的早期（早在70年代末和80年代初），如旅行推销员或驾驶方向。有许多博士学位论文写到这个问题。其中的大部分不再受到质疑，因为我们已经反复研究了它们，并找到了最适合我们集体需要的。我怀疑同样的情况也会发生在地理空间人工智能上。

原载博客Continental Mapping：

https://www./blog/five-thoughts-on-geospatial-artificial-intelligence