分享

【DARPA】无人深海机器自治 :“垂钓者”项目

 伊伊爸 2022-04-07

一   发展背景

DARPA于2019年启动“垂钓者”项目,希望利用陆基和空基的浮动机器人、陆基自主操纵、水下传感等技术来实现水下操纵,尤其是远距离海底操纵。具体而言,该项目旨在探索和寻求创新型的自主机器人解决方案,能够在没有通信和人工干预的情况下进行深海导航、测量海洋深度并操纵感兴趣的目标。

在“垂钓者”的自主控制系统研发方面,尽管已公开的项目承包商目前并未公开介绍相关研究进展,但通过情报检索,可以从相关文献中找到蛛丝马迹,下面选取部分成果进行简单介绍。

二  路易斯安那州里大学研究   

2021年9月路易斯安那州里大学的研究人员在美国预印本网站arXiv上提交了一篇“垂钓者”项目支持下的研究成果《数据驱动控制器和水下操纵的感知系统需求》,提出了一种基于数据驱动最优控制器的水下机器操纵系统(UVMS)控制策略[1]。

该研究认为,为了在水下环境中实现对未知载荷的完全自主操作,不仅需要可靠的感知系统,还需要有个能够适应各种变化并执行复杂操作的控制系统。该研究首先介绍了针对这种未知载荷的UVMS控制架构,还详细讨论了实现高精度水下自主操作所需的感知系统。

该研究在最优控制的情况下开发一个自适应的公式,与数据驱动的建模方法一起推动水下机器人控制操作的进展。

该研究提出算法的主要组成部分是称为神经网络模型预测控制(NNMPC)的控制器。控制系统的基本结构如图1所示,该控制系统基于两层架构,底层(数据驱动模型预测控制)有一个数据驱动的模型预测控制(MPC)的控制器,即NNMPC。该控制器采用基于神经网络的数据驱动模型。控制器接收到系统的当前状态和期望的参考点,并输出使机械臂达到期望的参考点状态的最佳动作。

图片

图1  NNMPC控制器的基本结构

图片

2021年8月,项目研究团队在另一份研究《一种可变载荷水下机械臂的自适应数据驱动控制器》同样提出了一种采用数据驱动模型的水下机械臂自适应控制器[2],可以操作不同质量、几何形状和浮力的物体。新型自适应控制器采用最优控制理论,使用数据驱动的模型代替线性模型以降低不确定性,使用水下机械手收集的数据训练神经网络模型,并采用自适应交互理论设计调整方法,使控制器可以自适应工作条件。

图片

图2  研究提出的“自适应神经网络模型预测控制器”(AdaNNMPC)基本结构

研究所提出的基本控制系统如上图所示,该控制系统基于两层结构:底层是数据驱动的模型预测控制,有一个基于神经网络的数据驱动模型的控制器,控制器接收到系统当前状态(t和qt)和期望参考状态(和),并输出使机械臂达到期望参考状态的最佳动作(ut)。系统的上层是基于自适应交互理论的一种自适应机制,能够在线自适应MPC控制器的权值。

此外,研究团队还针对控制器水下操纵在节能方面的能力进行了相关研究[3]。

   三、SoarTech技术公司研究

项目承包商之一SoarTech技术公司的研发人员也在2021年4月发布了一篇《通过动态重规划和情景推理提高水下自主任务的成功率和效率》的文章,提出了一种新型水下自主架构AWARE,能够将先验历史推理与针对当前环境的最佳行动选项集的动态选择相结合[4]。

AWARE通过开发“自我意识”作为一种理解-适应-优化的循环,来解决水下机器人在最小化能耗和降低风险方面的核心挑战。该循环分为三个部分:通过基于情景记忆的有限经验推理,理解动态系统能力和环境状态;应用理解来不断适应基于机器人状态和外部条件的行动选择,以最大限度促进成功,最小化风险和功耗;优化能力性能,平稳进行行动。

图片

图3  在长时间自主中引入自我意识的AWARE更新循环

图片

图4  AWARE自我意识架构

AWARE循环能够在不需要人为更新步骤的情况下适应动态、难以预测的状况,并从经验中学习。在“理解”环节中系统经验被转换为保存了环境状态、行动序列参数和行动结果(成功、失败、能耗)的可操作的记忆。情景记忆被SoarTech用于小样本学习,使得自主载具能够识别导致重复失败行动的局部决策空间的极小值。每次成功或失败也使得重要的传感特征能随时间推移被识别,创建检索索引,以便将记忆与当前情况相匹配。

“适应”环节中,这些记忆序列对被纳入基于分层任务网络(HTN)规划的功耗和风险进行预测,从而有针对性地选择行动。

最后,在“优化”环节中,对选定的动作进行平滑处理,以获得更好的效率。研究证明,只需20个片段的经验学习,机器人就可以收敛于一个稳定的全局策略,使任务成功率最大化。

图片

[1] Oubre, J.P., Carlucho, I., &Barbalata, C. (2021). Data-driven controllers and the need for perception systems in underwater manipulation. ArXiv, abs/2109.10327.

[2]Carlucho, I., Stephens, D.W., &Barbalata, C. (2021). An adaptive data-driven controller for underwater manipulators with variable payload. Applied Ocean Research, 113, 102726.

[3]Carlucho, I., Stephens, D.W., &Barbalata, C. (2020). Insights into a data driven optimal control for energy efficient manipulation. Global Oceans 2020: Singapore – U.S. Gulf Coast, 1-6.

[4] Martinson, E., Moshkina, L.V., & Paul, N. (2021). Improving success and efficiency of underwater autonomous tasks through dynamic re-planning and episodic reasoning. Defense + Commercial Sensing.

DARPA

“任务集成网络控制”项目组网管理软件

2022年1月初,DARPA与Peraton实验室签订了一份价值1927.8529万美元的“任务集成网络控制”(MINC)项目合同,基于快速自修复的互联网络,将陆海空天网的传感器和武器连接起来并按需配置。


MINC项目于2021年4月启动,作为马赛克战的重要组成部分,项目旨在通过按需配置网络之网络,以及在异构网络资源间安全分发网络指控信息,确保关键数据在竞争环境下能够寻找到路径,以在正确的时间找到正确的用户,来满足马赛克战的最终愿景:在强对抗高动态环境中形成敏捷自修复网络以构建跨域杀伤网。

根据该合同,Peraton实验室将开发网络与通信系统算法以及软件,并将聚焦于三项关键功能:


一是安全控制覆盖:开发“始终在线”的虚拟网络覆盖,以接入可用的网络和通信资源以及控制相关参数;

二是分布式网络配置:使用跨网络方法对网络配置和信息流进行优化和管理;

三是任务集成:基于杀伤网服务创建最佳信息流驱动的方法。

本项目可有效支撑马赛克战传感器到射手的作战概念,实现从封闭体系架构向动态、自主控制的模式转变。预计相关工作2025年6月完成。

图片

图5  MINC项目发展目标

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多