一 发展背景 DARPA于2019年启动“垂钓者”项目,希望利用陆基和空基的浮动机器人、陆基自主操纵、水下传感等技术来实现水下操纵,尤其是远距离海底操纵。具体而言,该项目旨在探索和寻求创新型的自主机器人解决方案,能够在没有通信和人工干预的情况下进行深海导航、测量海洋深度并操纵感兴趣的目标。 在“垂钓者”的自主控制系统研发方面,尽管已公开的项目承包商目前并未公开介绍相关研究进展,但通过情报检索,可以从相关文献中找到蛛丝马迹,下面选取部分成果进行简单介绍。 二 路易斯安那州里大学研究 2021年9月路易斯安那州里大学的研究人员在美国预印本网站arXiv上提交了一篇“垂钓者”项目支持下的研究成果《数据驱动控制器和水下操纵的感知系统需求》,提出了一种基于数据驱动最优控制器的水下机器操纵系统(UVMS)控制策略[1]。 该研究认为,为了在水下环境中实现对未知载荷的完全自主操作,不仅需要可靠的感知系统,还需要有个能够适应各种变化并执行复杂操作的控制系统。该研究首先介绍了针对这种未知载荷的UVMS控制架构,还详细讨论了实现高精度水下自主操作所需的感知系统。 该研究在最优控制的情况下开发一个自适应的公式,与数据驱动的建模方法一起推动水下机器人控制操作的进展。 该研究提出算法的主要组成部分是称为神经网络模型预测控制(NNMPC)的控制器。控制系统的基本结构如图1所示,该控制系统基于两层架构,底层(数据驱动模型预测控制)有一个数据驱动的模型预测控制(MPC)的控制器,即NNMPC。该控制器采用基于神经网络的数据驱动模型。控制器接收到系统的当前状态和期望的参考点,并输出使机械臂达到期望的参考点状态的最佳动作。 图1 NNMPC控制器的基本结构 2021年8月,项目研究团队在另一份研究《一种可变载荷水下机械臂的自适应数据驱动控制器》同样提出了一种采用数据驱动模型的水下机械臂自适应控制器[2],可以操作不同质量、几何形状和浮力的物体。新型自适应控制器采用最优控制理论,使用数据驱动的模型代替线性模型以降低不确定性,使用水下机械手收集的数据训练神经网络模型,并采用自适应交互理论设计调整方法,使控制器可以自适应工作条件。 图2 研究提出的“自适应神经网络模型预测控制器”(AdaNNMPC)基本结构 研究所提出的基本控制系统如上图所示,该控制系统基于两层结构:底层是数据驱动的模型预测控制,有一个基于神经网络的数据驱动模型的控制器,控制器接收到系统当前状态(t和qt)和期望参考状态(和),并输出使机械臂达到期望参考状态的最佳动作(ut)。系统的上层是基于自适应交互理论的一种自适应机制,能够在线自适应MPC控制器的权值。 此外,研究团队还针对控制器水下操纵在节能方面的能力进行了相关研究[3]。 三、SoarTech技术公司研究 项目承包商之一SoarTech技术公司的研发人员也在2021年4月发布了一篇《通过动态重规划和情景推理提高水下自主任务的成功率和效率》的文章,提出了一种新型水下自主架构AWARE,能够将先验历史推理与针对当前环境的最佳行动选项集的动态选择相结合[4]。 AWARE通过开发“自我意识”作为一种理解-适应-优化的循环,来解决水下机器人在最小化能耗和降低风险方面的核心挑战。该循环分为三个部分:通过基于情景记忆的有限经验推理,理解动态系统能力和环境状态;应用理解来不断适应基于机器人状态和外部条件的行动选择,以最大限度促进成功,最小化风险和功耗;优化能力性能,平稳进行行动。 图3 在长时间自主中引入自我意识的AWARE更新循环 图4 AWARE自我意识架构 AWARE循环能够在不需要人为更新步骤的情况下适应动态、难以预测的状况,并从经验中学习。在“理解”环节中系统经验被转换为保存了环境状态、行动序列参数和行动结果(成功、失败、能耗)的可操作的记忆。情景记忆被SoarTech用于小样本学习,使得自主载具能够识别导致重复失败行动的局部决策空间的极小值。每次成功或失败也使得重要的传感特征能随时间推移被识别,创建检索索引,以便将记忆与当前情况相匹配。 在“适应”环节中,这些记忆序列对被纳入基于分层任务网络(HTN)规划的功耗和风险进行预测,从而有针对性地选择行动。 最后,在“优化”环节中,对选定的动作进行平滑处理,以获得更好的效率。研究证明,只需20个片段的经验学习,机器人就可以收敛于一个稳定的全局策略,使任务成功率最大化。 [1] Oubre, J.P., Carlucho, I., &Barbalata, C. (2021). Data-driven controllers and the need for perception systems in underwater manipulation. ArXiv, abs/2109.10327. [2]Carlucho, I., Stephens, D.W., &Barbalata, C. (2021). An adaptive data-driven controller for underwater manipulators with variable payload. Applied Ocean Research, 113, 102726. [3]Carlucho, I., Stephens, D.W., &Barbalata, C. (2020). Insights into a data driven optimal control for energy efficient manipulation. Global Oceans 2020: Singapore – U.S. Gulf Coast, 1-6. [4] Martinson, E., Moshkina, L.V., & Paul, N. (2021). Improving success and efficiency of underwater autonomous tasks through dynamic re-planning and episodic reasoning. Defense + Commercial Sensing. DARPA “任务集成网络控制”项目组网管理软件 2022年1月初,DARPA与Peraton实验室签订了一份价值1927.8529万美元的“任务集成网络控制”(MINC)项目合同,基于快速自修复的互联网络,将陆海空天网的传感器和武器连接起来并按需配置。
根据该合同,Peraton实验室将开发网络与通信系统算法以及软件,并将聚焦于三项关键功能:
二是分布式网络配置:使用跨网络方法对网络配置和信息流进行优化和管理; 三是任务集成:基于杀伤网服务创建最佳信息流驱动的方法。 本项目可有效支撑马赛克战传感器到射手的作战概念,实现从封闭体系架构向动态、自主控制的模式转变。预计相关工作2025年6月完成。 图5 MINC项目发展目标 |
|