全面解读美国人工智能在武器系统中的应用

小飞侠cawdbof0 2022-10-31 发布于北京

展开全文

来源：渊亭防务

摘要

美国国防系统信息分析中心（DSIAC）最新发布题为《人工智能在武器系统中的应用》报告（后台发送“AI武器”获取英文原文报告），概述了人工智能的历史和含义、人工智能的原理和技术，以及在武器系统中的应用，包括回顾监督自主系统的研究和方案；制导、导航和控制；行动和路径规划；传感器与信息融合；智能战略和规划；兵棋建模；以及认知电子战。

关键词：美国，人工智能，武器系统，机器学习，自主系统

人工智能(AI)应用于武器系统代表了过去十年研究的一个主要趋势。这些举措旨在提高武器精度，执行非主动瞄准手段、辅助导航、制导和控制(例如，在全球定位系统无法使用的情况下)，并与传统的基于物理的方法相比，减少总体计算资源，使更小、更经济的武器系统实现智能瞄准。这项研究还包括将操作人员的作战空间扩展到无人机，并使用集群方法与有人/无人平台协同作战。

美国国防系统信息分析中心（DSIAC）2022年10月12日发布题为《人工智能在武器系统中的应用》报告概述了人工智能的历史和含义、人工智能的原理和技术，以及在武器系统中的应用，包括回顾监督自主系统的研究和方案；制导、导航和控制；行动和路径规划；传感器与信息融合；智能战略和规划；兵棋建模；以及认知电子战。

背景

1.研究意义

机器学习(ML)和人工智能研究的最新进展揭示了人工智能在实现创新、增加机器的效用以及增强人类能力和经验方面的能力和潜力。展示关键和相关的人工智能研究和最先进的技术至关重要，这些技术不仅赋予了武器系统比常规武器系统更多的自主权，而且显著提高了它们的杀伤力和作战生存能力。

2.常规武器系统

常规武器技术大多是自动化系统，在计划、执行和完成任务时依赖于一组预编程规则。使用支持AI的智能硬件增强人在回路系统可以在战场上提供更多的情报信息，并通过AI系统执行一些简单和常规的任务来缓解人类决策。

无人作战空中系统(UCAS) 是经过验证的具有成本效益的系统解决方案，适用于情报、监视和侦察 (ISR) 任务和远程空袭。然而，自动化功能仍然受到人在回路操作、评估和参与的限制。虽然在任何可预见的未来都无意消除武器化人工智能系统中的人为因素，人类的能力将继续构成这些系统协同潜力的上限。尽管如此，人工智能智能武器系统的新生态系统仍将迎来新的战争形式和战略。

3.人工智能简史

图 1-1 的时间线展示了人工智能的历史和演变。

图1-1 人工智能历史时间表

4.什么是人工智能

《人工智能:一种现代方法》（Artificial Intelligence: A Modern Approach）一书中给出了人工智能的最新定义，即“设计和构建智能体，这些智能体从环境中接收感知并采取影响环境的行动”。如果以人类为中心来定义人工智能，即以人类的智能水平执行任务，那么人工智能需要感知、推理、推断、知识构建、决策和规划、学习、沟通以及高效改变和操纵环境的能力。人工智能大致分为三个主要层次——弱人工智能（ANI）、强人工智能（AGI）和超人工智能（ASI）。图 1-2 说明了三个层次内的各种分组。

图 1-2：人工智能层次关系

5.机器学习（ML）

机器学习是机器从数据中学习以做出准确预测的能力。它大致分为四类学习，提供丰富的专用和通用技术系列。

监督学习
在这种学习形式中，训练数据使用包含输入和标记或预定义的输出数据。
如果有丢失的输入或输出条目，则会对其进行预处理，以便将输入正确定位到其真正对应的输出。
通过数据集训练学习，即使输入数据不在原始数据集，系统也将学会把陌生的输入与其预测输出（标签或值）相关联。
这种类型的训练解决的典型问题是回归和分类。
无监督学习这种学习形式的系统直接从未标记的数据中发现有价值或隐藏的结构。
无监督学习用于聚类分析、降维或估计可能生成输入数据的密度。
半监督学习
当数据集包含标记数据和未标记数据时，这种学习形式的系统利用未标记数据更好地捕获基础数据分布，并获得更好的预测，前提是仅从标记数据进行训练。
这种学习形式适用于训练数据集中标记数据远少于未标记数据的情况。
强化学习在这种学习模式中，系统使用奖励/惩罚机制进行训练，使其在系统需要时获得奖励或在不需要时获得惩罚。
强化学习问题涉及学习做什么（如何将情况映射到行动）以最大化数字奖励信号。

最先进的方法

1.学习AI范式

1.1深度学习（DL）

深度学习是指ML中强大算法的子集，采用深度连接的人工神经网络(ANN)，称为深度神经网络(DNNs)。DNN的构建模块是感知器，它由一个被称为“人工”神经元的信息处理单元组成。“人工”神经元的现代概念具有以下三个基本要素：

突触：突触是由价值强度加权或表征的连接链。
传递函数：该函数传统上表示线性回归模型(线性组合器),将输入信号相加，这些输入信号由它们各自的权重或强度值加权。
激活函数：限制神经元输出幅度的函数。
传递函数可以包括外部施加的偏置值，该偏置值调制(增加/减少)激活函数的净输入。

多层感知器(MLP)是单层感知器和基本前馈网络结构(图2-1)的泛化，其成功归功于误差反向传播算法，该算法基于误差校正学习规则。该算法使用基于梯度下降的方法和链式规则，该算法旨在通过逆着突触连接的方向，通过网络反向传播其关于自由参数(权重和偏差)的变化，来最小化损失函数(例如，平方误差、交叉熵等)。

图 2-1：前馈神经网络（单隐藏层）中神经元的非线性模型

深度神经网络的深度是指网络中的层，无论它是前馈、反馈还是卷积架构。对于一个神经网络必须是一个DNN的隐藏层数没有一般的规则。然而，具有非线性激活函数的三层或更多层(包括输出)的神经网络被认为是深度神经网络（DNN）(图2-2)。

图 2-2：深度前馈网络

从大数据生成复杂模型的深度学习能力提高了准确性和表达能力。因此，深度学习为人工智能问题领域内的广泛应用提供了以下一系列相关解决方案：

语音、图像和视频识别
多维数据中的背景评估(例如，成像、视频、雷达和监控系统)
时间序列预测
函数逼近
数据压缩
数据异常值检测
系统识别
场景理解
可解释的人工智能
自动驾驶

1.2强化学习（RL）

马尔可夫决策过程（MDP）：MDP是一个离散时间随机过程，用于在随机环境中对基于行动的主体的顺序决策进行建模，在随机环境中，该主体可以行动，并且行动的结果是不确定的。

部分可观测MDP（POMDP）：部分可观测MDP (POMDP) 对不确定性扩展到状态的情况进行建模。不对状态的进行精确观察，而只观察与状态的概率关系。POMDP 的一个常见解决方案是在当前时间步上推断基础状态的信念分布，然后应用将信念映射到行动的策略。

单智能体强化学习 (SARL)：在SARL中，RL模型分为状态、动作和奖励。状态是代表当前世界或环境的任务。动作是RL智能体可以用来改变这些状态的事情，而奖励是智能体为执行所需动作而获得的效用。

多智能体强化学习 (MARL)：MARL是不同于 SARL的另一种强化学习形式。学习组织环境的机械手、学习走路的人形机器人或学习自行停车的汽车都是SARL的例子。MARL关注多个智能体如何相互交互以及它们的环境。MARL有两个理论框架——随机博弈和扩展形式的博弈。

深度强化学习(DRL)：DRL是强化学习研究的最新进展的结果，证明了将深度神经网络融入到强化学习算法中的好处。深度神经网络充当状态到值，或“状态动作对”对到动作值标准的函数逼近器。当与强化学习一起使用时，深度神经网络解释输入并提供策略预测。

DARPA 的“阿尔法狗斗”（AlphaDogfight 近距空中格斗）比赛（图 2-3）以苍鹭系统公司的Heron Systems AI对人类飞行员的压倒性胜利而告终，开创了一个可信、自主和潜在致命的机器时代。

图 2-3：DARPA 的空战演进项目(ACE) 在模拟中使用“阿尔法狗斗”

2.随机优化和搜索算法

2.1随机优化

随机过程是指捕获随机概率分布模型的随机过程。在数学优化问题中，随机优化是当随机性存在时，最小化或最大化目标函数的一系列方法：

群体智能（SI）：SI 是由分布式、自组织智能体的去中心化集体行动形成的行为模式。
每个个体代理根据其本地规则采取行动和作出反应，复杂的群体行为由此展开。
进化算法(EAs)：进化算法是一种受自然启发的随机搜索算法，采用进化的原理——繁殖、遗传交叉和变异，以提高系统中期望数量(适应度)的结果。
近年来，进化算法被用于提高人工智能/机器学习模型在所有机器学习过程中的性能——即在预处理（例如，特征选择和不平衡数据重采样）、学习中（例如，参数设置、隶属函数和神经网络拓扑）和后处理（例如，规则优化、决策树/支持向量修剪和集成学习）。
物理学启发的算法：从电磁和引力现象到物质和量子物理学，以下算法受到物理世界中观察到的现象的启发:人工势场法 (APF)、模拟退火算法 (SA) 、量子菌群优化算法(QBSO)。
其它元启发式：元启发式算法家族中的其它优化方法是那些提倡集成自适应或学习搜索启发式以智能地避开局部最小值或达到全局最优值的方法。
它们包括以下内容：
引导本地搜索算法 (GLS) 、禁忌搜索算法(TS) 、反应式搜索。

2.2图搜索算法

图搜索算法是一系列针对路径规划应用的搜索算法，例如在静态和动态环境中求解最短路径。图搜索算法包括D* 算法和快速遍历随机树 (RRT*)。

3.新兴人工智能范式

在很大程度上，当前范式的应用范围很窄，缺乏强人工智能的几个关键特征——可概括性、可解释性、知识抽象、常识和因果推理。目前对神经符号人工智能和神经进化（NE）的研究试图以不同的方式解决弱人工智能的一些局限性。

3.1神经符号人工智能

神经符号人工智能是人工智能的一个新兴领域，它将经典的基于规则的人工智能与现代深度学习技术相结合。该架构强调神经、符号和概率方法与推理之间的交互。符号部分用抽象知识表示理性。概率推理在事实、关于不确定性的推理和看不见的场景之间建立因果关系。神经部分发现表征和模式，以将环境数据感知为知识，并帮助导航搜索空间。

3.2神经进化（NE）

NE是使用遗传算法对神经网络的人工进化。遗传算法（GA）不仅可以进化连接权重，作为网络反向传播中，随机梯度下降的替代方案，还可以进化网络结构和连接权重，以显著增强网元网络的性能。该算法使用该结构来最小化搜索空间的维数。

人工智能在武器系统中的应用

报告重点介绍适用于自主系统和武器系统中最先进的人工智能方法，包括自主、感知中的人工智能、制导、导航和控制方面的人工智能、任务和路径规划、智能战略、对手建模、认知电子战。

1.自主

1.1定义、自主级别和发展框架

定义：自主系统的特点是能够根据对环境的感知、态势感知以及对本地或动态环境的理解来选择和规划适当的行动路线以达到目标。

自主级别：美国国防部根据自主程度将武器化自主系统分类如下（见图 3-1）：

图 3-1

2.感知中的人工智能

本节重点介绍典型自主顶层功能架构中感知相关的最先进技术。这些人工智能技术适用于自主核心软件和有效载荷ISR系统（情报、监视和侦察）中的感知。

2.1图像分割

语义理解是将语义与图像内容相关联以构建理解和语境的任务。图像分割对于场景或视觉理解尤为重要。分割主要分为三类——语义分割、实例分割和全景分割（见图 3-2）。

图 3-2：语义分割(b)与实例分割 (c)与全景分割 (d)

2.2目标探测、分类和场景理解

报告强调了在基于图像的主要数据库挑战中，使用最先进的深度神经网络拓扑来处理图像和视频数据在感知方面的显著进步。

图像技术：图像分类、图像生成、人体姿态估计、语义分割、视觉推理、视觉问答（VQA）。

视频技术：活动识别、目标探测、视觉常识推理（VCR）。

2.3传感器融合

传感器融合涉及对各种传感器信息进行摄取和统一。在自主系统环境中，多传感器融合用于解码来自多个异构传感器的信息，以推断情境，并获得感测环境的融合单一“视图”。人工智能技术已被用来改进感知和定位中的这一重要处理功能。

3.制导、导航和控制中的人工智能

在多智能体系统中，控制是根据如何控制智能体来指定的，在这种情况下，它可以是集中的、分散的或分层的。在其低级表示中，控制处理低级任务，例如在制导、导航和控制 (GN&C) 问题域中发现的跟踪和调节功能。

3.1制导、导航和控制（GN&C）系统

GN&C是解决控制和支持运动物体任务的系统部分设计的重要问题领域。从将卫星送入轨道和制导弹药到导航潜艇，这些系统对于自主系统的运动控制以及随后实现任务目标是绝对必要的。GN&C系统描述如下：

测量车辆瞬时状态的导航系统。
计算最佳轨迹和相应的车辆转向指令以实现最佳轨迹的制导系统。
控制系统接收来自制导系统的转向命令，并在存在所有干扰的情况下引导车辆遵循所需的高度。
控制系统具有三大功能：
1）在整个任务中稳定车辆；
2）驾驶车辆按照引导系统指示的所需高度行驶；
3）将车辆负载保持在所需的范围内。

DARPA 的空战演进项目（ACE）（图 3-3）就是在复杂环境中使用人工智能进行武器系统控制的一个例子。

图3-3：空战演进

4.任务与路径规划

任务和路径规划是机器人和自主堆栈中的重要控制功能。它涉及计算从源点到目标点的最优路径或准最优路径。对于动态环境，这是一个非多项式时间复杂度（NP-hard）问题，其复杂性随着状态自由度的提高呈指数级增长。路径规划优化通常分为路径搜索方法和轨迹优化问题。路径搜索方法是通过启发式和元启发式算法解决的。

一个有效的路径规划算法需要满足以下四个性能标准：1）必须以稳健的方式在现实的静态环境中提供最佳路径；2）必须可扩展到动态环境；3）必须与所选的自参考方法保持兼容：4）必须尽量减少复杂性和计算资源。

5.智能战略

智能系统的标志性能力是决策推理。游戏场景中智能战略和规划的重要应用包括：单智能体系统（深度思维的AlphaGo、AlphaGo Zero、Alpha Zero、 MuZero）和多智能体系统（OpenAI Five、深度思维的AlphaStar）。

6.对手建模和兵棋推演

对手建模分为三种方法——策略分类、基于目标的生成模型和策略近似：

策略分类旨在通过监督或博弈论方法从学习专家那里预测策略。
在基于目标的生成模型中，一个或多个智能体如何实现一个目标是行为分类的基础。
策略近似从状态/动作集学习函数映射，预估对手行为背后的真实策略。

7.认知电子战

电磁频谱是战争的重要前沿；现代和常规武器依靠电磁、光电和声学信号进行通信、情报、传感和武器投送。现代人工智能方法有望将统计信号处理和信息论中的传统电子战（EW）问题重新定义为人工智能问题。人工智能在电子战中的使用，现在称为认知电子战 (CEW)，已经获得了极大的关注，特别是在自动调制分类、自动脉内调制分类和雷达脉冲重复间隔跟踪领域。

典型的现代电子战系统分为三个应用领域或系统构成（见图 3-4）：

图3-4

由电子支援措施 (ESM) 系统提供的电磁威胁拦截、识别和定位。
由电子对抗（ECM）系统提供的进攻性措施，干扰或阻止敌人的电磁作战手段。
由电子反对抗（ECCM）系统提供的防御措施，提供弹性和保护免受敌人的电子对抗。

将人工智能应用于武器系统的系统和项目计划

美国政府已经建立了一些专门针对人工智能的重要机构。联合人工智能中心 (JAIC) 由美国国防部于2018 年成立，旨在通过利用人工智能技术来扩展和转变美国的军事能力和服务，加速人工智能的使用，并领导国家努力保持美国的军事技术优势，成为与人工智能相关的下一代技术的全球力量。

负责研究和工程的国防部副部长（USD[R&E]）成立自主系统的利益共同体（CoI），其中之一侧重于自主方面的研究，旨在鼓励跨领域技术重点领域的多机构协调和协作，为协调整个部门的科学和技术战略、分享新想法、技术方向和技术机会提供了一个论坛。

在美国联邦层面和国防部之外是重要的人工智能相关组织，例如国家人工智能咨询委员会 (NAIAC)、国家人工智能安全委员会 (NSCAI) 和国家人工智能研究所。

1.空中系统

1.1下一代空中优势计划（NGAD）

美国空军目前正在根据NGAD计划开发第六代战斗机。这些战斗机的一个关键要素是“人工智能僚机”、人工智能自主功能和有人-无人编队（MUM-T）能力的集成。

1.2 X-61“小精灵”

X-61“小精灵”是源自 DARPA 的 Gremlins 计划的技术演示平台，旨在提供半自主、空中可回收且低成本的 UCAS（图4-1)。X-61 可以携带多种有效载荷，包括 EO/IR 成像、电子战传感器和武器。

图 4-1：“小精灵”无人机

2.海上系统

美国海军正在将人工智能技术应用于几个正在进行的自主平台开发计划。与国防部指令准则一致，人工智能技术通过海军的无人海上自主架构和通用控制系统采用。

“海上猎人”是一个无人海军平台，用于开发 TTP（战术、技术和程序）。它是海军自主开发的测试平台之一。它的自主性如此发达，以至于它从圣地亚哥航行到珍珠港。2020 年 8 月，第二艘名为“海鹰”的海上猎人下水（图 4-2）

图 4-2：美国海军的“海上猎人”首次展示

3.陆地系统

3.1德事隆系统“粗锯齿 ”M5

“粗锯齿”M5（Ripsaw M5）是第五代中型无人战车，具有完全自主能力的美国陆军技术演示器，是其三层美国陆军机器人战车项目 RCV 决定性杀伤力连续体概念的一部分（图 4-3）。

图 4-3：陆军“粗锯齿 ”M5无人战车

4.蜂群系统

4.1DARPA's 进攻性蜂群使能战术（OFFSET）

DARPA 的OFFSET是下一代作战技术生态系统的计划推动者，旨在生产各种具有集群任务能力的无人平台。该计划设想使用超过250个无人机和地面系统的蜂群协作。

4.2CSDB小直径炸弹群

CSDB是一种基于在“金帐汗国”计划下开发的自主武器弹药的集群技术，该计划属于美国空军的“先锋”(Vanguard) 计划之一，CSDB的集群技术旨在提供自主识别、目标选择和打击能力。

5.战斗管理与智能指挥控制

为了满足下一代战场的数据密集型和网络处理要求，国防部正在加紧开发多个系统，支持具有人工智能任务规划和作战管理能力的联合全域指挥与控制。

美国陆军的建设性机器学习对抗战术 (COMBAT) 计划旨在利用人工智能开发先进的对抗性兵棋战术，以确保美国军队的长期战术优势和为敌人强化无法预料的战场现实。DARPA 的可解释人工智能计划将通过确保人工智能能够产生可解释的模型和推理并以人类可以理解的方式呈现基本原理来帮助战斗管理决策者。这个过程将使用神经符号人工智能和最先进的人机交互技术。

6.ISR和目标系统

6.1复仇女神系统（NEMESIS）

虽然增强现实提供了信息优势并增强了作战人员在战斗中的感知，但NEMESIS增加了自动化、关键决策制定的战术维度。NEMESIS是一个仿生视觉AI系统（图 4-4），旨在通过融合多模态传感器、识别场景和情况、解释情境以及向战斗人员实时提供快速、智能的决策和策略来模拟人类的视觉和认知。

图 4-4：NEMESIS

7.导航

常规武器系统依靠 GPS 信号锁定惯性导航系统解决方案来获得准确的实时位置、导航和授时 (PNT) 信息。然而，在通信信号可能受到干扰和欺骗的严峻和电子敌对环境中，任务执行可能会由于导航系统中丢失位置和时间精度而中断。人工智能驱动的技术正在开发和测试，以在这种环境中保持导航。

DARPA 的“垂钓者” 计划(Angler) 旨在开发一个水下平台，该平台能够在没有卫星和地面通信的情况下执行完全自主的长期任务，并借助传感器套件在黑暗、湍流和半透明的环境中提供感知。

未来战场中的人工智能

马赛克战作战概念采用多域、非均匀和不对称的力量投射，采用不同类型、类别、配置和大小的各种武器平台。通过马赛克瓷砖的类比，该概念预见到所有组成部分汇聚在一起，形成一种非常规的打击力量，从而扰乱和破坏敌人的稳定（图 5-1）。该概念的特点是其动态互操作性、可扩展性和集成灵活性，从而实现了新武器技术和具有成本效益的系统的敏捷集成。人工智能的使用是马赛克战争的关键推动力。

图 5-1: 陆军的“机器人和自主系统战略”

使用人工智能，下一代武器系统将具有高度集成的自主功能和决策能力。关键发展领域将以人工智能为目标，实现更高水平的跨域信息融合、智能自适应拓扑网络、快速数据处理、部分信息弹性控制、分布式控制和准确预测能力。无人装备将采用先进的视觉、雷达和声纳算法，用于ATR、多模态传感器融合以增强感知和智能任务规划。

此外，由及时、关键、准确和精炼的战斗价值信息传播支持的跨域合作构成了战略作战和战术优势。未来人工智能通过可操作情报准备提供将海量态势和战场情报数据（信号情报 [SIGINT]、电子情报 [EINT] 以及测量和特征情报 [MASINT]）转换为粗略的智能规划的能力，这不仅有助于减少认知负荷，还有助于指挥官和操作员的战略决策。

结语

人工智能有望成为确保未来战场战备和战术优势的决定性因素。群体智能、人机交互、非线性自适应控制、视觉感知、对手建模和认知电子战是利用人工智能提供前沿智能战斗系统的一些关键领域。此外，随着神经符号人工智能和神经进化人工智能研究的最新进展，正在跨越边界以缩小弱人工智能（一般人工智能）和强人工智能（完全人工智能）之间的差距。