当前位置: 首页  >  船舶与海洋智库  >  国家安全与军事建设  >  研究动态 > 正文
DARPA发展基于机器学习的自省技术
来源: 涂悦 科荟智库     日期:2024-06-21    字体:【大】【中】【小】

  4月,在DARPA“学习内省控制”计划资助下,极光飞行科学公司构建的“快速适应学习在线控制”系统完成试验验证。该系统开发基于机器学习的内省技术,不断将无人艇等平台的实时行为与平台学习模型进行比较,实时评估平台稳定性和可控制性,在需要时更新平台控制策略并传达给操作员,使操作员保持对平台的有效控制和信任。极光飞行科学公司计划将该系统搭载在有人舰艇上,并将其扩展应用到空中和陆上平台。

  一、发展背景

  美军装备的复杂军事平台设计寿命可达数十年,但随着时间推移,军事平台的作战环境和所执行任务不断变化,可能需要进行持续改装和匹配适应,以提供相对于对手的战略优势。军事平台的控制系统主要针对当前应用场景进行设计建模,随着时间推移,由于使用者对平台进行改造、平台受到损坏、其他突发情况造成异常磨损或应用场景超出设计范围时,平台行为也会随之发生实质性变化,导致控制系统发生故障。现有平台通常缺乏相应的补救措施,且需要熟练的技术人员来安装;通过采购渠道对现有平台进行改造可能需要数月至数年时间。

  二、主要内容

  为解决这一问题,2021年8月,DARPA开展“学习内省控制”计划,旨在开发基于人工智能和机器学习的内省技术,使军用平台搭载的计算机能够不断检查和修正自身决策过程,从而在遭遇不确定情况或意外事件时及时做出反应,调整其控制法则。目前,该计划资助的“快速适应学习在线控制”系统已可协助无人艇在类似苏伊士运河的复杂环境中自主导航,与接受补给的有人平台保持步调一致,并有效处理了各种不可预见的突发状况,包括推进器故障、行经狭窄区域时流速增加导致压力下降。

  “学习内省控制”计划将通过以下三个主要步骤使军事平台及时应对无法预见的风险:

  一是开发基于机器学习的平台自省技术,使平台控制系统能够利用平台上大量传感器采集到的数据。该系统通过深度学习、强化学习等技术,执行跨传感器数据推断,表征并实时监控平台行为的变化,包括平台对操作员输入指令的响应,从而建立平台实时行为以及运动状态的物理模型。

  二是利用平台自省技术赋能控制系统,不断建立平台的实时行为模型。平台控制系统将能把实时行为模型与平台平稳运行时建立的行为模型进行比较,确定平台行为与原有行为模型间存在的差异是否可能损害平台稳定性和控制性,并根据行为表征平台受损、改装或受突发事件影响情况。随后,根据平台行为和受影响情况,提出调整平台控制律的方案,并进行数次迭代更改,最终确立一套新的控制律以保持平台稳定性、控制性,维持平台不间断正常运行;在此基础上不断进行计算,确定新控制律运行的边界条件和平台安全运行的范围。外部因素的动态变化不是一次性的,可能会频繁、多次影响系统的控制响应。因此,行为模型的建立是一个迭代过程,系统必须通过观察不断变化的系统行为来重新学习和快速建立新的控制律。

  三是平台自省技术赋能的控制系统将以简洁、有效的形式向操作员传达系统行为的变化,并提供态势感知情况等相应依据,以获取操作员足够的信任。该系统向人类或人工智能操作员充分解释该系统对于控制律的实时更新,传达有关新控制环境及其安全限制的详细信息,以操作员容易理解的形式提供指导和操作提示。目前,平台主要依靠操作员的认知和处理应对平台的损坏或改动,为操作员增加了较大负担。平台自省技术赋能的控制系统可在不增加操作员负担的情况下,帮助保持对经历战损和临时改造的军事平台实施有效控制。

  三、应用前景

  “学习内省控制”计划将通过实时调整平台控制律、开发新的交互技术,为人类或人工智能操作员提供可理解、值得信任的操作建议,确保操作员操作的正确性,使平台具备及时应对无法预见风险的能力,从而对现有军事平台进行安全升级。可提升平台适应性,使平台在受损并经过大修后,可快速重新投入战场;或根据新需求经过改造后,可快速投入新的作战任务;也可快速适应新的作战环境,扩充平台适用场景,进一步提升平台寿命,降低研发建造新平台的频次。

(科荟智库:涂悦)