空军的“蜂群之路”:利用兵棋推演和人工智能训练无人机
点击蓝字
关注我们
推荐
往期回顾
几
十年来,自然界中的群体,如蝗虫群,引起了科学家的兴趣,并激发他们揭示其基本规律的兴趣。蜂群代表了使用许多简单个体来完成大而复杂的能力。
现在想象能够在蝗虫群的规模和数量上部署一组无人机。实际上,管理自然群的相同法则可以控制廉价的机器人蜂群系统。今天,正在努力开发用于作物理授粉、监测和高分辨率天气监测的商业蜂群。然而,到目前为止,开发人员主要集中于管理他们的机器人群。虽然这在某些商业应用中可能效果很好,但它可能不一定适用于军事行动。分散的群体更具弹性,因为集中执行会带来单点脆弱性,在与近邻对手(中俄)的竞争环境中可能会出现问题。
作为空军军官,我们想知道,“空军是否已准备好释放蜂群?”我们最近观看了空军官方发布的一个假想场景视频,其中一架F-35与一组无人机合作,在与近邻对手的有争议环境中担负深入打击战略目标的任务。我们想知道如果出现动态威胁将会发生什么,迫使人们偏离预先计划好的飞行路径,要求飞行员对每架无人机的决策进行微观管理以控制打击。在这种情况下的速度、范围和复杂性将使飞行员不堪重负,打击可能将失败。尽管F-35拥有一支强大的无人机团队,但关键的教训是,大量的无人机本身并不等于蜂群。
对于空军而言,仅仅在战斗中部署大量无人机并不具有决定性作用,空军必须首先弄清楚如何分散实施无人机并重新平衡人类自治团队的工作量。正如海军陆战队作战实验室最近的一份报告所示,响应性地控制大量无人机个体的决定超出了人类的认知能力。相反,每个无人机必须能够执行整个群体的基本特征,即独立协调自己的决策以产生支持集体目标的行为。因此,为了有效地将无人机用作蜂群,人类必须将更多的行动自由委托给其自治系统的集体决策算法。
在本文中,我们扩展了最近的“战争之岩”网页描述为“雅典娜(Athena)” 的框架文章,这是一个兵棋推演平台,用于测试人工智能功能,捕获和评估结果数据,以改善军事训练。我们认为人工智能和兵棋推演不仅可以用来训练人类,还可以用来训练无人机。具体来说,通过使用“弱AI” 来完成数百万次任务特定的兵棋推演迭代,该框架揭示了个体无人机交互的最佳规则,这些规则推动了支持特定任务的集体群体行为。这种“群体方式”提供了一种快速执行,高度灵活并适应不断变化的假设方法,并且可以专注于特定任务,同时帮助个体无人机以分散的方式运行以服务于集体任务。
雅典娜方法
在这篇关于“雅典娜”的文章中,本杰明·詹森,斯科特·科莫和克里斯·怀特认为,不是等待一般人工智能的革命,而是提供人类的灵活性和广泛的认知能力,而是专注于“窄”人工智能的成就,擅长仅执行特定任务,为解决特定军事问题提供更直接的机会。
作者写道:
兵棋推演提供了探索如何将AI与[指挥官]作战判断相结合的最佳平台。......我们的兵棋“雅典娜”提供了一种方法,可以为将来的测试建立数据存储库,增强对AI如何协助培训、红队和仿真的理解,并强调这些功能在与人类交互时的极限环境不确定性。
我们同意,将传统兵棋与狭义人工智能相结合的“雅典娜”框架可以通过加强指挥官的作战和战术决策过程来提高人类训练的质量。此外,该框架可应用于训练无人机。狭义人工智能,纳入兵棋推演平台,提出了一种快速培养高质量决策的算法,以满足空军日益增长的蜂群无人机和“忠实僚机”项目的需求。
随着战争特征的变化,无人机群算法的快速,灵活和任务特定的训练计划将变得至关重要。人工智能和无人机等商用技术的融合,正在将战争推进到下一个预测的演变中,任何部队现在都可以将一个群体部署到战斗中。鉴于各国之间长期战略竞争的兴起以及他们对人工智能和自治的有意投资,弄清楚如何不仅利用群体,而且如何防御群体,对于竞争战略至关重要。
研究战争的洞察力
“数量也具有自己的品质。”
—— 约瑟夫•斯大林
在空中支配战役中,数量上的优势会使力量的质量无关紧要。在第二次世界大战中,俄罗斯军队绝对数量优势使东线的德国空军变得优势无存。太平洋地区的日本空军也一样,虽然最初训练有素,但日本飞行员的快速损耗,很快就难以保持竞争性地的数量所需。然而,当两个假想敌正在作战,大致相似大小的群体时(正如未来学家预期的那样),质量优为重要。只拥有相同数量的无人机将不再是决定性的。此外,在现今的蜂群中,每个额外的无人机都需要增加人类控制器的工作量,最终达到减少返回的点,以便部署更高数量的蜂群。在这些情况下,成功将取决于所采用的群体的质量 - 而不是数量。
然而,质量在这种背景下意味着什么?纵观历史,通常不是硬件在战斗中具有决定性作用,而是人类在操作技术方面的表现如何(如飞虎队,1940年的轿车,阿—以冲突,福克兰群岛战争)。对军事训练的研究发现,人类通常是武器系统战斗力的限制因素,导致整个空军的训练计划发生革命。在越南战争期间,海军实施了“顶炮”计划,这是一项针对其飞行员的严格训练计划,有助于将空对空杀伤率从二比一增加到十二比一。在越南之后,空军和陆军都从海军的成功中吸取了教训,并建立了大型部队演习场,如红旗演习和国家训练中心,为其作战人员提供额外的严格训练周期。
除了观察士兵如何训练外,军方开始关注优化指挥决策程序。空军训练机组人员实施沃登上校的开创性模型,通过观察环境的反馈循环,定位可能的解决方案,根据有限的信息做出决定,并采取行动以达到预期的效果,加速决策过程(OODA)循环。
“永远不要告诉人们如何做事。告诉他们该怎么做,他们会以他们的聪明才智让你大吃一惊。“
一一乔治·巴顿将军
大规模的部队训练也有助于这些军种增强其集中控制和分散执行的理论。随着作战的规模、范围和复杂性的增加,这一概念成为空军“战争方式”的基本原则之一。这些空军现在使用术语—任务式指挥来体现战争中分散执行的重要性。
在处理蜂群的自治系统时,严格的培训、更快的决策和分散的执行将继续是至关重要的。研究人员认为,自主系统质量的决定性因素将是硬件内部的OODA循环算法,它们独立地或与人类串联起作用。但是需要对这些算法进行训练,以便硬件知道该做什么。简而言之,人的训练将不再适用; 相反,算法训练将变得越来越重要。质量算法将在战术环境中实现更大的灵活性,并允许以前所未有的规模进行分散执行。因此需要在人与自治系统之间构建一个快速训练算法并建立信任和信心的战略框架。
战略框架
正在开发的用于训练蜂群自主系统的一个有前途的框架是DARPA的进攻性蜂群战术(OFFSET)计划。OFFSET建议使用实时对抗环境和虚拟现实界面,以允许用户通过“ 众包 ”方法为自治系统推导出新颖的蜂群策略。通过使用特定任务的对抗来训练,测试和使用蜂群功能(而不是根据任务定制原始蜂蜂行为),OFFSET框架显示出了重大的希望。
但是,我们预见OFFSET会带来三个弱点。首先,随着时间的推移,依靠众包努力来试验对抗可能很难维持。随着项目中的兴趣(和资金)消退和流动,“人群”的规模可能无法持续。其次,随着不同的硬件和环境准备好进行测试,众包方法在培训中迅速重复变得麻烦。第三,OFFSET太慢了。它强调了训练群体的实时模拟环境,无人机通过战斗空间“点击”移动。这种方法降低了群体在操作中的速度和主动性,并且使得难以加速重复以在几分钟或几秒内通过数千种潜在的战术场景训练无人机。
然而,将OFFSET现有的框架与“窄”的AI相结合,可以产生一种快速、灵活,适应各种任务的新型框架。2017年,谷歌的Deep Mind在应用类似的“自我发挥”训练框架(即强化机器学习)来生成一种掌握中国围棋大师的MASTER算法时感到惊讶。谷歌狭隘的人工智能能够在短短几天内积累数千年的人类知识,这只能通过比实时更快的模拟来实现。将谷歌在狭隘人工智能方面的突破与特定任务的兵棋推演相结合,提供了一种强大的方式来训练和战斗蜂群的无人机。
例如,狭窄的人工智能可以发挥兵棋推演模拟高级决策、行动、互动,以及为负责保卫基地的一群空中无人机产生的行为。狭窄的AI不是求解集中式解决方案来管理整个防御群的位置,而是迭代地发现个体交互的最佳规则,这些规则相结合,产生集体群体行为,最大限度地减少攻击力造成的基础伤害。最终,由此产生的“AI训练的”本地交互规则被加载到真实世界群中的每个无人机中,准备执行特定的基本防御任务。优化的本地无人机交互规则可实现自组织和分散,从而减少人员监督以执行特定任务。
我们认为,这个拟议的空军“群体方式”解决了当前无人机训练框架的弱点。首先,它的执行速度很快,并且避免了众包的不稳定性。人群的工作负载需求被人工智能算法和云计算的持续可用性所取代。其次,狭窄的AI和兵棋都将具有高度的灵活性,能够适应不断变化的推演假设,例如新的硬件或环境条件。如果新的传感器可用,允许无人机更好地检测对手,框架可以快速重新运行以再次掌握修改后的推演。第三,该框架继续应用使用任务来确定能力而不是相反的原则,但它通过允许狭义的AI解决保持分散执行原则的本地无人机交互规则来实现。
预期的挑战
结合高度逼真的兵棋推演和前沿的狭窄人工智能需要整合私营部门知识和军事主题专家。不幸的是,围绕这种伙伴关系的摩擦已经发生,近4000名谷歌员工要求终止他们公司对国防部Maven项目的支持。该项目旨在通过帮助军事分析人员更好地处理,利用和传播大量收集的情报、监视和侦察数据,使用狭义的人工智能来减少人工负担并最大限度地减少非战斗人员的伤亡。
此外,当使用窄AI时,存在“黑匣子”现象的风险。当由于所使用的机器学习技术的复杂性而没有对算法做出的决定的简单解释时,会发生这种情况。最终,军方必须在其承担的风险方面取得平衡。权衡取决于低人类偏见和更多决策灵活性,或高人类偏见,更深入地了解算法为何做出特定决策,这可以增加信任和信心。
“直到敌人说它已经结束,战争才结束。我们可能会考虑一下,我们可能会宣布结束,但实际上,敌人会得到投票。“
——国防部长吉姆·马蒂斯
《打破“头脑”方阵—兵棋推演的历史、变革与创新》,将现代兵棋近二百年的发展变革创新历程,以片断式的方式逐次展开,通过解析典型兵棋案例,分析中外兵棋发展历程,将历史、科技、变革与创新通过兵棋这一纽带进行“串联”起来,使读者从中找出规律,寻找思路,启发思考,探索未来变革创新与发展路径。
有些人甚至认为,群体可能“ 在抵达时死亡。”首先,这些批评者指出,无人机可能不如那些倡导技术预测的人那么便宜。但是,虽然我们承认武器化无人机在这一点上可能成本过高,但商业上可用的系统如DJI Mavic 2(美国士兵在最近的禁令之前广泛使用)在给定正确的决策算法的情况下,足够便宜(每个大约1000美元)以获得足够的数量来利用群体在非动态任务中的好处。其次,群体怀疑论者还声称,能够实现无人机群体的相同信息技术也将使对手能够部署廉价有效的防空来打败他们。虽然有证据支持这一说法,但历史提醒我们,即使最好的防空也不总是完美的。例如,斯坦利鲍德温在1932年宣布“ 轰炸机将永远通过 ”防空在第二次世界大战期间被证明是确实的,如果轰炸机的部队愿意承受高伤亡(将均能突破防空)。成本低廉的自治系统本质上降低了维持高伤亡的风险。因此,尽管防空技术先进,但数量足够多,群体将始终能够通过。
最后,一些基于计算机的兵棋推演的反对者认为,这些模型会在理论与现实之间产生差距,因为它们无法捕捉人类的动机,如欲望、承诺、激情或意志。虽然这些批评具有优点,但它也取决于兵棋的预期用途; 兵棋越具体(不太通用化),模型就越具代表性。此外,使用其他方法(例如实地测试)验证兵棋可以增强其预测效用并缩小模拟与现实之间的差距。在现场测试蜂群的情况下,数据可以反馈到AI和兵棋框架中,以在后续操作中生成更精细的行为。
一种蜂群方式
许多人已经认识到军事硬件的成本上升以及军种数量的相对减少。军方试图通过投资大量廉价系统(如无人机群)来扭转这一趋势,但却忽略了一个关键因素:如何训练群体。为了充分利用群体的潜力,空军必须在人类自治团队中建立信任,并培训分散群体执行。
我们认为,这种空军“群体方式”有望为其即将推出的自主系统群体训练一系列策略。使用狭窄的AI来玩特定任务的兵棋推演提供了一种快速、灵活和自适应的方式来发现导致有用的集体群体行为的最佳本地交互规则; 这可以通过减轻人的负担来增强人类自治团队。如果不将更多自由行动委托给群体的自治系统,未来作战环境的速度、范围和复杂性将超过人类自治团队。正如过去培养优质机组人员的战略决策一样,未来,为空军无人机群体训练最优质的算法并与飞行员合作将有助于美国军方保持竞争性的军事优势。
作者:克莱顿·斯科特少校
空军特种作战司令部的职业飞行员。他目前正在加利福尼亚州蒙特雷海军研究生院的国防分析部门学习非正规战争,并努力获得第二个硕士学位。他毕业于美国空军武器学校,并驾驶了AC-130H Spectre和AC-130W Stinger II飞机,同时参加“持久自由行动”,“内窥行动”和其他多项应急行动。
作者:卢卡斯·威尔少校
是一名高级飞行员,驾驶着空军空战司令部的远程驾驶飞机。他目前正在加利福尼亚州蒙特雷海军研究生院的国防分析部门学习非正规战争,并努力获得第二个硕士学位。他操作MQ-1B“捕食者”远程驾驶飞机和HH-60G作战搜索和救援直升机,直接支持“持久自由行动”, “内窥行动”以及其他多项应急行动和人道主义救援工作。
本文摘自美国防部“战争之石”网站
本文章是由"桌面战争"公众号出品!
严禁非授权转载!欢迎朋友圈转发
桌·面·战·争
WAR
GAME
兵棋交流者平台,挖掘兵棋原理及背后的故事!
桌面战争
兵棋交流者平台,挖掘兵棋原理及背后的故事!