查看原文
其他

美陆军将利用人工智能分析敌军行动方案

The following article is from 防务快讯 Author 赵锋


远望智库:与智者同行,为创新加速

专家库 | 人才库 | 企业库 | 项目库 | 投资机构库 | 招商信息库 | 前沿特攻队招募


转自:防务快讯

编译:赵锋



自从2016年,由Google DeepMind开发的人工智能产品AlphaGo在围棋比赛中击败了世界冠军后,人工智能领域的研究人员开始向电脑即时战略游戏发起挑战。2018年8月,OpenAI公司开发的人工智能在Dota 2(一款电脑即时战略游戏)中击败人类职业电竞选手;而2018年12月10日,DeepMind开发的人工智能 AlphaStar更是以10:1的比分战胜了“星际争霸2”的职业选手。与围棋类游戏相比,电脑即时战略游戏通常是实时的,需要制定长期策略,并且比围棋有更多的移动可能性。因此,人工智能在这一领域的接连获胜代表着又一次伟大的突破。

人工智能在商业领域的突破为军事应用带来了契机。尽管美国陆军在机器人和自动系统方面取得了重大进展,但人工智能规划和控制系统仍十分落伍,不具备战术层面的敌军行动方案自动分析能力。美陆军机动营参谋在规划作战时,只能通过人力来分析地形和天气情报,以预测敌人的行动路线,并判断敌方指挥官如何最有效地指挥作战。参谋人员根据此分析来规划友军的行动方案。这个过程和30年前的作战规划过程大致相同。只不过如今的参谋人员掌握更多的情报产品(图像、无人机拍摄的视频等),计算机可以辅助显示敌军和友军的行动方案,但是美军还没有可以通过分析地形、天气和敌军武器等信息来模拟出最佳敌军行动方案的人工智能分析工具。鉴于最近人工智能技术的突破,特别是在抽象策略游戏中获胜的能力,这种类型的人工智能分析工具也许很快就能投入到军事应用中。

目前,美国陆军训练和条令司令部(TRADOC)正在开发敌军行动方案分析工具。就复杂性而言,开发人工智能敌情分析工具更类似于玩电脑即时战略游戏而不是下围棋。人工智能必须了解如何恰当地在各种地形中使用武器,如何利用天气来影响作战,如何协同,如何运用欺骗战术,如何重新补给等等。除了这些复杂的概念,战场环境也在不断变化。尽管如此,人工智能能够有效地完成所有这些工作只是时间问题。

人工智能敌军行动方案分析工具的目标是根据某些输入确定最可能的敌军行动方案,为每个行动方案分配一系列概率,并根据持续的数据输入流来实时更新这些概率。

这类工具基本上通过两种方法来开发。第一种方法是历史数据法,类似于AlphaGo一样,人工智能通过学习历史数据来预测敌人的行动方案。第二种方法基于深度强化学习,类似于AlphaStar。深度强化学习训练没有数据集,人工智能需要建立游戏模型,使用游戏规则进行编程,然后自我学习(玩几百万次)。

历史数据方法

美国国家训练中心(NTC)在训练轮值期间收集和存档大量数据。这些数据捕捉了演习的基本要素:车辆何时移动和射击、何时被击中以及飞机、火炮等要素如何影响战斗。通过机器学习,人工智能可以在国家训练中心学习如何有效地战斗。它可以了解车辆在哪易被摧毁(例如,在低海拔的开阔地带),在哪能最有效地摧毁敌军车辆(可能在较高地形的掩护下),以及在哪最容易受敌方火炮攻击。

用国家训练中心的数据来训练人工智能存在诸多挑战。国家训练中心只捕捉车辆数据,不跟踪徒步士兵。中心的数据仅显示车辆何时被敌方单兵武器系统击中,但不知道袭击的武器在何处。国家训练中心大约有50支轮值训练部队数据,但是为了使人工智能有效地学习,开发人员通常需要更多数据。一种解决方案是首先将人工智能训练到较低级别。用以如以更多的连级部队交战数据来训练人工智能。这方面,AlphaStar的初始训练策略就是用人类比赛的回放录像(Replay)对模型进行学习训练,以模仿训练的思路让模型快速学习到高水平玩家们在“星际争霸2”天梯中使用的基础策略和微操作。这时候的AlphaStar就能够以95%的胜率打败“星际争霸2”内置的“精英”级别的人工智能了。(作为对比,OpenAI的DOTA2人工智能则完全从零开始进行强化学习,初始阶段花费了很多时间在无意义的游戏操作上。)

 “一支半自动化部队(OneSAF)”是一款具有高逼真度地形的仿真软件,可以模拟从火力班组到营级的部队单位。利用归档迭代作为训练数据集,人工智能可以学习如何在OneSAF中获胜。如果取得成功,人工智能就可以成为模拟的敌军部队,或者可以用作敌军行动方案分析工具。例如,营队可以在战场上用OneSAF来模拟敌军的行动路线。不过OneSAF也有局限性,它是一款比较老的模拟软件,为旧系统创建复杂的人工智能可能不具成本效益。而且OneSAF并非一款直观的、易于使用的软件,有经验的士兵通常需要40小时的训练才能学会如何操作。

WARSIM是一款于2004年部署的仿真系统,用于从旅到军以上梯队。陆军模拟中心广泛使用WARSIM。与OneSAF的不同之处在于,WARSIM不使用高逼真度地形并且不对单个武器系统建模,它重点关注的是部队与部队作战。WARSIM的缺点是:只能在旅级以上部队使用;并且与OneSAF一样,是一款旧系统,为它开发人工智能不具有成本效益。

深度强化学习方法

为了实现深度强化学习,程序员必须首先创建一个人工智能环境。人工智能环境能够修改游戏,并将数据直接发送给人工智能玩家。例如,人通过观看屏幕、键入指令或使用鼠标来玩游戏,而人工智能以数据的形式直接从游戏中读取数据。

使用类似于OpenAI或AlphaStar的深度强化学习,人工智能能够通过更少的数据以数百万次的模拟学习来掌握OneSAF。通过反复试验,人工智能将学习哪些行为有效,哪些行为无效。

开发深度强化学习型人工智能面临着某些挑战。首先,OneSAF这类人工智能技术必须由顶尖科研人员开发而不能直接从市场上购买,即便是掌握了尖端技术的公司目前尚不具备这类技术。此外,与围棋类游戏相比,人工智能掌握OneSAF更加困难,因为OneSAF中没有明确的奖惩规则 ,必须通过人工智能玩家摧毁对方部队或占领关键地形来添加奖励规则,需要人工智能具备一定的创造力。除了作为敌军行动方案分析工具之外,OneSAF 人工智能还可以帮助开发友军的行动方案,并在仿真中用人工智能取代成本高昂的承包商来扮演敌军部队。

美军也可以考虑其他可用的人工智能解决方案。例如,Flashpoint Campaigns是一款模拟现代地面战斗的商用游戏。美国海军陆战队大学的Benjamin Jensen博士正在以该游戏为模型开发一款决策支持工具,可在游戏内开发人工智能玩家。与OneSAF和WARSIM相比,该游戏比较新颖,并且可以复制地面战斗,但尚未正式批准用于陆军仿真。师级演习训练和评估系统(DXTRS)是类似于FlashpointCampaigns的一种易于使用、低成本的陆军官方仿真系统,该系统主要在仿真中心之外使用,也可开发人工智能玩家。

未来发展

陆军必须利用现有数据和仿真环境来创建工具,将人工智能更全面地集成到指挥决策工具的开发中。尽管美国陆军在机器人和自动系统方面取得了重大进步,但人工智能规划和控制系统仍远远落后。一方面,可能是军事专业领域的专家在面临人工智能威胁时希望保持绝对的话语权。另一方面,可能是军方迟缓的采办过程阻碍了尖端技术的开发。但无论如何,研发基于人工智能的敌军行动过程分析工具是一种有益的概念验证。这些工具将帮助人们学习如何利用人工智能系统来指挥和控制战争中的人类和机器人部队作战。在整个军队中普及这类系统将促进人工智能在各种军事应用中的发展。人工智能将成为未来战争中不可或缺的一部分。

一网打尽系列文章,请公号内回复以下关键词查看:
创新发展习近平 | 创新中国 | 创新创业 | 科技体制改革 | 科技创新政策 | 协同创新 | 科研管理 | 成果转化 | 新科技革命 | 基础研究 | 产学研 | 供给侧
热点专题军民融合 | 民参军 | 工业4.0 | 商业航天 | 智库 | 国家重点研发计划 | 基金 | 装备采办 | 博士 | 摩尔定律 | 诺贝尔奖 | 国家实验室 | 国防工业 | 十三五 创新教育 军工百强 试验鉴定 | 影响因子 | 双一流 | 净评估 | 大学排名
预见未来预见2016 |预见2020  | 预见2025预见2030  | 预见2035 预见2045  | 预见2050
前沿科技颠覆性技术 | 生物 仿生 | 脑科学 | 精准医学 | 基因 |  基因编辑 虚拟现实 | 增强现实 | 纳米 | 人工智能 | 机器人 | 3D打印 | 4D打印 太赫兹 | 云计算 | 物联网 互联网+ 大数据 | 石墨烯 | 能源 | 电池 | 量子 | 超材料 | 超级计算机 | 卫星 | 北斗 | 智能制造 不依赖GPS导航 | 通信 5G | MIT技术评论 | 航空发动机 | 可穿戴 氮化镓 | 隐身 | 半导体 | 脑机接口 | 传感器
先进武器中国武器 | 无人机 | 轰炸机 预警机 | 运输机 | 直升机 战斗机 | 六代机 网络武器 | 激光武器 | 电磁炮 | 高超声速武器 反无人机 | 防空反导 潜航器
未来战争未来战争 | 抵消战略 | 水下战 | 网络空间战 | 分布式杀伤 | 无人机蜂群 | 太空战 反卫星
领先国家美国 | 俄罗斯 | 英国 | 德国 | 法国 | 日本 以色列 | 印度
前沿机构战略能力办公室 | DARPA 快响小组 | Gartner | 硅谷 | 谷歌 | 华为 阿里 | 俄先期研究基金会 | 军工百强
前沿人物钱学森 | 马斯克 | 凯文凯利 | 任正非 | 马云 | 奥巴马 | 特朗普
专家专栏黄志澄 | 许得君 | 施一公 | 王喜文 | 贺飞 | 李萍 | 刘锋 | 王煜全 易本胜 李德毅 | 游光荣 | 刘亚威 | 赵文银 | 廖孟豪 | 谭铁牛 | 于川信 | 邬贺铨
全文收录2018文章全收录 | 2017文章全收录 | 2016文章全收录 | 2015文章全收录 | 2014文章全收录
其他主题系列陆续整理中,敬请期待…… 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存