查看原文
其他

国际瞭望|军事上的大数据——为人工智能做准备

蓝荣钦 慧天地 2021-09-20


点击图片上方蓝色字体“慧天地”即可订阅

      为方便专业课教师们互相交流,取长补短,共同提高本科教学质量,特倡议成立地球空间信息领域本科专业课教学联盟:关于成立地球空间信息领域本科专业课教学联盟的倡议书


转载本文需经编译者同意和《慧天地》许可

大量的数据管理得当,对包括军队在内的许多行业来说都是一种福音。如果不知道资源部署的时间、地点和内容,就不可能进行有效的军事行动。因此,军事大数据可以帮助国防领导人做出更好的决策,前提是它不是“暗数据”。

“大数据”一词是20多年前的1997年,在第8届IEEE可视化会议上发表的一篇论文中率先提出的。这个术语描述的是单个数据集太大,无法装入主内存。

当时,计算机内存以兆字节为单位,最强的内存运行是128MB。由于科学家通过互联网共享信息,越来越多的数据以越来越快的速度传输,难怪开发处理大数据的技术会有如此大的压力。

如今,最便宜的智能手机,内存上运行的数据也能达到1千兆字节(1000MB),因此不断增长的数据量并不像以前那么严重。2013年的世界数据量为4.4 zettabyte s(1 zettabyte=44万亿GB),到2020年,这可能会上升到44zettabytes或更高。然而,先进的计算机硬件使得数据采集和存储相对便宜和容易。此外,人工智能(AI)和机器学习(ML)技术、分析技术的最新发展,也使得管理变得更加容易。

美国国家地理空间情报局(National Geospatial-Intelligence Agency)正在使用人工智能实现图像处理自动化,美国国家侦察局(National Reconnaissance Office)正在使用人工智能工具来自动化流媒体多智能数据的分析,以检测情报活动,并自动完成稀缺而昂贵的情报资源收集的任务。

然而,军方大数据的收集经常引发争议。最近的一个争论焦点是使用开源机器学习平台收集可视化数据。无人机是这种情况下用于数据收集的方法,或者用军事术语来说,用于情报收集。抗议活动本身并不是针对这些数据,而是针对ML可能被用于攻击。

这种突然出现的反对军事使用技术的力量是一件奇怪的事情,因为将其用于情报收集并不是什么新鲜事。当然,今天使用的方法是不同的,但是数据本身的性质和重要性是不同的。

美国军方继续与情报界合作,在各个学科中收集情报,这可能被有趣地称为“INTs”(情报组织)。美国情报委员会下有17个机构,但他们的军事用途在以下学科产生交集:

•HUMINT(人工情报)

•GEOINT(地理空间情报)

•SIGINT(信号情报)

•OSInt(开源情报)


 以色列国土安全部情报分析师

 

1.人工情报


人工情报(HUMINT)收集是通过人与人的接触来收集信息。信息采取文件、照片、数字文件和其他材料的形式,通过非官方渠道或通过外交、领事人员以及与外国官员的授权通信秘密地获取。军方也可能通过询问敌人或听取旅行者的汇报来获取情报。

大多数人把人工情报和间谍联系在一起,间谍有时被开玩笑地称为世界上第二古老的职业,这种说法大部分是对的。间谍在这一学科的情报收集工作中继续发挥着重要作用,尽管它与其他情报部门相比具有更大的互补性。例如,人工联系人可能提供代码,使信号情报操作者能够远程访问对手的系统。

在当今科技进步的时代,人工情报的重要性还在于它所处的环境,而人工情报支持的监视可能会忽略这一点。在评估军事目标的有效性和观察其发展过程中,派人到现场可以提供宝贵的人类洞察力。

通过人工情报收集的数据通常采用不同的格式,包括模拟格式和数字格式。它可能是音频、视频、文本或图像,并且必须经过分析才能与通过其他学科收集的数据集成。基于人工智能的软件可以标记、组织和分析人工情报数据,目前正在接受军方评估的软件之一是雷声公司的FoxTen情报平台。


FoxTen情报平台的自动化地形分析功能

 

然而,人工智能可能很快就会在对抗跟踪技术方面发挥更积极的作用,其中一些技术是专为间谍设计的,另一些则是一种不知情的工具。美国中央情报局(CIA)有几个正在进行的人工智能项目,包括设计欺骗跟踪设备的方法,或绘制在敌对或未知地区的监控摄像头的位置地图。


2.地理空间情报


根据美国法典,地理空间情报是指使用和研究图像和地理空间数据来解释、审查和直观地表示地球上的特征和活动。简而言之,GEOINT包括从图像、视频和其他从空中、地面或水下获取的视觉表示中收集的所有情报。

在军事意义上,GEOINT的价值在于提供对象和活动的精确位置,解释其含义,并为军事决策提供一体化时空框架。视觉数据通常来自卫星、无人机(UAV)、自主水下航行器(AUV)和其他测量技术。

在大多数情况下,GEOINT数据是来自不同来源的地理空间数据的集成,以创建对态势的三维表达。然后,集成到多源情报数据中。

在本节中特别提到的是无人机的使用,更常见的是无人机。多年来,军方一直在使用无人机收集情报,以支持军事人员和军事行动。

然而,由于通信速度、存储容量和利用机器视觉软件自主操作无人机的能力的提高,导致了数据过载。

美国军方有超过8000架无人机的库存量,并使用它们取得良好效果。人类工作人员每天必须浏览大约1600小时的视频片段,而这不包括图像。这些数据对地面士兵和司令部指挥官来说是无价的,但其前提是,分析必须准确、及时。人工智能和ML算法可以比人工操作者更快、更彻底地分析视频和检测威胁。这是美国军方马文(Maven)项目的基础,马文目前使用基于TysFoFund的平台进行无人机镜头的预测性分析。在谷歌决定不更新AI开发项目之后,五角大楼转向了安得里尔工业公司,开发了军用无人机的传感器融合平台。


预测性分析在军事上的应用

 

根据该公司网站介绍,利用莱迪思的人工智能平台(Lattice AI platform),只有最终的信息才会被传送回用户。这使得由强大计算机组成的大规模可伸缩网状网络可以进行数字处理,而无需部署服务器群或指挥中心。


Lattice AI Core

 

3.信号情报


信号情报是关于通过截获信号和传输获取的外国目标的行动、目的和能力的信息。根据传输类型,信号情报有三个子集。通信情报(COMINT)来自通信系统,电子情报(ELINT)来自雷达和武器系统,外国仪器信号情报(FISINT)来自正在开发或测试的武器系统。

美国国家安全局(NSA)通常使用各种方法收集针对恐怖分子、组织以及与国际或外国组织有联系的人士的情报,但往往最常用无人机。只有在美国政府正式要求时,它才会这么做。美国国家安全局将原始数据翻译、解码和分析为一种可用的形式,供CIA和情报组织等非国家安全局分析师使用。

信号情报总是有足够多的数据来工作,因为它有如此广泛的数据源。电话交谈、电子邮件、无线电波、卫星传输、无线连接,甚至键盘振动一直在进行,为国家安全局提供了大量的信息。

挑战在于从随机信号的碎片中挖掘出有价值信息。收集过程包括首先从信号层中提取特定类型的信号,或者从杂乱的对话中提取对话。提取之后,信号情报分析人员过滤候选项,根据一组参数选择保留的项。然后,美国国家安全局存储这些选定的项目,并将它们发送给请求机构进行进一步分析。

这个过程是艰苦的,并不总是像它可以做到的那样彻底。情报组织不可避免地将目光投向先进的人工智能和ML技术,以使其更快更好地运行。信号情报的主要目的是防卫。了解敌人的位置、意图和能力对于防止那些针对士兵和平民的伤害大有帮助。

然而,研究人员越来越希望信号情报能做其他事情。一是提供洞察力,帮助他们从收集的数据中对未来事件做出准确的预测。

美国情报组织研究机构“情报高级研究项目活动”(IARPA)请求学术界和商业领域的数据科学家和ML工程师伸出援助之手,以开发连续的、自动化的信号情报分析技术。一个称为“水银挑战”(Mercury challenge)的奖项专门颁发给能够有效“预测包括军事行动、社会动乱或传染病在内的事件的算法,特别是在中东和北非的阿拉伯语国家。”

此外,复杂的网络和电磁活动(CEMA)的迅速崛起,以及来自对手的电子战正迫使陆军将信号情报、网络和电磁系统融合到一个平台上:地面层情报系统。陆军正在积极寻求加快集成的研究建议,包括开发机器学习软件以减少工作量。

信号情报技术的另一个潜在用途是发挥更积极的防御作用。探测、识别和评估信号威胁级别(如地对空导弹的雷达)的能力,可以区分任务的成功和失败。

波音EA-18G“咆哮者”通过干扰敌方雷达信号来保护士兵的安全。他们计划通过集成人工智能软件,使咆哮者在防御中更加有效,该软件可以更快地检测到信号,并更准确地分辨出友好和敌对的信号。

信号情报收集和分析的世界不再是拦截消息和破解代码以供他人采取行动。在精细数据和机器学习的帮助下,信号情报正在接受快速发展的电子战的挑战。


4.开源情报


从术语本身可以直观地看出,开源情报是从开放的或公开可用的数据源收集数据,用于特定目的的开发。这是对开源情报的一个非常宽泛的定义,而且在开源情报存在的50年里,很难确定一个更详细的定义。根据兰德公司的说法,原因是公开可用的数据源总是在变化。随着互联网的普及和社交网络的爆炸式发展,这一点变得更加明显。

开源情报的来源经过多年的演变。在第一次迭代中,最多产的开源情报资源是电视、广播和印刷媒体。在过去,人工操作人员会手动遍历这些数据源。后来,情报机构使用商用现成软件(COTS)来收集、清理和分析开源情报数据。

传统媒体仍然是开源情报的来源,但真正的数据收集引擎是互联网。即时访问随时可用的和不断更新的数据有利于情报收集工作。这些内容包括博客、在线报纸、社交网络、视频流媒体服务、论坛和其他用户贡献的内容,以及隐藏在网站后端的宝贵内容。

问题在于可用数据的绝对数量和复杂性。来自互联网的数据流有一层又一层的细微差别,分析师必须执行从事实核查到情绪分析的所有任务,始终牢记数据的上下文。

要为这项任务的艰巨性增加视角,考虑一下社交媒体。Twitter用户平均每天上传6.56亿条推文,Facebook用户每天发布43亿条信息。这是来自两个社交网络的数据。再加上每天谷歌的搜索量(52亿次)、YouTube视频的观看量(每分钟400万次)、博客文章的发布量,这对军方来说是一个非常大的数据量。

在军队中,分析人员必须能够过滤这些数据流,以识别和分类任何对军事战略和行动有任何使用价值或影响的东西。这可能与某些国家、特定个人、危险人口、武器等有关。他们必须彻底做到这一点,在人类行为的背景下,并且是实时的。

对人类操作员来说,没有强有力的协助,这显然是一个不可能的任务,情报组织知道这一点。为了满足这一需求,CIA目前正在研究几个将人工智能用于开源情报的项目,但不只是用于分析。CIA计划使用人工智能软件和自然语言处理算法,系统地处理社交网络和其他开源情报数据源的数据流。该软件将只选择相关的项目,理论上可以将开源情报收集器的工作负载减少75%。

CIA的基本理念是与民营企业合作,在5年内开展开源情报和机器学习大数据收集与分析的实验。美国中央情报局于2018年5月宣布了梅萨维德项目(Mesa Verde project),但目前还没有关于该计划的最新消息。

然而,商业部门却没有这么谨慎。像谷歌这样的公司已经拥有专门用于处理大数据的工具和API。谷歌公司研制的BigQuery已经具备查询特性。

 

Google BigQuery - Analytics Data Warehouse - Google Cloud Platform

 

军队的大数据来源很多,信息过载是一个非常现实的问题。人工智能和机器学习或许是一种有效的解决方案,但我们更清楚的是,它们的力量比重新发明轮子更有效。寻找商业和学术机构来处理大数据是军队采取的最合乎逻辑和最具战略意义的行动。


原文出处:

https://emerj.com/ai-sector-overviews/big-data-military/


点击下方“阅读原文”打开网站。

编译:蓝荣钦(郑州信息工程大学),《慧天地》特约撰稿人

欢迎大家关注《慧天地》同名新浪微博

微博ID:慧天地_geomaticser

荐读

点击下文标题即可阅读

国际瞭望|美国数据与分析峰会:利用数据提高任务效率

国际瞭望|关于地理空间人工智能的五点思考

国际瞭望|将深度学习与GIS相结合


编辑 / 毕欣慧  审核 / 张胜威 李梦夏

指导:万剑华教授

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存