美国DARPA人工智能研究综述
The following article is from 防务快讯 Author 钱宁等
专家库 | 人才库 | 企业库 | 项目库 | 投资机构库 | 招商信息库
本文转载自防务快讯
作者:钱宁等
近年来,深度学习方法等取得突破性进展,推动人工智能技术快速地发展。美国充分认识到人工智能的战略意义,一直注重该领域的技术研发,从国家战略层面开始加紧布局,卓越的技术研发机构为人工智能的发展奠定了雄厚的技术基础,取得了大批令人瞩目的成果。美国国防高级研究计划局(DARPA)是美军开展人工智能研究的领导者,也是最重要的研究机构,美国人工智能的发展很大程度上也要归功于DARPA的支持。
1 人工智能技术发展的三次浪潮
DARPA依据技术特征,认为人工智能技术的发展已经历第一次和第二次浪潮,将迎来第三次浪潮。第一次人工智能技术浪潮开始于20世纪60年代初,以“手工知识”为特征,通过建立一套逻辑规则来表示特定领域中的知识,针对严密定义的问题进行推理,没有学习能力,处理不确定性的能力很弱。第二次人工智能技术浪潮开始于20世纪60年代末,以“统计学习”为特征,针对特定的问题域建立统计模型,利用大数据对它们进行训练,具有很低程度的推理能力,但不具有上下文能力。第三次人工智能技术浪潮以“适应环境”(上下文自适应)为特征,可持续学习并且可解释,针对真实世界现象建立能够生成解释性模型的系统,机器与人之间可以进行自然的交流,系统在遇到新的任务和情况时能够学习及推理。人工智能的持续自主学习能力将是第三次人工智能技术浪潮的核心动力。
DARPA从四个方面来评判人工智能技术的能力,分别是感知、学习、抽象和推理。图1描述了人工智能的三次浪潮在这四个方面能力的不同。
图1 人工智能三次浪潮的能力区别
2 DARPA人工智能研究历程
DARPA很早启动了跨学科人工智能项目,综合了计算机科学、数学、概率论、统计和认知科学领域内的最新成果。DARPA在人工智能方面的研究主要涉及自然语言理解、问题求解以及感知和机器人等领域。
DARPA在人工智能方面开展的主要研究如图2所示。
图2 DARPA在人工智能领域开展的研究
1)自然语言理解
20世纪70年代初,DARPA启动了语音识别研究(Speech Understanding Research,SUR)项目。在该计划中,DARPA支持多个研究机构采用不同的方法进行语音识别研究,取得较好成绩的是CMU的Hearsay-Ⅱ技术以及BBN的HWIM(Hear What I Mean)技术。其中Hearsay-II提出了采用并行异步过程,将人讲话内容进行零碎化处理的前瞻性观念;而BBN的HWIM通过庞大的词汇解码处理复杂的语音逻辑规则来提高词汇识别的准确率。进入80年代,DARPA开始采用统计学的方法研究语音识别技术,开发了Sphinx、BYBLOS、DECIPHER等一系列语音识别系统,已经能够整句连续的语音识别。
2000年之后,DARPA开始研制通过对话进行人机交互(HCI)的系统,该系统还能从与不同人的对话中学习经验,提供个性化的服务。2005年,DARPA启动了全球自动化语言情报利用(GALE)项目。该项目寻求能够对标准阿拉伯语和汉语的印刷品、网页、新闻及电视广播进行实时翻译的技术,目标是使得95%的文本文档翻译和90%的语音文件翻译均能达到95%的正确率。2008 年11月,DARPA又启动了Machine Reading项目,旨在实现人工智能的应用和发展学习系统的过程中,对自然文本进行知识插入。2012年启动的文本深度发掘和过滤(DeepExploration and Filtering of Text,DEFT)项目更加明确地提出要利用深度学习技术发掘大量结构化文本中隐含的、有实际价值的特征信息,同时还要具备可将处理后的信息进行进一步整合的能力,在此基础上,将这些技术用于作战评估、规划、预测的辅助决策支持中。2014年DARPA启动大机制(Big Mechanism)项目,开发协助计算机阅读科学和技术文章的技术,将知识片段综合成更完整的模型,并提出实现特定目标的干预措施。
2)感知和机器人
环境感知主要涉及各类传感器信息的识别和应用。随着研究的深入,特别是研制无人系统(主要是无人车)对信息输入的苛刻要求,DARPA的项目从对静态信息的识别逐渐向动态信息的感应和识别方向发展。
DARPA于1976年开始图像理解(Image Understanding)项目。最初的目标是用5年的时间开发出能够自动或半自动分析军事照片和相关图片的技术。项目参与单位包括麻省理工学院、斯坦福大学、罗切斯特大学、SRI和霍尼韦尔公司等。1979年,项目的目标增加了图形绘制技术。到了1981年,预计5年内完成的项目并没有终止,而是持续到2001年。
2001年,DARPA为解决环境感知问题,启动了PerceptOR项目,其目的是开发新型无人车用感知系统,要求系统足够灵巧,能够保证无人车在越野环境中执行任务,并且能在各种战场环境和天气条件下使用。2005年该项目完成阶段性研究,后转移到“未来作战系统地面无人车集成产品”项目,进行系统开发与测试。
2010 年3月,DARPA启动了心灵之眼(Mind’s Eye)项目,旨在为机器建立视觉的智能,可对视频信息进行形象推理。
3)问题求解
DARPA在20世纪80年代资助动态分析和重新规划工具(DART)项目,采用自动推理,显著改善沙漠风暴和沙漠盾牌行动中后勤和其他规划职能的问题解决辅助计划。在DART的帮助下,之前需要四天才能完成的部署计划,现在仅需要数小时就能完成。
通过其可学习个性化助理(PAL)计划,DARPA创建了认知计算系统,提高了不同层次军事决策的效率,降低了对于大量指挥人员的需求,并实现更小型、移动性更高且不易受到影响的指挥中心。
DARPA的先进机器学习概率规划(PPAML)计划旨在创建用户友好的编程语言来简化和普及机器学习应用。通过避免专家从头开始构建定制软件的繁琐工作,这样做将加快的智力密集型应用程序的开发,包括垃圾邮件过滤器、智能手机个人助理和自动驾驶车辆等。
2006年DARPA开始综合学习(Integrated Learning)项目,目标是将专业领域知识和常识综合建立一个推理系统,该系统能像人一样学习并可用于多种复杂任务。
2010年,DARPA开始资助深度学习(DL)项目,目标是构建一个通用的机器学习引擎。深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别、图像识别和检索、自然语言理解等。深层模型是包含多个隐藏层的人工神经网络,多层非线性结构使其具备强大的特征表达能力和对复杂任务建模能力。深度学习是目前最接近人脑的智能学习方法,将人工智能带上了一个新的台阶,将对一大批产品和服务产生深远影响。
3 最新研究项目
1)可解释的人工智能(Explainable Artificial Intelligence,XAI)
由于机器不能向用户解释其想法和行动,研究人员也无法完全理解人工智能系统的决策过程,难以分辨人工智能系统某个具体行动背后的逻辑。可解释性是人类与人工智能关系发展的核心,人工智能系统必须向操作人员解释行为决策原因,以获得人类信任。
2016年10月,DARPA发布可解释的人工智能项目的广泛机构公告(BAA),其目标是建立一套新的或改进的机器学习技术,生成可解释的模型,结合有效的解释技术,使得最终用户能够理解、一定程度的信任并有效地管理未来的人工智能系统。通过该项目,新的机器学习系统将能解释自身逻辑原理、描述自身的优、缺点,并解释未来的行为表现。
这一项目提出了三个挑战:如何生成可解释模型、如何设计解释接口、如何理解用户心理需求以进行有效地解释。对此,该项目将开发一系列新的或改进的机器学习技术,生成更多的可解释模型;希望将最新的人机交互技术(如可视化、语言理解、语言生成和会话管理)与新的原则、策略和技术相结合,获得有效的解释;总结、拓展和应用当前的关于解释的心理学理论。
该项目分为两个技术领域:可解释的学习者(Explainable Learners)和解释的心理学模型(Psychological Models of Explanation)。图3描述了该项目的总体架构。
图3 XAI项目的架构
2017年3月,DARPA从学术和工业界中挑选出了13家研究机构进行资助,包括加州大学伯克利分校、加州大学洛杉矶分校、卡耐基梅隆大学、SRI、Rutgers、PARC、Raytheon等。
目前,华盛顿大学的研究团队已经取得了一些研究成果:研究团队开发了一种方法,可以让人工智能系统阐述其输出结果的基本原理,人工智能系统(计算机)将会从数据集中自动找到一些样本,然后给出简短的解释;研究团队还针对图形识别系统设计了一些方法,通过标注图片上最重要的部分来揭示图形识别系统的判断逻辑。
2)终身学习机器(Lifelong Learning Machines,L2M)
目前人工智能以机器学习技术为核心,并依赖于庞大的数据支撑。但编程者无法预知所有可能出现的元素或面对的情景。当这些机器学习系统遇到程序和数据库中并未包含的特殊情形时就会不知所措。如果想扩展机器学习系统在该新环境下的能力,必须停止其服务并利用额外的数据对其进行再训练,但这种做法依赖于人类的介入且效率较低。与此不同,生物系统能够实现自主训练,从过往经历中不断汲取经验,即使面对全新的环境也能根据积累的知识做出适应性调整。
DARPA于2017年启动L2M项目,探索生物学习机理在人工智能中的应用,推进新一代人工智能系统的发展。该项目的目标是开发支持下一代自适应人工智能系统所需的技术,使其能够在实际环境中基于情景进行在线式现场学习并改善性能,不需要进行线下再编程或再训练。这种持续自主学习的能力可帮助系统在没有预编程与训练的情况下适应新情景。
L2M 试图将生物学习机理应用于计算机机器学习系统,打破现有机器学习系统对预编程和训练样本的依赖,使人工智能系统像生物系统一样能够根据经验进行决策,提高行动的自主性,增强广度环境适应能力。为了实现这一目标,L2M项目旨在从根本上开发一种全新的机器学习机制,使系统能够从经验中不断学习,这与孩童和其他生命体一生不断从经验中进行学习与训练的机制非常相像。L2M项目周期为4年,有两个技术领域。第一个技术领域是开发机器学习框架,可持续应用过去的经验成果,并使用“经验教训”去适应新的数据或情景;同时,还需开发用于监测机器学习系统行为的技术,对系统可以适应的能力范围进行设置,并具备在必要时对系统进行干预的功能。第二个技术领域源自对生命体学习机制的学习,将专注于研究生命系统自我学习和适应的原理和技术;并考虑这些原理和技术是否能够以及如何应用在机器学习系统中。L2M项目的结构如图4所示。
图4 L2M项目的架构
L2M项目的新型机器学习机制所具有的核心能力包括:持续学习,系统在执行期间能够学习;适应新的任务和环境,将已有的学习能力应用于新的场景,但不丢弃之前已学习过的任务;目标驱动的感知,从任务的角度去理解输入信号;选择性的可塑性,在稳定性和可塑性之间平衡;安全性和可监控。
目前,L2M研究团队致力于研究计算系统如何能够实时适应新环境而不会丢失之前的知识。加州大学欧文分校的一个研究团队计划研究海马和大脑皮层的双重记忆结构。该团队试图创建一种能够通过对比现有记忆输入来预测潜在结果的ML系统,这将使系统在保留之前学习内容的同时变得更具适应性。塔夫茨大学研究小组正在研究在蝾螈等动物中观察到的再生机制,以研究能够在任务过程中通过改变其结构和功能来适应环境变化的柔性机器人。
通过研发新一代机器学习技术,使其具备能够从环境中不断学习并总结出一般性知识的能力,L2M项目将为第三次人工智能技术浪潮打下坚实的技术基础。
4 结语
人工智能技术在感知与信息处理、指挥决策、赛博安全、无人系统等军事领域正发挥着越来越重要的作用。随着人工智能技术的不断发展,具有可持续学习并且可解释其决策的能力,获得人类信任,将推动无人自主系统成为未来重要的作战力量,促进各种新型作战样式的发展。
一网打尽系列文章,请回复以下关键词查看: |
创新发展:习近平 | 创新中国 | 创新创业 | 科技体制改革 | 科技创新政策 | 协同创新 | 成果转化 | 新科技革命 | 基础研究 | 产学研 | 供给侧 |
热点专题:军民融合 | 民参军 | 工业4.0 | 商业航天 | 智库 | 国家重点研发计划 | 基金 | 装备采办 | 博士 | 摩尔定律 | 诺贝尔奖 | 国家实验室 | 国防工业 | 十三五 | 创新教育 | 军工百强 | 试验鉴定 | 影响因子 | 双一流 | 净评估 |
预见未来:预见2016 | 预见2020 | 预见2025 | 预见2030 | 预见2035 | 预见2045 | 预见2050 | |
前沿科技:颠覆性技术 | 生物 | 仿生 | 脑科学 | 精准医学 | 基因 | 基因编辑 | 虚拟现实 | 增强现实 | 纳米 | 人工智能 | 机器人 | 3D打印 | 4D打印 | 太赫兹 | 云计算 | 物联网 | 互联网+ | 大数据 | 石墨烯 | 能源 | 电池 | 量子 | 超材料 | 超级计算机 | 卫星 | 北斗 | 智能制造 | 不依赖GPS导航 | 通信 | MIT技术评论 | 航空发动机 | 可穿戴 | 氮化镓 | 隐身 | 半导体 | 脑机接口 |
先进武器:中国武器 | 无人机 | 轰炸机 | 预警机 | 运输机 | 战斗机 | 六代机 | 网络武器 | 激光武器 | 电磁炮 | 高超声速武器 | 反无人机 | 防空反导 | 潜航器 | |
未来战争:未来战争 | 抵消战略 | 水下战 | 网络空间战 | 分布式杀伤 | 无人机蜂群 | 太空站 |反卫星 |
领先国家:俄罗斯 | 英国 | 日本 | 以色列 | 印度 |
前沿机构:战略能力办公室 | DARPA | Gartner | 硅谷 | 谷歌 | 华为 | 俄先期研究基金会 | 军工百强 |
前沿人物:钱学森 | 马斯克 | 凯文凯利 | 任正非 | 马云 | 奥巴马 | 特朗普 |
专家专栏:黄志澄 | 许得君 | 施一公 | 王喜文 | 贺飞 | 李萍 | 刘锋 | 王煜全 | 易本胜 | 李德毅 | 游光荣 | 刘亚威 | 赵文银 | 廖孟豪 | 谭铁牛 | 于川信 | 邬贺铨 | |
全文收录:2016文章全收录 | 2015文章全收录 | 2014文章全收录 |
其他主题系列陆续整理中,敬请期待…… |