其他

AI一周热闻:全新神经网络架构NAISNet;欧洲国家形成AI联盟;Spatial AI是人工智能的未来

2018-04-25 Jack Clark AI前线
作者|Jack Clark
编译|Debra

AI 前线导读:


  • AI+ 物理学:创造出更大、方差更小的网络 NAIS-Net

  • 欧洲国家加入 AI 革命,避免错过云计算革命的历史重演

  • 人工智能的未来是 Spatial AI,这对于机器人、无人机等意味着什么?

  • 机器学习专家宗师迈克尔·乔丹指出了我们需要关注的一个重大问题

  • 新的'GLUE'竞赛测试语言模型泛化能力的局限性

  • OpenAI:在国会 AI 和公共政策会议中的证词

AI+ 物理学:创造出更大、方差更小的网络 NAIS-Net

... 控制理论和机器学习的结合带来了不错的结果...

欧洲人工智能创业公司 NNAISENSE 的研究人员已经发布了关于 NAIS-Net(非自动输入——输出稳定网络)的详细信息,这是一种新型的神经网络架构,他们宣称这种架构的训练深度是其他网络(如残差网络、Highway 网络)的 10 到 20 倍,同时能够保证稳定性。

物理 + 人工智能:这个网络的设计灵感来源于控制理论和物理学,它们的结合让设计人员构建出一个能保证适应不同类型的输入数据,针对特定任务进行更深收敛训练的系统。 NAIS-Nets 缩小了标靶的尺寸,能够快速完成训练,这让网络训练过程中的发方差变小,以及可重复性提高成为可能。

规模:“在不增加网络参数总数的情况下,NAIS-Nets 也可以比 ResNet 深 10 到 20 倍,并且通过堆叠多个稳定的 NAIS-Net 模块,进行图形处理深度相关的模型可以在不需要任何正则化的前提下进行训练。”研究人员写道。

结果: 经过对 CIFAR-100 进行测试,研究人员发现 NAIS-Net 与残差网络的性能相当,但方差显然更低。该架构尚未在更大、更像是评估模型黄金标准的 ImageNet 上进行测试。

为什么重要: 目前,人工智能技术中的一个未解决的难题是,我们并不真正了解它们工作的原理,这从我们以往的经验中可以看到,我们在压缩过程中很难保证方差、概括和性能损失。像 NAIS-Nets 这样的方法似乎可以减少我们在这些领域的一些不确定性,这表明,我们在设计具有足够丰富的数学证明的系统方面有了进步,可以更好地保证一些性能参数。此外,这还意味着我们能够创建出机制更透明的系统,这似乎是未来构建更精细系统的必要基础。

阅读更多:NAIS-Net: Stable Deep Networks from Non-Autonomous Differential Equations (Arxiv)

https://arxiv.org/abs/1804.07209

欧洲国家加入 AI 革命,避免错过云计算革命的历史重演

... 欧盟 AI 权力集团形成,以避免错过云计算领域革命的情境再度上演...

25 个欧洲国家已经签署了一封合约,宣布有意“联合起来”开发人工智能。这封信的内容大意是,签署方均承诺会在实施各自的国家发展计划时与其他成员国进行协作。

“合作将侧重于加强欧洲人工智能研究中心建设,在欧洲各地的研发和资助计划中发挥协同作用,并就人工智能对社会和经济的影响交换意见。此联盟成员国将与作为协调人的委员会保持对话,”欧洲委员安德鲁斯·阿斯普和玛丽亚·加布里尔说道。

为什么重要: 由于中国和美国的规模大(数亿人使用同一种语言进行口头和书面交流),以及拥有开展国家级研究的充足资金,中美两国都具有发展人工智能的结构性优势。单个欧洲国家无法与其投资能力相提并论,因此需要联合在一起,否则就会像错过云计算革命一样,最终不能形成一家大型 AI 公司,导致他们在 AI 时代下缺乏政治和经济影响力。

了解更多:欧盟成员国签署人工智能(欧盟委员会)合作文件

https://ec.europa.eu/digital-single-market/en/news/eu-member-states-sign-cooperate-artificial-intelligence

人工智能的未来是 Spatial AI,这对于机器人、无人机等意味着什么?

...SLAM 的现状能告诉我们未来机器人将如何看待这个世界吗?...

SLAM 研究员 Andrew Davison 发表了一篇论文,研究 SLAM(即时定位与地图构建)技术的现状,并根据当前的算法趋势预测未来其将如何演变。现有的人工智能系统想要实现预设的功能,它们需要具备'空间人工智能'(Spatial AI)的功能,以及机器需要对周遭环境进行理解和归类的一系列认知能力,以便可以有效地采取行动。他假设,这个空间人工智能系统将成为未来真实世界人工智能的核心,因为它可以“实时地,主要以可视化输入和可量化的性能为指标,逐步构建、维护一个通用的、接近度量的场景表示” ,这让人们可以开发更丰富的 AI 应用程序。

现状与空间 AI 之间的差距:随着学习方法和关键功能手写规则的应用,今天的 SLAM 系统正在发生着变化,尤其是构建周围环境地图的系统。未来的空间人工智能系统可能会具备更多的学习功能,特别是在解决模糊性或预测世界变化方面,并且需要在各种不同的芯片架构上实现这一点,以最大限度地提高性能。

许多“空间人工智能”制作的全球共享地图:一旦世界上出现少数具有这种空间人工智能功能的系统,它们可能会将其对世界的 insight 集中到一张全球共享的地图中,该地图将通过所有连接的设备不断更新。这意味着,一旦系统识别出它的位置,可能不需要执行很多的设备处理,因为它可以从云中获取上下文信息。

这样的设备长什么样?相机和传感器设备将根据目标而变化,例如,“未来的家用机器人可能在机身中央安装一个导航相机,并在手腕上安装一个专用相机辅助操作。”这些相机将包含一个全球模型,为系统提供持续更新的位置信息以及周围世界的语义信息。系统还将用前向预测场景模型不断检查新的信息,以帮助其对环境中的变化做出预测和反应。在计算上,这些系统将标记周围的世界并跟踪,将所有内容映射到同一个空间,进行自我监督学习,以整合新的感官输入数据。最终,如果这个全球模型变得足够好,那么系统只需要从其传感器采集与预测不同的信息,从而进一步提高效率。

测试:这个想法引发的一个棘手问题是,我们如何评估这种空间 AI 系统的性能。SLAM 基准测试往往具有局限性,一些研究人员倾向于对 SLAM 进行主观的、定性的评估。 Davison 建议使用像 SlamBench 这样的基准测试,它可以测量各种不同处理器平台的精度和计算成本方面的性能。在 SLAM 系统部署的平台上对 SLAM 性能进行测试也很有必要,因此同一系统在无人机或机器人上部署需要进行不同的测试。未来,在同一系统内用不同参数来评估性能将是一件好事,例如分割对象、跟踪环境变化、评估电源使用情况、测量重定位稳健性等。

为什么很重要:这样的论文对特定 AI 领域进行了整体概述。 SLAM 功能对于在现实世界中部署 AI 系统至关重要,很可能许多当代 AI 组件将被用于未来的 SLAM 系统中,这些系统的设计•·也将越来越专业化、学习能力更强,并将应用于异构计算机基板上。

阅读更多: FutureMapping: The Computational Structure of Spatial AI Systems (Arxiv)

https://arxiv.org/abs/1803.11288

机器学习专家宗师迈克尔·乔丹指出了我们需要关注的一个重大问题

... 虽然我们都对玩游戏的机器人感到兴奋,但是我们却忽略把成千上万这样的系统投入使用之后的管理和维护...

机器学习宗师迈克尔·乔丹认为,我们必须创建一个新的工程学科,以应对人工智能的挑战和机遇。尽管近期在人工智能领域出现了许多仿人 AI 的成功案例,但他认为,创建 AI 所需的支持基础架构和现在的数据处理技术已经不足以让 AI 真正惠及社会。例如,在医疗保健领域虽然有很多关于提高诊断能力的 AI 研究,但是却未形成一种将零散的医疗系统数据汇聚在一起,以处理隐私的方式跟踪数据,并从整合的系统中受益更多的文化。同样地,尽管我们对自动驾驶汽车非常关注,但很少有人注意到我们需要创建类似于空中交通管制的新型系统,以有效地管理即将出现的自动驾驶车辆大军。  “不管我们是否很快理解“智能”这个词,我们确实面临着将电脑和人类结合在一起以改善人类生活的重大挑战。虽然有些人认为人工智能的出现会让这些问题迎刃而解,但 AI 更准确地来说是一门新的学科,”他写道。 “在我的教育中,我从来没听说过那种可以建造大规模推理和决策系统所需的一般原则,可以将计算机科学与统计学相结合,以为人类所用。”

阅读更多:人工智能革命尚未发生

https://medium.com/@mijordan3/artificial-intelligence-the-revolution-hasnt-happened-yet-5e1d5812e1e7

新的'GLUE'竞赛测试语言模型的泛化能力的局限性

... 这一新的语言 benchmark 旨在在不同数据集上合理测试模型...

来自纽约大学、华盛顿大学和 DeepMind 的研究人员发布了通用语言理解评估(GLUE)benchmark 和评估网站。 GLUE 提供了一种方法来检查九个句子或句子对任务中的单个自然语言理解 AI 模型,其中包括问题回答、情感分析、相似性评估和文本引用。这为研究人员提供了一种检查模型在各种不同任务中泛化能力的原则标准。泛化能力是检验一种 AI 技术的可扩展性和有效性的有效指标,因此能够在语言内以一种有规律的方式来进行衡量,了解问题的本质,比如 DAWNBench 竞赛(https://dawn.cs.stanford.edu/benchmark/)就展示了如何调整用于性能关键标准的监督分类算法。

有难度的测试集:GLUE 还包含了一个被有意设置具有挑战性的测试集,该测试集旨在突出与模型开发和训练相关的困难点,例如全球知识的融合,或处理词汇蕴涵和否定。它将促进模型发展,因为这将有助于研究人员识别出他们的模型所犯的愚蠢的错误。

结果: 研究人员还使用 BiLSTM,对注意力子系统加以改进,以及最近的两项研究 ELMo 和 CoVe 来进行竞争测试。结果显示,强大的、经过 baseline 测试的单系统比所有算法的泛化能力都更强。

为什么重要:对尚未解决的问题给与注意时,共享评估标准和竞赛将会驱动进步,这在科学界并不少见。 “当我们用 GLUE 对已有模型进行评估时,我们发现几乎没有可以比为每个任务组成部分单独进行模型训练的效果更好。当在我们的诊断数据集上评估这些模型时,我们发现它们在大范围的语音现象中都并不奏效。因此,如何设计一个通用的 NLU 模型还是一个无解的问题。GLUE 应该激发更多的进步和进展。

阅读更多: GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding 

https://www.nyu.edu/projects/bowman/glue.pdf

点此查看 GLUE 竞赛网站和排行榜

https://gluebenchmark.com/

OpenAI:在国会 AI 和公共政策会议中的证词

本周,我参与了众议院监督委员会信息技术小组委员会关于人工智能和公共政策的听证会。哈佛大学 Belfer 研究中心的 Ben Buchanan 博士,AI 合作伙伴 Terah Lyons 和消费者技术协会的 Gary Shapiro 也加入了我的行列。在我的书面证词、口头证词以及针对问题的回答中,我提出了 AI 社群需要制定更好的规范以确保用技术实现最大收益,并讨论了如何更好地支持 AI 的发展(支持科学发展并使每个人都能在美国轻松地学习人工智能)。此外,我还谈到了人工智能测量和预测方案的重要性,以制定更好的决策,避免无知的监管。

点此查看我的证词:

https://oversight.house.gov/hearing/game-changers-artificial-intelligence-part-iii-artificial-intelligence-and-public-policy/

点此阅读我的书面评论:

https://oversight.house.gov/wp-content/uploads/2018/04/Clark-OpenAI-Statement-AI-III-4-18.pdf

一些趣事:其中一位国会议员播放了《2001 太空漫游》中 HAL 9000 拒绝打开吊舱门的音频,以此来表达关于人工智能可解释性的一些观点。

作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果您想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。

原文链接:https://jack-clark.net/

AI前线紧跟前沿的AI技术社群


如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存