AI一周热闻盘点：李开复称AI将带来前所未有的失业潮；伯克利用Soft Q-learning让机器人同时学习多解决方案

其他

AI一周热闻盘点：李开复称AI将带来前所未有的失业潮；伯克利用Soft Q-learning让机器人同时学习多解决方案

Original 2018-03-28 周报 AI前线

作者 | Jack Clark

译者 | Debra

编辑 | Emily

AI 前线导读：

李开复：为 AI 带来前所未有的失业做好准备
如何处理 AI 带来的信息威胁
伯克利研究人员使用 Soft Q-learning 让机器人完成组合任务
INRIA、Facebook 和 CNRS 发布 IntPhys，用以评估 AI 系统能力
Kindred 研究员解释如何使机器人可重复使用
Salesforce 研究人员证明了简化语言建模的价值
想要测试你的 AI 系统理解语言和图像的能力？试试 VQA 2.0 吧
李彦宏发布视频智能音箱

中国 AI 明星李开复：社会需为 AI 对工作岗位带来前所未有的破坏做好准备

... 风险投资家和前 AI 研究人员李开复谈到了 AI 的影响，以及为什么今天的技术将对世界产生巨大影响...

中国风险投资家李开复在接受 Edge 采访时表示，今天的人工智能系统将对世界经济产生巨大的影响，并将引起另一次工业革命。 “我们将在未来的十五至二十年内面临极大的挑战，届时将有一半的工作将被机器所取代，导致人类历史上前所未有的失业规模。这场革命将持续更长时间，”他说道。

他还表示，他担心深度学习可能只是一个小把戏，因为我们无法期待其将在未来几年会出现重大突破，我们应该在此基础上摆正对 AI 进展的态度。 “你不能指望明年我们就会在这方面有突破，或者是某一月，某一天。现在，采用 AI 技术的应用程序正在呈指数级增长，但是期待这一领域的新进展也增长这么快是荒谬的。那些提出这些要求和奇点的人走在了我们前面，我认为这只是没有考虑到技术基础的天方夜谭，”他说道。

AI 成果不均衡：他说，在人工智能时代，像中国和美国这样人口众多，在 AI 上获得大量投资的国家已经取得了不错的成绩。 “那些状况不佳的国家可能是人口众多的国家，但没有 AI，没有技术，没有 Google，没有腾讯，没有百度，没有阿里巴巴，没有 Facebook，没有亚马逊。这些人基本上成为在这些国家占主导地位的软件公司的数据来源。”

阅读更多： We Are Here To Create, A Conversation With Kai-Fu Lee (Edge).https://www.edge.org/conversation/kai_fu_lee-we-are-here-to-create

如何处理 AI 带来的信息威胁：

.. 你觉得 DeepFakes 很糟糕，看看 DeepWar...

人工智能社区的成员开始为合成图像和视频的技术感到震惊，如此逼真的制作过程竟然如此简单。在一篇博客文章中，人工智能从业者表示，随着数据量的增加以及 AI 基础设施（可租用的云 GPU）变得更加易于访问，制作此类东西的门槛正在降低，并且人工智能技术的不断进步意味着这些假素材的质量会越来越精。

我们如何处理这些信息威胁？我们可以参考预防假币的做法，例如提高制作成本和验证真伪的技术。不幸的是，尽管这可能有助于解决假人工智能带来的一些问题，但它并没有解决本质问题：人工智能主要体现在软件而不是硬件上，因此难以通过数字版权管理等方法在数字媒体中插入视频或音频签名。一种可能的解决方案是使用来自相同域的真实的和伪造的数据集来训练 AI 分类器，以辨别真伪。

更多信息：Commoditisation of AI, digital forgery and the end of trust: how we can fix it。https://giorgiop.github.io/posts/2018/03/17/AI-and-digital-forgery/

伯克利研究人员使用 Soft Q Learning 让机器人完成组合任务：

... 研究减少了机器人学习新行为所需的时间...

伯克利的研究人员已经想出了如何使用Soft Q Learning（最近推出的传统Q Learning的变体）来让机器人更有效地学习。他们引入了一个新的技巧，机器人可以学习如何从现有的学习策略中编写新的Q函数，例如训练一个机器人将其手臂移动到 X 位置的特定分布，然后移动到特定的分布 Y 位置，那么他们可以创建一个新的策略，将手臂移动到 X 和 Y 位置的交叉部分，而不需要先前的组合训练。这种学习通常很难用单一策略实现，因为大多数算法都需要花费很长的时间进行探索，经历过数次失败才能完成任务。

真实世界：研究人员一般训练机器人完成诸如到达特定位置并堆叠乐高积木的任务。他们还展示了分别训练机器人躲避手臂附近的障碍物和堆叠乐高积木这两个动作，然后结合这两个策略，结果机器人可以在未接受过组合训练的情况下，在避开障碍物的同时堆叠积木。

为什么重要：过去几年人工智能的进步让我们非常善于开发擅长个人能力的系统；能够以特别的方式组合这种能力，产生新的行为，这进一步增强了 AI 系统的能力，让机器人学习行为的分布，然后将策略组合起来完成更复杂的任务成为可能。

阅读更多：Composable Deep Reinforcement Learning for Robotic Manipulation (Arxiv).https://arxiv.org/abs/1803.06773

觉得你的 AI 模型对真实世界有很好的理解？在 IntPhys 上试试，结果可能很尴尬：

... 用我们测试婴儿和生物的方法测试 AI 系统...

INRIA、Facebook 和 CNRS 的研究人员发布了 IntPhys，这个 AI 评估系统利用研究人员称之为“物理合理性测试”的方法，对他们身边的物理世界进行建模能力的评估。 IntPhys 用以测试更加复杂的问题解决能力，这些问题更贴近人类通常面临的各种问题（参见 AI2 的'ARC'用于书面推理的数据集，以及 DeepMind 认知科学'PsychLab'环境）。

工作原理：IntPhys 向人工智能系统展示使用 UnrealEngine4 渲染场景的电影，让其分辨其中一个场景与另一个场景的关联，测试系统模型内化真实世界基本概念的能力，如目标的持久性、因果关系等。系统需要为每个展示场景或场景组合的“可信度”打分，然后使用它来确定系统是否了解真实世界之间的联系。

IntPhys 测试：IntPhys 的 v1 版侧重无监督学习。第一个版本测试系统理解目标持久性的能力，而未来版本将包括更多测试，如形状恒定性、时空连续性等。最初的 IntPhys 包含 15,000 个可能事件的视频，每个视频长达 7 秒，每秒 15fps，共计 21 小时，还包含一些附加信息，如每个图像的景深数据以及对象实例分割蒙版，因此没必要用单纯的无监督方法解决问题。

Baseline 系统 VS. 人类：研究人员创建了两个 Baseline 来评估系统：CNN 编码—— 解码系统和条件 GAN。 “我们在像素级测试中失败了，这表明我们的模型还不能进行令人信服的目标运动状态预测，特别是对于丰富背景中较小的物体。出于这个原因，我们转而使用物体掩模来进行更高级的计算预测。”研究人员在他们的系统上测试了人类图像，结果发现当场景中人类可见时的平均错误率约为 8％，而场景中有遮挡部分时的平均错误率为 25％。相比之下，基于神经网络系统的平均错误率分别为 31% 和 50%。

计算机能力：“2-4 个月的婴儿能够对永久、固体和具有时空连续性的物体进行视觉输入解析。在 6 个月时，他们理解可以稳定性、支撑和因果关系的概念。8 至 10 个月之间，他们会掌握重力、惯性和碰撞动量守恒的概念；10 到 12 个月之间，理解形状恒常性等，“研究人员写道。

为什么重要：此类测试会让我们对 AI 系统执行基本推理行为的能力有所认识，并且随着研究人员进行更具挑战性的任务测试，我们将能够更好地了解系统的能力。随着新的测试元素增加，“预测任务将变得越来越困难，并逐渐向一岁人类所达到的场景理解水平靠近”，他们写道。

竞赛：AI 研究人员可以下载数据集，并在 IntPhys 网站（IntPhys）提交 https://coml.lscp.ens.fr/intphys/ 提交系统测试分数。

阅读更多：IntPhys: A Framework and Benchmark for Visual Intuitive Physics Reasoning (Arxiv).https://arxiv.org/abs/1803.07616

Kindred 研究员解释如何使机器人可重复使用：

... 让可重复机器人从实验变成现实...

机器人人工智能创业公司 Kindred 的研究人员发表了一篇论文：现实世界中的可重复使用机器人实验。这对于创建机器人可重复的、有效的开发环境所需调整来说是有价值的入门知识。

常规机器人：研究人员为 Universal Robotics 的 UR5 机器人手臂设定了一项任务，并描述了该系统的架构。模拟环境和真实环境的一个关键区别是时间的作用，在模拟中，人们通常同步执行所有学习和动作更新，而在真实世界中，任务需要一步一步完成。 “在现实世界的任务中，每个代理和与环境相关的计算都需要时间。因此，代理人总是根据延迟的信息运作，”他们解释道。

为什么重要：“由于任务的多样性以及缺乏可靠的测试机制，目前很难在真实世界的机器人技术中模拟进程。类似这样的论文指出了一条道路，我希望其能够鼓励研究人员尝试构建他们的实验，使其更具可重复性和可靠性。如果我们能够做到这一点，那么我们将能够在该领域的进展速度直觉上做得更好，这可能有助于预测发展趋势——考虑到将来他们对就业产生的影响，这是一件至关重要的事情。”

阅读更多信息： Setting up a Reinforcement Learning Task with a Real-World Robot (Arxiv)。https://arxiv.org/abs/1803.07067

Salesforce 研究人员证明了简化语言建模的价值：

... 实验证明，精心设计的 LSTM 或 QRNN 系统可以击败更复杂的系统...

Salesforce 研究人员实验证明，经过精心训练的基础 AI 系统在处理比较复杂的语言任务时可能比更加复杂的系统和现代化的系统性能更优。他们的研究表明，使用精心调整、简单的系统，如 LSTM 或 Salesforce 发明的 QRNN，在为语言建模时性能超越 RNN、超级网络或神经网络架构为基础的系统。这一结果表明，人工智能近期的许多进展可能在某种程度上是虚幻的：之前假设系统在一些数据集上性能的跃升是新模型新功能的贡献，现在看来，经过全面调整和测试的简单系统其实就可以达到这样的效果。

结果：研究人员对基于 QRNN 和 LSTM 的系统与 Penn Treebank（宾州树库）、enwik8 字符级数据集以及单词级 WikiText-103 数据集进行比对测试，结果表明，字符级测试中，前者击败 Penn Treebank 和 enwik8，并且在 WikiText-103 上的困惑度显著优于 SOTA。

为什么重要：这个结论表明，我们现有的许多 AI 系统比研究人员预期的更强大，像 GAN 或 DCGAN 这样的“老”系统可以比复杂的系统更有效地建模数据分布。这并不是说后来的创新毫无意义，但它应该让研究人员反思和调整现有的系统，而不是一味求新。 “快速且调配得当的 baseline 是我们研究团队的重要组成部分。没有这些 baseline，我们就失去了准确衡量研究进展的标准。通过扩展基于 LSTM 和 QRNN 的现有最先进的单词级语言模型，我们发现调整好的 baseline 可以在字符级别（Penn Treebank，enwik8）和字级（WikiText-103）数据集山取得最好的结果，而不依赖于复杂或专门的体系结构，“他们写道。

阅读更多：An Analysis of Neural Language Modeling at Multiple Scales。https://arxiv.org/abs/1803.08240

想要测试你的 AI 系统理解语言和图像的能力？试试 VQA 2.0 吧

... 测试 AI 系统对语言和图像建模的能力...

认为已经开发出了可以为语言和图像之间关系建模的开发人员可以在 Visual Question Answering Challenge 中提交自己的作品。该挑战赛鼓励可以让模型回答关于图像内容问题的选手参赛。挑战者将使用 VQA 数据集的 v2.0 版本，其中包括更多关于图像的书面问题和关于图像问题的正确答案。

阅读更多：VQA Challenge 2018 launched! (VisualQA.org).http://visualqa.org/

李彦宏发布视频智能音箱

3 月 26 日下午，百度 CEO 李彦宏在新品发布会上发布了全球首款视频智能音箱：小度在家。“小度在家”集成了百度对话式人工智能操作系统 DuerOS，作为百度首款智能视频音箱，“小度在家”配有一块 7 寸屏幕，拥有顶级的视频处理能力和独立的图像信号处理器，采用环形六麦克风阵列，可全向拾音，语音唤醒和识别抗噪的能力超强。

这是继去年与渡鸦科技合作的 Raven H 之后，百度的第二款智能音箱产品。

作者 Jack Clark 有话对 AI 前线读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

原文链接：

https://jack-clark.net/

如果您喜欢我们的内容，记得给我们「留言」和「点赞」，给编辑鼓励一下！

反向激励，在加速这个社会的黑化

平安信托深陷“爆雷”旋涡：终于尝到“偏爱”房地产的苦果

刀片电池存设计缺陷，或将导致几十万比亚迪车主自费更换or召回？

专家一会说要过“紧日子”，一会说“认为没坏就能用”是不对的

芒果TV十年：源自如日中天时的“诺亚方舟”计划