AI一周热闻：商汤融资6亿美元；GPU或将击败摩尔定律；中科院用强化学习解决《星际争霸》中的微操问题

其他

AI一周热闻：商汤融资6亿美元；GPU或将击败摩尔定律；中科院用强化学习解决《星际争霸》中的微操问题

Original 2018-04-11 周报 AI前线

作者 | Jack Clark

译者 | Debra

AI 前线导读：

用 GPU 击败摩尔定律
微软推出包括'道德'教育的 AI 培训课程
卡内基梅隆大学用上下文处理语义歧义
商汤融资 6 亿美元
中国“新提出”的技术战略
法国研究人员构建“Jacquard”数据集改善机器人抓取
中科院使用强化学习解决《星际争霸》中的微操作任务

用 GPU 击败摩尔定律

... GPU 和其他新型 AI 基础设备是否有助于应对摩尔定律的衰退？...

CPU 性能提升几年来一直处于停滞状态，这是因为通过减小 CPU 使用晶体管的大小，从而增加 CPU pipeline 数量，最终提高 CPU 性能的这种方式，现在已经不太可行了。GPU 能否解决性能提升的问题？AI 研究人员 Bharath Ramsundar 在博客中提出了这个问题，他认为 GPU 性能的提高，以及专门用于深度学习的半导体基础设施的到来意味着，我们可以期待未来几年内 AI 应用的性能将比在传统处理器上运行的计算作业性能有大幅提升。他可能是对的 ——深度学习的一个奇怪之处，在于其最重要的元素，如大型神经网络，可以扩大至巨大的规模，而不会产生任何折衷，因为它们内部包含的是矩阵乘法等相对简单和可并行处理的任务，因此新芯片可以很容易地联合在一起，以进一步提升基本性能。另外，像 NVIDIA 的 cuDNN 和 CUDA GPU 接口等一些软件库的标准化，或者用于 AI 编程的 TensorFlow 的兴起，意味着一些应用程序随着时间的推移变得越来越快，而这仅是由于软件更新让其他基本性能得以改进。

为什么重要： 人工智能的最新进展大部分发生在 21 世纪中期，处理器有足够的能力可以在大数据集上轻松训练大型神经网络——这种底层硬件改进产生了巨大的突破，如 2012 年'AlexNet'图像识别成果，语音识别领域的相关工作，以及随后在研究方面的重大创新（AlphaGo）和应用（针对'智能答复'的大规模序列到序列学习），以及神经翻译系统的出现等。如果软件标准化和创新能进一步提升系统性能，那么研究人员将能够在未来探索更大或更复杂的模型，并以更高的速度运行诸如神经架构搜索等应用程序，这些都将推动 AI 的进展。

阅读更多：The Advent of Huang’s Law (Bharath Ramsundar blog post（http://rbharath.github.io/the-advent-of-huangs-law/）。

微软推出包括'道德'教育的 AI 培训课程

... 新的人工智能职业培训项目标志着微软进入了 AI 资质认证业务领域...

和其他公司一样，微软也通过 Microsoft Professional Program in AI 向外部人员开放了其内部培训课程。该课程基于微软为提高自身专业技能而开发的内部培训计划。

与其他公司一样，微软的课程教授人们关于 Python、统计学、深度学习和强化学习项目的构建和部署知识。但特别的是，微软还包括一门称之“数据和分析中的道德与法律”的课程，该课程有助于教导开发人员如何在职业生涯中将“道德和法律注入到日常工作中”。

阅读更多：Microsoft Professional Program for Artificial Intelligence (Microsoft，https://academy.microsoft.com/en-us/professional-program/tracks/artificial-intelligence/).

Aiming to fill skill gaps in AI, Microsoft makes training courses available to the public (Microsoft blog，https://blogs.microsoft.com/ai/microsoft-professional-program-ai/).

卡内基梅隆大学用上下文处理语义歧义

... 研究人员根据更多上下文来解决词义模糊问题...

卡内基梅隆大学的研究人员解决了翻译中的一个难题：处理“同形异义词” - 拼写相同但在不同情境下具有不同含义的词，如“房间（room）”和“费用（charge）”。他们利用神经机器翻译（NMT）系统的上下文做到了这一点，该系统使用机器学习技术，比现有系统使用更少的手动规则就可以完成任务。

研究人员表示，现有的 NMT 系统与同形异义词相互作用，随着每个单词的潜在含义数量不断攀升，单词级翻译性能随之下降。他们通过添加一个可以被 NMT 系统用来学习同一单词的不同用途的单词情境向量来解决这个问题，将这种“上下文网络”添加到他们的 NMT 体系结构中可显著提高系统翻译句子的 BLEU 分数。

为什么重要： 值得注意的是，研究人员用来处理同形异义词问题的系统本身就是一个学习系统，而不是手写规则，以提取每个单词更多的上下文信息并从中学习。这教会我们应该如何构建 AI-first 软件系统：如果发现一个故障，你通常会编写一个程序来学习修复它，而不是学习编写基于规则的程序来修复它。

阅读更多： 处理神经机器翻译中的同形异义词（Arxiv，https://arxiv.org/abs/1708.06510）。

中国人脸识别公司商汤融资 6 亿美元

... 商汤计划将融资用于建造五台超级计算机，并用于其 AI 服务...

商汤是一家提供人脸识别工具的中国计算机视觉创业公司，日前已筹集了 6 亿美元的资金。这家中国公司向公共和私营部门提供人脸识别服务，据其联合创始人称，该公司现在已实现盈利，并正在寻求扩张。据 Bloomberg News 报道，该公司现在正在开发一种代号为“Viper”的服务，用于解析数千个实时摄像头收集的数据。

战略计算： 商汤将利用融资资金“未来一年内在一线城市建造至少五台超级计算机，以推动 Viper 和其他服务。根据其设想，它将数以千计的实时信息流传输到单一系统中，该系统可以通过办公室人脸扫描仪、ATM 和交通摄像机（只要分辨率足够高）进行自动处理和标记。这一计划的最终目标是同时处理 10 万个数据流，”彭博新闻报道。

相关信息

... 中国创业公司使用 AI 发现乱穿马路的人，并将他们的脸部照片报告给有关部门...

中国初创公司 Intellifusion 正在帮助深圳当地政府将脸部识别与遍布大街小巷的城市摄像机相结合，发现并向他们报告不守交通规则者的脸部图片和个人信息。

阅读更多：China is using facial recognition technology to send jaywalkers fines through text messages (Motherboard，https://motherboard.vice.com/en_us/article/wj7n74/china-jaywalking-facial-recognition-camera）

中国“新提出”的技术战略

... 北京推动人工智能发展的战略被注重亚洲国家发展的政府机构推上了前所未有的高度...

有一篇来自芝加哥大学保尔森研究所的文章，对中国政府近期制定的人工智能战略公开声明引申出的中国技术政策历史进行了研究，虽然早就发表出来了（2017 年 8 月），但是篇不错的文章。中国长远的技术战略观点认为，技术是国家力量的源泉，中国需要发展更多的“中国力量”。

根据之前的举措推测，中国很可能会寻求获得 AI 前沿技术，将这些能力作为产品打包并用于进一步研究。 “中国政府，行业和科学领导人将继续推动增值链的发展。在超高压电力线（UHV）和民用核反应堆等一些行业，中国已经是全球领先的企业，它们在一些市场的技术部署规模无与伦比。”作者写道。

“这意味着它应该能够将其作为领先技术消费者的地位，与其作为一个新崛起的出口商的地位结合起来。中国的市场力量可以使其出口一些本土技术和工程标准，成为该技术或系统默认的全球标准制定者。“

阅读更多：The Deep Roots and Long Branches of Chinese Technonationalism (Macro Polo，https://macropolo.org/deep-roots-long-branches-chinese-technonationalism/）

法国研究人员构建“Jacquard”数据集改善机器人抓取

... 包含 11,000 + 对象的数据集，提供了具有深度的信息...

你会如何解决像机器人抓取的问题呢？其中一种方法是对现实世界中的机器人并行训练数月，以学习抓取大量真实物体的技巧，这是谷歌研究人员几年前在该公司的“arm farm”采用的方法。另一种方法是利用配备传感器的人来收集抓取不同物体的的示范，然后从中学习，这是 Kindred 这样的 AI 初创公司采取的方法。第三种方式，也是吸引众多研究人员的兴趣的方法，就是创建合成的 3D 对象，并在模拟器中训练机器人学习并掌握抓取技巧，这是加州大学伯克利分校的研究人员在 Dex-Net 上所做的工作，Google 和 OpenAI 等组织也是采取的这种方法；还有一些组织通过生成对抗网络来模拟更大范围的对象抓取活动，从而进一步加强了这种技术。Jacquard：现在，法国研究人员公布了一款机器人抓取数据集 Jacquard，该数据集包含超过 11,000 个不同的真实世界对象和 50,000 张用 RGB 和实际深度信息注释的图像。他们表示很快将发布这一数据集，但并没有确定具体时间。这个数据集是研究人员通过对来自 ShapeNet 的各个对象进行采样生成的，每个对象都被缩放并赋予不同的权重值，然后放入模拟器中，通过混合器将其渲染成高分辨率图像，然后经过三级自动化过程生成抓取注释，存储在'pyBullet'物理库中。为了评估该数据集，他们在 Jacquard 数据集上预训练 Alexnet，然后将其应用到另一个更小的、保持不变的数据集进行模拟测试，结果显示生成效果良好。该数据集支持多种机器人手爪尺寸，与每张图像链接的几个不同的抓手，以及一百万个标记的抓手。

现实世界机器人： 研究人员在一台真实机器人（Fanuc M-20iA 机器人手臂）上测试了来自 Jacquard 数据集的 2,000 个对象子集和 Cornell 整个数据集。以这种方式，经过预先训练的 AlexNet 产生 78% 的正确抓握，而 Cornell 的准确抓取率为 60.46％。但与 Dex-Net 数据集相比，这两种测试集的结果都相形见绌。

为什么重要： 许多研究人员预计，深度学习可能会令机器人的操纵能力显著提升。但我们目前缺少两个关键因素：足够大的数据集，以及以标准方式在标准平台上测试和评估机器人的方法。目前，我们正在经历一个数据集百花齐放的时代，Jacquard 就是其中一个。

阅读更多：Jacquard: A Large Scale Dataset for Robotic Grasp Detection (Arxiv，https://arxiv.org/abs/1803.11469）

《星际争霸》和 AI 研究的未来有什么共同之处？多代理控制

... 中国研究人员尝试解决《星际争霸》的微操作任务问题...

中国科学院自动化研究所已经发表了关于使用强化学习来解决《星际争霸》中的微操作任务的研究。战胜《星际争霸》游戏的主要挑战之一是开发出能够同时有效训练多个 unit 的算法。研究人员提出他们称之为“参数共享的多智能体梯度下降 Sarsa 算法”，或 PG-MAGDS。该算法在多个 unit 间共享整个政策网络的参数，同时为每个 unit 进行适当的信用分配。他们用奖励机制激励代理更有效地学习。PG-MAGDS AI 能够在各种微操作控制场景，包括双方均有超过 30 各 unit 的场景中学习击败游戏中的 AI。目前，由于缺乏共享的 benchmark 和实验，以及使用《星际争霸 1》（本文）和《星际争霸 2》（DeepMind 等）作为测试平台的标准不一，很难评判人们为《星际争霸》开发的各种技术孰优孰劣。

仍然有限：“目前，我们只能训练相同类型的远程地面 unit，而使用 RL 方法训练近战地面 unit 仍是一个悬而未决的问题。未来，我们将改进方法，使之适用于更多类型和更复杂的场景。最后，我们还会考虑把微操作模式应用在星际争霸机器人中来挑战整局游戏，“研究人员写道。

阅读更多：StarCraft Micromanagement with Reinforcement Learning and Curriculum Transfer Learning (Arxiv，https://arxiv.org/abs/1804.00810）

作者 Jack Clark 有话对 AI 前线读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

阅读原文链接：

https://jack-clark.net/

AI前线紧跟前沿的AI技术社群

好看的文章千篇一律，有趣的灵魂万里挑一。读者朋友们记得给我们的编辑留言和点赞哦！

反向激励，在加速这个社会的黑化

把抄袭说的如此冠冕堂皇，雷军让年轻人丢掉了耻辱感

2024【公共营养师】报名通道已开启，不限学历，23岁及以上可报!还能领2000补贴

Wealth | 中国成本轮金价涨势的前沿和中心

父亲出轨后，母亲对父亲实施了她的精确打击 | 二湘空间