AI前线一周新闻盘点：商汤加入MIT Intelligence Quest计划；美国国防部发布xView数据集

其他

AI前线一周新闻盘点：商汤加入MIT Intelligence Quest计划；美国国防部发布xView数据集

Original 2018-03-06 Jack Clark AI前线

作者｜Jack Clark

译者 & 编辑｜Debra

AI 前线导读：

中国人工智能创业公司商汤加入麻省理工学院的“智慧探索”（Intelligence Quest）计划
中国官媒呼吁加强人工智能开发合作
用卫星图自动分析地球，新的 xView 数据集代表着地缘政治的新时代将要来临
Adobe 研究人员试图通过'AdobeIndoorNav'数据集为机器人提供更好的导航感
艾伦 AI 研究所获得 1.25 亿美元用于 AI 常识知识库建设
俄罗斯研究员用深度学习卫星图像预判火灾损失
谷歌研究人员发现奇特的方法改善 RNN 的长期依赖性能
阿里巴巴用强化学习优化在线广告投放效果
OpenAI：用新的环境、算法和研究思路改进机器人研究

更多干货内容请关注微信公众号“AI 前线”，（ID：ai-front）

中国人工智能创业公司商汤加入MIT Intelligence Quest计划

... 资金 + 政治的一揽子计划...

中国人工智能巨头商汤加入了麻省理工学院 AI 研究与开发计划“MIT Intelligence Quest”。这家中国公司专门从事面部识别和自动驾驶汽车业务，并与本田、高通等大公司是战略合作伙伴关系。在麻省理工学院最近举办的一次 AI 大会上，商汤的创始人汤小欧做了一个简短的演讲，并举行了几次关于此次合作的讨论会。 “我认为，我们的合作将超越深度学习，并将携手探索深度思维的未知领域。”汤小欧表示。数据增长：汤小欧表示商汤正在使用大量数据开发更好的面部识别算法，并称该公司 2016 年使用 6000 万张照片将其面部识别的准确率提高到“超过 100 万”，然后在 2017 年通过 20 亿张照片的数据集将准确率提高到“过亿”。假总统：他还简短地演示了一个商汤合成视频的项目，这个项目将奥巴马的演讲视频生成特朗普总统演讲的镜头，反之亦然。我们可以在 Twitter 上查看这个视频。https://twitter.com/jackclarkSF/status/969285043502878722

阅读更多：麻省理工学院和商汤宣布将共同努力推动人工智能研究（MIT）。http://news.mit.edu/2018/mit-sensetime-announce-effort-advance-artificial-intelligence-research-0228

中国官媒呼吁加强人工智能开发合作

... 新华社评论道，中国在人工智能上的崛起是一种福音，而不是威胁...

新华社试图回击一些用冷战术语来描述中国人工智能崛起的行为，以及指责中国人工智能“模仿”的言论，并呼吁进一步加强合作，减少竞争。新华社报道，iFlyTek 首席执行官刘庆峰在 CES 上向新华社表示，海量数据集、算法和专业人才是人工智能必不可少的因素，“AI 的发展需要全球合作”，“没有公司可以成为霸主”。

阅读更多：新华社评论：人工智能的发展需要全球合作，而不是“恐中”（新华社）。http://www.xinhuanet.com/english/2018-03/02/c_137011182.htm

用卫星图自动分析地球，xView 数据集代表着地缘政治的新时代将要来临

... 美国国防部发布数据集和相关竞赛，以推动卫星图像分析技术的发展...

美国国防部的国防创新部门实验室（DIUx）、DigitalGlobe 和国家地理空间情报局的研究人员发布了数据集和 xView 和相关竞赛，用于评估人工智能技术对高空卫星图像进行分类的能力。 xView 包含 60 个类别的 100 万个不同对象，分布在 1400 平方公里的卫星图像上，最大地面样本分辨率为 0.3 米。该数据集旨在测试图像识别的各个领域，包括：学习效率、细粒度类别检测和多尺度识别等。该竞赛的奖励包括 10 万美元的奖金和计算能力认证。

为什么重要：随着 SpaceX、Rocket Labs 等新型火箭使得发射的成本降低，电子产品的进步让硬件产品进一步改善，以及更多的初创公司将卫星发射到轨道上，未来关于地球的可用数据将增加几个数量级。如果我们能够弄清楚如何使用人工智能技术分析这些数据集，我们就可以更敏锐地发觉地球上发生变化从而做出反应，为弥补自然灾害而筹集资源，更好地装备军队等大型组织，更好地了解周围的世界，并据作出计划和行动。高度信息化的地缘政治新时代即将到来...

用卫星的眼睛监察地球：xView 包含许多父类和子类的对象，例如“海运船”包括子类帆船和油轮等子类。其他类别还有固定翼飞机、乘用车、卡车、工程车辆、铁路车辆和建筑物。 “xView 为物体探测和卫星图像空间提供了一个大型、多类别、多地点的数据集，该数据集由 PASCAL VOC 的基准功能、COCO 的质量控制方法以及其他架空数据集构成。数据集中最常见的一些物体包括建筑物和小型汽车，还包括一些不常见的种类如伸臂堆垛机和拖拉机、油轮等。

测试结果：研究人员使用 Single Shot Multibox Detector 元结构（SSD）创建了分类测试基准，并对三种数据集变体进行测试：标准 xView、多分辨率和经过图像增强获得多分辨率的数据集。训练结果显示，多分辨率数据集的效果最好，其中对运输机的识别分类准确性高达 67％以上。测试得到的大多数分数都非常低，所以当其被用于更复杂、基于深度学习的问题时会得多少分还是挺有趣的。

Milspec 数据精度：“我们按照详细的说明，在统一设备上执行所有注释，经过层层质量控制检测之后得出输出结果，从而获得了一致性。一般来说，工作人员会使用开源工具边界框来注释图像芯片，如果能负担得起的话。

阅读更多内容：xView: Objects in Context in Overhead Imagery (Arxiv).

https://arxiv.org/abs/1802.07856

获取数据集：xView 网站 http://xviewdataset.org/

Adobe 研究人员用“AdobeIndoorNav”数据集为机器人提供更好的导航感

... 用 Tango 手机 + 商用机器人实现数据自动收集...

Adobe 研究人员发布了一个旨在帮助机器人探索真实世界的数据集——AdobeIndoorNav。它包含虚拟机器人可以在 24 个单独“场景”中学习导航的 3544 个不同位置。每个场景对应真实世界的位置，并且包含通过点云、360 度全景视图以及从小型地面机器人的角度前 / 后 / 左 / 右视图的 3D 建模。该数据集提供了人工智能研究人员开发机器人导航系统所需的环境。为什么重要：现实世界中的导航机器人需要在进入新环境时具备定位特定目标的能力。这项研究表明，我们离实现这个目标还有很远，但一些令人鼓舞的迹象表明我们有能力自动进行必要的数据收集过程，以创建评估新的数据集算法的基准测试。

数据采集：研究人员使用 Lenovo Phab 2 Tango 手机手动扫描每个场景以创建 3D 点云，然后自动将其分解成特定障碍物的地图以及 3D 地图。'Yujin Turtlebot 2'机器人随后使用这些地图以及其板载激光扫描仪、RGB-D 相机和 360 相机在场景周围导航并拍摄一系列高分辨率的全景图片，然后拼接成一个连贯的场景。

结果：研究人员通过创建能够导航场景的 baseline agent 来验证数据集。带有 LSTM 网络的 A3C agent 成功地学会了从任何单个场景中的一个位置导航到另一个位置，并能找出最短路线。研究人员还展示了这种技术的一些潜在应用前景，以进一步提高性能，例如增加机器人据以做判断的空间信息量。

阅读更多：The AdobeIndoorNav Dataset: Towards Deeo Reinforcement Learning based Real-world Indoor Robot Visual Navigation (Arxiv)

https://arxiv.org/abs/1802.08824

艾伦 AI 研究所获得 1.25 亿美元用于 AI 常识知识库建设

... 一个开放的、现代化的 ML Cyc 好用吗？...

关于人工智慧，一直有一种消极的论调——它在 80 年代和 90 年代风靡一时，但却在投入大量资金后，基于深度学习的 AI 技术却几乎没有什么重大突破。在这一领域非常引人注目的是 Doug Lenat’s Cyc https://www.wired.com/2016/03/doug-lenat-artificial-intelligence-common-sense-engine/。它与核聚变动力的研究很像，三十年来都没有什么重大突破。但这并不意味着人工智慧是毫无价值的，仅是因为它有点被低估，需要振兴。很多人告诉我人工智慧系统今天一直有人在使用，但经常用于专有或秘密（又名，军事）的目的。因此，Paul Allen（微软的前联合创始人）将在三年内向他的艾伦人工智能研究所投资 1.25 亿美元，以启动亚历山大计划（Project Alexandria）这件事非常有意思。该计划旨在创建一个融合机器阅读、语言和视觉，具有人性化“常识”的知识库。

Benchmarks：“这是一个雄心勃勃的长期研究项目。事实上，我们刚开始时只是建立一个 Benchmarks，以便我们可以凭经验评估项目的进展，“AI2 的首席执行官 Oren Etzioni 在接受 GeekWire 的采访时表示。“为了建造更加强大、更广泛的系统，我们确实需要这种背景知识和常识性知识。”

阅读更多：Allen Institute for Artificial Intelligence to Pursue Common Sense for AI (Paul Allen.)

https://www.paulallen.com/ai-common-sense-project-alexandria/

阅读更多：亚历山大计划（AI2）。http://allenai.org/alexandria/

阅读更多：Oren Etzioni 采访（GeekWire）。

https://www.geekwire.com/2018/paul-allens-plan-make-ai-sensible-aims-keep-us-humans-safer/

俄罗斯研究员用深度学习卫星图像预判火灾损失

... 简单的技术凸显了人工智能工具的普适性，以及具有更容易获得用于灾难响应卫星图像的特点...

莫斯科 Skolkovo 科学技术研究所的研究人员公布了他们应用机器学习技术来自动化分析 2017 年加利福尼亚野火卫星图像的细节。研究人员使用了加利福尼亚凡吐拉市和圣罗莎火灾前后的 DigitalGlobe 卫星图像，创建了一个包含约 1000 座建筑物（760 个未损坏建筑物和 320 个烧毁建筑物）的图片数据集，然后使用预先训练好的 ImageNet 网络（随后进行微调）来学习如何将已烧毁建筑与未烧毁建筑进行分类，准确度达 80％到 85％左右。

为什么重要：这样的研究成果很有趣，主要是因为它可以为响应救灾节省时间，通过注释的数据集和新技术相对容易地训练新模型来提高分类能力。这样的技术需要经常更新的卫星图像才能发挥更大的作用，而 Planet Labs 和其他人创业公司可以提供这样的服务，所以这似乎并不难实现。

阅读更多：卫星图像分析险情损失预估（Arxiv）。

https://arxiv.org/abs/1803.00397

谷歌研究人员发现奇特方法改善 RNN 的长期依赖性能

... 辅助损失 + RNN 以提高性能...

记忆对于神经网络来说是一件麻烦的事情，如何提高网络的代表能力一直是该领域长期存在的问题。现在，Google 的研究人员已经找到了一个对递归神经网络进行相对简单的调整，使他们能够模拟更长时间的依赖关系的简单但奇特的方法，这可能会让 RNN 可以处理需要更大内存的问题。该技术涉及用无监督的辅助损失来增强 RNN 的能力，试图在整个网络的某个地方建立关系模型，或者在相对较短的距离上向前投射，这样可以让 RNN 学习在更长的时间尺度上表示更精细的结构。现在我们需要弄清楚这些问题是什么，并进一步评估系统。

评估：长时间尺度依然是一个鸡生蛋蛋生鸡的问题，很难找出一个可以用来测试它们的恰当方法。其中一种方法是逐像素图像预测，将每个像素单独送入长期系统，然后用上述技术增强 RNN，观察它如何有效地学习分类图像。这个想法是，如果它可以很好地对这个图像进行分类，那么它就能够已经被输入的像素中学习高级模式，这表明它正在记住一些有用的东西。研究人员对像素从 784 到 1024（CIFAR-10）的图像进行测试，像素达 16000 则通过'StanfordDogs'数据集测试。

阅读更多：Learning Longer-term Dependencies in RNNs with Auxiliary Losses (Arxiv). https://arxiv.org/abs/1803.00144

阿里巴巴用强化学习优化在线广告投放效果

... 游戏和机器人都很酷，但是关于现在可以赚钱的实用系统的论文却是最少的...

中国电子商务和人工智能巨头阿里巴巴已经发布了强化学习技术的细节，据说它可以进一步优化赞助实时竞价拍卖广告。这个被称为 M-RMDP（Massive-agent Reinforcement Learning with robust Markov Decision Process）的算法可以改善广告的投放效果并降低广告商每条广告的潜在价格，从而有力地证明了 RL 可以应用于这些常见的，需要高度调整、基于规则的启发式在线广告系统。值得注意的是，谷歌在这方面发表的论文不多，这表明阿里巴巴可能会加强在这个战略领域的部署，这是因为：a）它自认在这一领域仍然落后于谷歌和其他对手 ; b）通过发布这个系统可以吸引更多有兴趣研究这一领域的专家。研究人员表示，M-RMDP 的主要贡献是能够模拟不同拍卖状态，需求增强和减弱的转换。

方法和规模：阿里巴巴表示此系统的设计目标是处理所谓的“大规模代理问题”，它正在研究一种可以处理“数千甚至数百万代理商”的强化学习方法。本文中涉及的实验，需要 1000 个 CPU 和 40 个 GPU 来运行训练基础框架。

结果：该公司从阿里巴巴搜索拍卖平台中挑选了 1000 个广告，并收集了两天的数据用于训练和测试，通过其在测试集内的模拟反应来测试系统的有效性。当这个离线评估证明了这个方法的有效性后，阿里巴巴即进行了在线测试，结果发现他们的 M-RMDP 方法大大提高了广告商的投资回报率，同时略微降低了 PPC 成本，为他们节省了资金。

为什么重要：强化学习用于实践用途并产生经济效益的案例屈指可数，现在许多令人难忘的成果都是与视频游戏或棋盘游戏，机器人完成简单任务相关，所以这是一个很好的变化，证明了强化学习可以用来做一些具体和实际的事情，比如学习线上竞价和拍卖。

更多信息：Deep Reinforcement Learning for Sponsored Search Real-time Bidding (Arxiv). https://arxiv.org/abs/1803.00259

关于 OpenAI：用新的环境、算法和研究思路改进机器人研究

... 可以抓取东西的模型！HER！影子手！…

我们发布了一套帮助人们开展机器人研究的工具，其中包括一个新的模拟机器人模型，Hindsight Experience Replay 法的 benchmark 部署，以及一系列针对 HER 的研究思路。

阅读更多：Ingredients for Robotics Research (OpenAI blog). https://blog.openai.com/ingredients-for-robotics-research/

作者 Jack Clark 有话对 AI 前线读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

原文链接：

https://jack-clark.net/

如果您觉得内容优质，记得给我们「留言」和「点赞」，给编辑鼓励一下！

反向激励，在加速这个社会的黑化

Wealth | 中国成本轮金价涨势的前沿和中心

“Green & IntelligentManufacturing” Chinese Bridge Online Program

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！