其他

AI 研习社周刊 | 一周热点资讯回顾

2017-03-12 恒亮 AI研习社

各位周末好!对 AI 开发者来说,本周有不少新开发工具面世,重点包括:

  • Facebook 开源全新算法库 FAISS 和新一代机器学习 GPU 服务器 Big Basin;

  • 谷歌召开 Google Cloud Next 云技术大会,宣布收购 Kaggle,并发布视频搜索 API;

  • 英伟达针对 AI 发布全新嵌入式开发组件 Jetson TX2;

  • 百度发布 PaddlePaddle 全新 API 大幅减少代码冗余等。

下面我们将完整梳理本周内与开发者息息相关的 AI 大事件,并推荐几个 AI 研习社编译整理的开发者资源,祝大家周末愉快。

█ Facebook 开源聚类和相似性搜索库 FAISS

FAIR(Facebook 人工智能实验室)上周发表了一篇论文,提出一项针对聚类和相似性搜索的新算法设计。新架构比此前最先进的算法更快更高效,并使用 GPU 来获得更高的内存带宽和计算吞吐量。

基于此项研究,FAIR 近日在 Github 开源了一个名为 FAISS 的库,相关文档已陆续完成上传,并于昨日更新了安装文件。能进行聚类和相似性搜索的算法已有不少,FAISS 对它们进行了优化,以便更高效地在 GPU 上运行。FAISS 整合的部分算法有: 

Fast K-Nearest Neighbour

QuickSelect

Warpselect

K-Means clustering

FAIR 表示,FAISS 有五大特性:

使用 C++ 编写,有完整的  Python/numpy 封装。

支持单个、多 GPU。

优异的可扩展性,通常情况下能支持最多 100 个维度。

基于 BLAS 和 CUDA。

比当前最先进的库速度提高 8.5 倍。

详情:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html  (请点击文末“阅读原文”跳转)

GitHub:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html 

论文:https://arxiv.org/abs/1702.08734 

█ 谷歌开放大规模音频数据集 AudioSet,助力 AI 音频算法研究

在 Google Cloud Next 云技术大会之前,谷歌通过开发者博客公布了一个可以媲美图像识别领域 ImageNet 的大型音频数据库 AudioSet。据称,该数据库包含了 632 个音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段(来自 YouTube 视频),覆盖范围包括人声、动物声、各种乐器与音乐流派,以及日常生活环境的声音等。总体量为:2100 万标注视频、5800 个小时的音频,以及 527 种类型的标注声音。

论文:https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45857.pdf 

详情:https://research.google.com/audioset/ 

█ IBM 语音识别能力逼近人类水平

去年十月,微软人工智能与研究部门的一个研究者和工程师团队报告他们的语音识别系统实现了和专业速录员相当甚至更低的词错率(WER)——达到了 5.9%。本周 3 月 7 日,IBM 在官方博客发文称人类的水平实际上应该是 5.1%,同时表示 IBM Watson 的词错率已经超越了之前微软报告的最佳水平,达到了 5.5%。

详情:http://www.leiphone.com/news/201703/bJaCYcArDJIenrAC.html 

█ 英伟达发布全新 Jetson TX2 嵌入式开发组件,强化 AI 智能运算


3月7日,英伟达发布了全新的嵌入式开发组件 Jetson TX2。据报道,这块全新发布的开发板只有一块信用卡大小,但提供了超过前代产品近两倍的运算性能。按照公司高管的说法,之所以提供如此强劲的运算性能,就是为了助力开发者在深度神经网络等 AI 智能领域的研究。

详情:http://www.leiphone.com/news/201703/MJ1rgDpXMzUENYtF.html  

█ Google Cloud Next 云技术大会

Google Cloud Next 云技术大会于当地时间3月8日上午8:30在美国加州旧金山开幕(北京时间约为9日凌晨1点)。

大会上,谷歌宣布收购大数据竞赛平台 Kaggle,但并未公布具体交易条款。报道称,被收购后 Kaggle 将会保留独立团队和品牌,并接入谷歌云服务,继续举办大数据相关的竞赛。

此外,谷歌还推出了全新视频搜索 API :Video Intelligence API 。报道称,Video Intelligence API 的主要功能是标注视频中的物体和场景,即实现了自动化的视频标记,从此开发者可以像搜图片一样轻松地搜索视频中的内容。目前该 API 尚处 Private Beta 阶段,并未完全公开。

收购 Kaggle 详情:http://www.leiphone.com/news/201703/ZjpnddCoUDr3Eh8c.html 

视频搜索 API 详情:https://cloud.google.com/video-intelligence/ 

█ Facebook 开源新一代机器学习 GPU 服务器 Big Basin

继 2015 年发布开源机器学习 GPU 服务器 Big Sur 并将其成功应用之后,今天(3 月 9 日) Facebook 通过官方博客宣布 Big Sur 的升级版 —— Big Basin 已经研发成功,并在 Open Compute Project 开源。据称,通过将内存从 12 GB 增加到 16 GB ,以及提高算数吞吐量(arithmetic throughput),Big Basin 可以处理的机器学习模型规模增加了 30%。

详情:Facebook 开源新一代 AI 训练服务器,速度提升一倍

█ 百度发布 PaddlePaddle 新 API

3 月 9 日,百度宣布已完成 PaddlePaddle 新 API 的内测版本。PaddlePaddle 是百度研发的深度学习开源平台,于去年 9 月对公众开放,称得上是国内机器学习开源项目的领军者。新 API 接口大幅精简了 PaddlePaddle 的代码量。下面百度官方公布的对比图,左为旧 API 上的 CNN 程序,右为新 API。

如图所示,新 API 的代码非常简洁。百度表示,这主要是由于三个方面的改进:

新的概念模型

提供“训练、“测试”、“推理”等新的高级 API,并支持 Kubernetes 。

组合的 data bricks

此外,百度还开放了《使用 PaddlePaddle 进行深度学习》的使用手册,其中有示例教程。

手册下载地址:http://book.paddlepaddle.org/index.en.html 

详情:http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/   

█ 大会预告:IBM InterConnect 2017 

IBM InterConnect 2017 开发者大会将于 3 月 19-23 日在拉斯维加斯举行。日前为了吸引更多的开发者参与,IBM 在官方博客中总结了此次会议对 Java 开发者而言的 6 大亮点:

1. Code Rally 编程拉力赛

2. DevZone 开发者社区

3. 微服务(Microservices)专题讨论

4. Open Tech Summit 技术开放峰会

5. 基于 IBM WebSphere Liberty 和 MicroProfile 的敏捷开发

6. 基于 IBM WebSphere Liberty 和 Node.js 的本地云微服务

详情:https://www.ibm.com/blogs/cloud-computing/2017/03/java-developer-interconnect-2017/ 

开发者资源推荐

█ 最近很火的《计算机科学的数学》是本什么样的书?

本文详细介绍了《计算机科学的数学》这本书的来龙去脉,并推荐了其他一些相关资源,包括一个权威的机器学习入门书单和十大机器学习公开课等。

地址:最近很火的《计算机科学的数学》是本什么样的书?

█ 数据科学入门难?老司机为你盘点 24 门精品课程

本文盘点了 24 个高品质的在线数据科学入门教程,原作者是一位自学成才的数据科学大牛,文中汇总的课程不但参考了在线慕课社区 Class Central 成千上万的课程评分和评论数据,更是原作者的经验之谈,因此非常具有参考价值

地址:数据科学入门难?老司机为你盘点 24 门精品课程

█ 盘点近年来引用最多的深度学习论文

原文来自滑铁卢大学的博士研究生 Terry Taewoong Um,他搜集整理了 2012 年以来在深度学习领域被引用次数最多的一百多篇论文,值得深入研究。

地址: 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存