查看原文
其他

调参工要凉?微软重磅开源AutoML工具包NNI

AI前线小组 AI前线 2020-10-04

策划编辑|Vincent
作者|Vincent
编辑|Debra
AI 前线导读:今年 7 月份的时候,AI 前线报道了一篇有关微软智能系统的消息,在文章中,我们对微软的视觉领域 AutoML 系统 Microsoft Custom Vision 进行了简要分析。在对微软亚洲研究院副院长、人工智能系统联合中心负责人周礼栋博士的专访中,我们了解到微软将很快开源一款 AutoML 工具包,名为 NNI,今天,微软将其正式开源!

更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)

近年来,“AutoML(自动学习)”已经成为了一个研究热点。通过自动化的方式,机器试图学习到最优的学习策略,从而避免机器学习从业者低效的手动调整。经典的 AutoML 方法包括用于超参数调节的贝叶斯优化(Bayesian Optimization),以及用于优化器和网络结构调整的元学习技术(Meta learning/Learning-to-Learn)。除了在学术界引起了广泛研究兴趣,AutoML 在工业界也已经得到了实际应用,例如此前提到的微软 Azure 提供的自定义影像(Custom Vision)服务,它能够方便云计算用户自动训练用于计算机视觉的机器学习模型。

AutoML 让用户在没有专业知识的情况下使用机器学习的门槛大大地降低,甚至可谓是零门槛。在没有机器学习专家指导的情况下,用户通过 AutoML 就能在一定情况下得到高质量的模型,这使机器学习的行业应用更加容易可行。微软亚洲研究院希望把这类技术的使用和研究更加普及化,微软正在着力打造一款用于深度学习的项目,名曰:深度学习智能探索 (Neural Network Intelligence),简称叫 NNI。

什么是 NNI?

在官方开源的 GitHub 中是这样写的:

NNI(神经网络智能)是一个帮助用户运行自动机器学习实验的工具包。该工具调度并运行通过调整算法生成的试验作业,以在不同环境(例如,本地、远程服务器和云)中搜索最佳神经架构和 / 或超参数。

据介绍,开发 NNI 工具包的目的是为用户提供智能化、自动化的深度学习工具包,可以帮助用户或者开发者自动进行数据分析,自动帮他们搜索模型,进行参数调试和性能分析,通过这样自动迭代的准备过程,用户可以节省更多的时间,将精力放在探索更有深度的机器学习上。

NNI 集成了 AutoML 算法,是一个支持不同操作系统,既可以在本地也能在云端运行的轻量级工具包。它特别适合有一定人工智能基础的科研人员更加有针对性、精准地选取模型。 微软为此制定了全新的语言,使得定义和描述搜索空间只需几行代码,所有的底层通信等复杂问题都被封装起来,对使用者完全透明。NNI 着重解决了一系列支持 AutoML 的系统问题,以开放的方式有效加速 AutoML 算法研究者在这一领域的创新。

开源地址:https://github.com/Microsoft/nni

入门指南:https://github.com/Microsoft/nni/blob/master/docs/GetStarted.md


谁应该考虑使用 NNI
  • 想在本地为训练代码(模型)尝试不同的 AutoML 算法

  • 希望在不同环境中运行 AutoML 试用作业以加快搜索速度(例如远程服务器和云)

  • 作为研究人员和数据科学家,希望实现自己的 AutoML 算法并与其他算法进行比较

  • 作为 ML 平台所有者,希望在自己的平台中支持 AutoML

    为什么要用 AutoML?

这个问题在我们之前的系列文章中频繁提及,原因主要是以下几种:

  • 简化深度学习流程,让人工用在更需要的地方

  • 降低人工智能门槛,同时降低人工智能成本

  • 推进人工智能的普及化

随着人工智能的普及化,越来越多人担心自己的岗位是否会被替代,就连一些在 AI 领域从事相关工作的人都有了危机感。

前不久,在李开复博士的新书发布会上,他专门提及了这一问题,他认为在 15 年内,人工智能和自动化将具备取代 40-50%岗位的技术能力。一些无需过多思考,重复性高、强度大的工作将会被 AI 代替。

从这一角度来说,AutoML 的普及反而是一件好事儿,它可以让更多人去思考 AI 不能做什么,进而让更多人从事具有创造性的、AI 无法替代的工作。

就像李开复说的那样:

我们应该积极使用人工智能工具,特别是专业人士,更多的数据和使用量能够使人工智能不断优化。我们应该使用这些工具来工作,保持开放态度,人工智能可以完成更多的日常任务,使我们能够关注更适合人类发展的领域。

今日荐文

点击下方图片即可阅读

腾讯开源 ML-Images,超越谷歌成业内最大多标签图像数据集


会议推荐

知识图谱是机器大脑中的知识库、人工智能的基础设施。Google、百度等公司都把知识图谱当做 AI 产品底层设计中最重要的环节进行优化,李彦宏也曾说过“知识图谱是百度整个人工智能当中非常基础的构件,也是我们相对于任何一家公司的优势所在”。

本届 AICon 全球人工智能与机器学习技术大会上,我们也非常关注知识图谱在金融、医疗、教育等领域的发展与落地实践,并请到了一线技术大咖带来干货满满的案例分享,感兴趣的同学可以扫描下方二维码或点击阅读原文了解详情~


如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存