其他

谷歌傻瓜式深度学习工具来了! 李飞飞&李佳里程碑式大招

2018-01-18 Lina 智东西

看点:详解两位华裔女科学家主导谷歌推出的Cloud AutoML,自动生成ML模型的技术。

今天晚上,谷歌又搞了件大事!

谷歌的两位AI明星女科学家——李飞飞和李佳联合宣布,谷歌正式推出Cloud AutoML,通过在网页上选定你的需求(比如“我要一个能够识别客厅的AI模型”)、再上传少量素材(比如“100张客厅的照片”),系统就可以自动生成这个AI模型!

这是自从李飞飞和李佳加入谷歌后一个里程碑式的大招,据两人介绍,目前CloudAI团队推出了10多个AI产品,超过1万家公司在使用。

这也就意味着,原先需要众多AI工程师、AI科学家才能搭建好的深度神经网络模型,现在每个人都能够在自己的电脑上通过鼠标点击、拖拽图片等行为自动生成,一行代码都不需要编写,最快只需要几分钟就能自己造一个AI模型出来——是不是很黑科技?

而如果一家公司想要用此打一个完整的商用模型,也只需要一天的时间。

▲AutoML界面

虽然现在开放出来的只有Cloud AutoML Vision功能,能够定制化生成用于特定图像识别的AI模型。但是李佳和李飞飞都表示未来Cloud AutoML的覆盖范围将会更广,囊括图像、语音、NLP等方面。

谷歌之所以能做到这么黑科技,这其中与两个关键技术息息相关,一个是增强学习(Reinforcement Learning),一个是迁移学习(Transfer Learning),后文将会详细介绍。

过去,谷歌已经成功用深度学习训练了很多图像识别、机器翻译等模型。接下来,通过迁移学习(Transfer Learning)将已训练完成的模型,转移到新的模型训练过程,就能够用用户上传的较少量的资料,通过增强学习(Reinforcement Learning)训练出机器学习模型。

目前Cloud AutoML还处在Alpha免费测试阶段,想要尝鲜的同学可以现在去https://services.google.com/fb/forms/cloudautomlalphaprogram/ 网站申请了。

三大优势:更好、更快、更简单

在建立模型的过程中,所有演算法组合的可能性非常多,手动设计模型非常困难,而且AI专家、AI工程师们投入大量的时间与精力去研发。

谷歌就是这样,在过去的这些年里,谷歌已经成功打造了众多机器学习模型,每个都需要耗费大量资源,需要不断做实验和重新调整参数。

在这个过程中谷歌团队开始思考,有没有办法让AI建模的方式简单化,甚至让AI自己设计AI模型呢?

在花上了好几年时间后,谷歌开始寻找可以自动设计机器学习模型的方法,最终谷歌透过演化式(Evolutionary)和增强式(Reinforcement)演算法打造了AutoML。

2017年5月时,谷歌正式宣布了AutoML项目,2017年10月,它已经可以打造出比研究人员自身更棒的机器学习AI模型。而今天,谷歌正式将它作为云服务开放出来,并且介绍了以下三个优势:

准确率提高:Cloud AutoML Vision的基础是Google领先的图像识别方法,包括迁移学习和神经结构搜索技术(neural architecture search technology)。这意味着即使您的企业的机器学习专业知识有限,您也可以获得更准确的模型。

生产就绪模型的周转时间更快:使用Cloud AutoML,您可以在几分钟内创建一个简单的模型,来试用您的AI应用程序,或者在一天内构建完整的生产就绪模型。

容易使用:AutoML Vision提供了一个简单的图形用户界面,可让您指定数据,然后将这些数据转换为针对特定需求而定制的高质量模型。

增强学习:连AlphaGo Zero都在用的黑科技

刚刚说到谷歌之所以能做到这么黑科技,这其中与几个关键技术息息相关,一个是增强学习,一个是迁移学习——我们先来讲讲增强学习(Reinforcement Learning)

如果大家还记得AlphaGo Zero,它横扫千军的秘密就是在于增强学习。

增强学习与我们常听说的“深度学习”不同,在深度学习里,你需要用大量的数据去训练神经网络。

比如你将一张车的图片给机器看,并且告诉它这是车,下次它就会说出“车”。如果你给他展现出别的,它还说车,你就告诉它“你错了。”久而久之的,它就能认出车来,原理其实很简单,但是对数据量的要求非常大。


而在增强学习中,相当于你不告诉机器这个参数应该怎么设定,等它随机调整了一个参数后,如果结果是好的,那么给它奖励,如果结果是不好的,那么给它惩罚,但是不告诉它哪一步做错了,久而久之机器会自己摸索出一套最佳方案来。

增强学习极大减少了数据的依赖,尤其是在规则明确的游戏当中,则更加适合增强学习发挥其强大的威力。

AutoML就是一种以增强学习为技术的机器学习软件,系统会运行数千个模拟来确定代码的哪些方面可以作出改进,以及在改变后继续该过程、直到达成目标。

除了谷歌外,OpenAI、英伟达、英特尔等都在进行增强学习的研究,这是AI研究界的一大热门项目。此前特斯拉还专门从OpenAI挖来李飞飞高徒前Open AI研究员、斯坦福大学博士Andrej Karpathy担任人工智能及自动驾驶视觉总监。

https://v.qq.com/txp/iframe/player.html?vid=f0506xnhmxw&width=500&height=375&auto=0

视频中的机器人就是OpenAI其中一个训练项目,它会一直不停地以并不熟练的姿势朝着球奔跑,而每当快要接近时,球的位置就会随机变化。偶尔它也会跌倒,接着自己学会爬起来。此外它还会一直不断被白色的立方体攻击,以推动运动轨迹变化。


迁移学习:小数据集的福音

说完增强学习,我们来说说迁移学习(Transfer Learning)。

目前的各类AI算法在经过大量指定数据的训练后,都变得非常“专注”,局限于特定领域,在没有人类大幅度修改的情况下,无法被泛化去处理其他任务。

也就是说一个能认识人脸的AI模型,并不能认识猫脸,也不能认识车牌。所以每个模型打造起来几乎都要从零做起,非常浪费时间。

而迁移学习目标是将从一个环境中学到的知识用来帮助新环境中的学习任务,强调的是在不同但是相似的领域、任务、分布之间进行知识的迁移。

虽然你只拥有很少的数据,但谷歌拥有很多类似的AI模型,所以通过迁移学习,谷歌可以将这两者结合起来,生成一个满足你需求的AI模型。

随着“深度学习已死!”的呼声日益强烈,增强学习、迁移学习作为两大最为火热的AI科目,将会在未来的研究中扮演更为重要的角色。

AutoML黑科技的其他应用

上文提到,虽然现在开放出来的只有Cloud AutoML Vision功能,能够定制化生成用于特定图像识别的AI模型。

李飞飞还曾经特意指出,由于AutoML服务的迁移学习能力让用户用很少的数据就能建立起AI模型,因此它对医疗AI研究非常有帮助。在医疗领域里,面对罕见疾病和特殊案例,医生往往无法取得足够的训练资料来建立模型——AutoML很好滴解决了这个问题。

未来,Cloud AutoML的覆盖范围将会更广,囊括图像、语音、NLP等方面。

不过,虽然谷歌表示AutoML是市场上唯一的同类系统。但市面上也逐渐出现类似的服务,比如Clarif.ai(一家人工智能初创,曾今入选CB Insights 2017全球AI企业100强),而且微软的内部也在定制相关的系统。

结语:AI人才越来越贵,AutoML来帮忙

▲李佳、李飞飞

李飞飞、李佳、与谷歌本身都一直都在宣传“AI民主化”、“让人人都能拥有AI”。

建置模型需要很多时间做实验,也需要许多机器学习的专家才能完成。在各大企业争抢抢夺,AI工程师与AI科学家的薪资身价水涨船高的当下,小公司已经难以负担AI模型开发所带来的时间与人力成本。

因此,Cloud AutoML的服务正是为了解决这个问题而诞生的,它降低了深度学习的门槛,让拥有资源的大公司不再处于垄断地位,小公司或者个人即便没有拥有格外优秀的AI技术人才,也能自己掌握AI的力量。

注:智东西记者CJ亦对本文有极大贡献。



GTIC AWARDS 2018投票正在进行,年度AI先锋、年度创新产品、优秀解决方案等三大奖项角逐,投票截止日1月26日。更多详情,请扫描下方二维码获取。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存