查看原文
其他

AutoML:攒钱买个“调参侠机器人”划算吗?

亲爱的数据 亲爱的数据 2023-03-26


(一)


以前,计算机让各种事情自动化。


如今,计算机软件内部在发生自动化。


人工智能(AI)模型的自动化就是计算机软件内部自动化的一种。


为什么AI要自动化(AutoML)


因为AI专家纯手工打造机器学习模型,单说人力就不便宜。高技术含量的专家数量很少,且很难快速培养。


仅靠少量的AI专家纯手工,这一技术很难普及。不少难题,只有交给那些才华横溢的AI博士们。


全靠博士,那可不行。


如果无法普及,那么我们距离“工业化4.0”就遥不可及。


一方面,传统机器学习中用到AutoML,人类AI算法工程师可以用它来跑一遍“参考答案”。


头部云厂商和机器学习平台厂商均已落地此项技术,开源社区的方案也可采用。


另一方面,深度学习领域的AutoML,难度大,成本高。


“亲爱的数据”致电多家AI公司CTO,他们一致认为:深度学习的AutoML,了解过,终究太费钱(GPU),没有应用。


贫穷限制了行动力。



一般来说,汽车装配生产流水线是按工序,机器学习模型生产流水线也是如此。


生产线上下线的是模型,有几大工序:




其中“模型构建” “超参数选择”这两步在模型设计中尤其关键。


它们直接决定了最终训练出的模型的成绩(效果)。



AI专家要在“模型构建” “超参数选择”这两步里反复尝试,最终设计出合适的模型结构。


我们可以称之为“量体裁衣”。


更可怕的是,这会给整个建模的工作带来很多不确定性。敢问谁愿意为“不确定性量体裁衣”?


量体裁衣这样的生产方式十分落后,且成本高昂。




(二)


可是,怎么自动化呢?


好消息是,过去十年,代码-神经网络的架构已经非常成熟。


到现在为止,我们已经研发了大量算法模型,不仅如此,很多算法模型迭代了五到六年。


有想法的企业还会建立自己的算法库,把之前已经用熟了的模型存在库里,专业说法是“沉淀”,方便日后“复用”。


这为自动机器学习(AutoML)打下了“牢固地基”。


深度学习里会用到一种名叫“神经架构搜索(Neural Architecture Search,NAS)”的算法。


它可是自动机器学习(AutoML)里的“红人”,谷歌公司最先使用,从2016年开始走红。



在模型结构设计工作里,用“自动搜索”代替 “人工设计”这个思路自然而然。


于是,用算法搜索算法,或者叫“用算法提高算法”。


讲到这里,那些不理解这个技术的抬杠型网友会说:“禁止俄罗斯套娃梗。”



工作一开始,从“架子”着手。


我们这里谈到的“架子”,实际是“模型结构”。


专家先把“架子”搭起来。


比如,中英文翻译,可选用Transformer结构。

比如,人脸识别,可选用CNN结构。


架子定好之后,对应的算法组件(模块)不能少。


选模块,就相当于在排列组合里搜索


先由专家决定好会用到的模块,再选出那些好用的模块,并选择模块之间的搭配关系。


打一个比方,一个N层酒店,布局其内部结构,每一层放入设计好的房间。

这些房间的房型可以不一样,也可以一样。设计好的房间,就是那些“模块”。


一般来说,每层的房间数量会人为设置一个上限。





假如酒店是50层,每层长50米,自动化的过程就是如何把单人间,双人间,总统套房,布局到酒店大厦。


最终考虑:如何布局酒店最赚钱?



当然不同类型的酒店会有不同的备选房型。


如果要造五星级酒店,那么备选房型的清单里就不会有狭窄逼仄的监狱单间。




酒店的“架子”定好了,房型清单(备选模块)也确定了,那么下一步就是去设计酒店的房间布局了(模型每一层的结构)。


简单理解,这就是从所有可能的排列组合中选出最好的组合。


随机组合,也行,全靠运气型选手。


穷举,也行,把所有可能的组合都去评估一遍,努力多金型选手,


(得舍得花钱,毕竟每一次的评估,研究经费都在燃烧。)


方法种种。


神经架构搜索算法的目标是自动找到的“最好”模型结构,得到最好的模型。


这些模型的成绩会和专家的成绩进行比较,有时候,效果远远不如专家做的。有时候,效果超过专家做的。


不过目前而言,在很多任务上还是人类专家强,它的远期目标是超过人类专家。


目前,这种算法还依靠专家搭好架子(设定搜索空间)。


架子是事先设定好的,它在这个架子里搜索,局限也在于没法突破架子。它不会凭空捏造出一个结构(比如Transformer)





模型架构搜索完成后,再去搜索模型训练的超参数。


当然,你可能会问,为什么不让模型构建和训练超参数调优同时进行呢?


因为 “模型构建”+“超参数选择并不是简单的1+1=2,将二者合并后,会导致搜索空间指数级增加,搜索难度变成地狱级别。



巧了,超参调优和模型架构搜索这两个问题都缺乏可解释性,合在一起就更没法解释了。


深度学习的AutoML既可以做计算机视觉任务,也可以做自然语言处理任务。


它的用途在于用算法提高算法设计效率,给又苦又累的脑力活动省些气力。


然而,深度学习的AutoML目前没有做到一切工作都自动化,在企业中用起来有不少困难,AI实验室里的科学家们还在努力。


假如“调参侠机器人”上市,

买了就能“重获自由”,

你还会买嘛?




(完)



全文审核专家:




更多阅读


漫画系列

1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,人工智能算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?



AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨贾扬清独家专访(二)


DPU系列:

1.造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4.哎呦CPU,您可别累着,兄弟CIPU在云上帮把手


其他:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3. 隐私计算:消失的人工智能 “法外之地”

4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?

5. 两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500





最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

个人微信:18611208992

还想看我的文章,就关注“亲爱的数据”。  



分享、在看、点赞、打赏 ,都是爱

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存