查看原文
其他

你爱吃的火锅底料,是机器人自动进货丨漫画AutoML

亲爱的数据 亲爱的数据 2023-03-26


图文原创:谭婧


没有什么是一顿火锅解决不了的,解决不了了,那就两顿。


吃火锅,备涮菜,火锅底料必须买。


清晨四点半,天色清,日色薄,城市没有睡醒,超市的火锅底料,整齐地摆放在货架上。


凌晨五点半,机房静,计算忙,电商的计算机集群里,算法更新了一轮参数,火锅底料的销量被预测出来,进货数量被计算出来。


于是,火锅底料严格按照进货数量,将运往里城市更近的库房。


这一切,只为你选购,只等你下单。

电商如何知道“春夏秋冬,寒来暑往,到底要给火锅底料备多少货?




那问题来了,如何算出要为“秋日促销”进多少货?


进货机器人说:“兄弟们,卷起来,这个问题交给我们。


进货机器人的工作原理是:做好选择题。


“选择题,我擅长,我吃火锅经常做。”



数据部分就不展开了,常规做法是先自动处理数据,进行预处理及数据清洗,保证高质量的输入。






根据模型选择特征,而特征不止一个,会先建立一个特征池子,把已有的特征都放在里面。


视角不同,特征类型也会不同。

或分成技术特征和业务特征。

或者分成,和时间有关的特征,和时间无关的特征。






特征本无优劣,但在具体场景和模型中,机器人会先判断哪些特征影响预测结果,再给这些特征打分,特征会分出高下。


那些不好用的特征,就会被淘汰掉。


还可以把多个特征组合成一个新特征,属于自动生成特征。这样,特征又多了一种分类,旧的是基础特征,新的可以称为“新生特征”。


假如影响销量主要因素发生巨大变化,比如把目标市场从中国换成韩国,机器人自动根据变化对特征做出调整。




机器人在选择预测销量模型的时候,第一步先选模型,既可以选择A模型,也可以选择B模型,C模型,等等。


按方案的结果,选择“成绩”最好的算法模型,好比“内部赛马”。


第一步,再根据模型A,确定A最好的超参,衍生出A1、A2、……An,搜索合适的超参。


要注意的是,预测准确度会影响下一步“进货”,一步错,步步错。





“进货”就要考虑“供货”。


一盘生意需要细细盘算“是否一直都要有现货”,或者“要备几天货”这些事情。也就是说,会考虑供应商的“送货能力”和“送货时长”。


这是一个运筹问题,不是机器学习问题,所以不涉及特征。


选模型,二选超参。


而进货模型的超参,非常有供应链特色。




以“期望现货率”为例,设置高了成本会急速增长,设置低了会损失大量的销售机会。


如何选择超参是门学问,更进一步如何实现超参选择的自动化,这是秘方(就不展开了)


在超参选择中,一组超参数,对应着计算出一个结果。计算机得根据不同的超参,匹配最优的模型。


搞AI的人都知道,超参难调。做到“模型构建” “超参数调优”两个环节的自动化,就不用纯手工的在这个环节中反复尝试,找到最优解。


所以,这个环节的自动化,价值不言而喻。




模型计算完,进完货,事情就结束了吗?


没有。


事后,会再把真实的数据给模型,让模型再去学一遍,看看差距在哪。


这是一种反馈方法,也是机器人自我鞭策的运转机制。


销量和消费者的心思有关,而进货和供货商的心思有关,这事就成了难啃的硬骨头。


细节里不仅会有魔鬼,还会有很多钱。


所以,谁的SKU多,谁最难受,谁最着急使用自动进货机器人。



自动机器学习(AutoML)一直是研究者的梦想,让模型的超参数,甚至模型结构本身,可以通过学习过程自动探索到最优解。



时光荏苒,技术飞奔,在智能供应链中,想算出到底几天能到货,传统机器学习的方法已经不够用了,还要加入运筹规划的方法。




自动化之所以能走到这一步,有赖于过去十年人们研发了大量算法模型,打下好基础。


相当于有了一个精良的武器库,我们要做的就是在库里,用最快最省力的方法,找到最合适的算法模型。


这类自动化是计算机软件里面发生的自动化。


用AI技术的那群老板,做梦都希望能做到调参自动化。



表面上,似乎压力给到打工人这边。


实际上,即使没有进货机器人,千万级别的SKU,人类也管不过来。



“自动进货机器人”太优秀了,HR会问:“岗位职责”上写什么呢?



别说火锅底料,越来越多你爱吃的美味,都会是自动进货。



(完)



全文审核专家:



更多阅读


1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3. 隐私计算:消失的人工智能 “法外之地”

4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?

5. 两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500


漫画系列


1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,人工智能算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”划算吗?



AI框架系列:


1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)


DPU芯片系列:


1.造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4.哎呦CPU,您可别累着,兄弟CIPU在云上帮把手




最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

个人微信:18611208992

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存