凛冬将至!阿里技术大牛出走,这个行业要有新动荡
未来AI的趋势是什么?
2017年中国人工智能大会召开前夕,有人向时任蚂蚁金服副总裁、首席AI科学家漆远提了这个问题。
漆远当时借用了一句朋友的话:“将来每一个成功的公司都会是一个人工智能的公司。”
近日,据复旦大学官方消息,漆远现已从蚂蚁集团离职,正式加入复旦大学,担任复旦大学"浩清教授"及复旦人工智能创新与产业研究院院长。
进退
谁是漆远?很多人可能不熟悉这个名字。
他是支付宝背后的AI大牛。
头衔很多,蚂蚁金服副总裁、蚂蚁AI首席科学家,蚂蚁金服人工智能部负责人,达摩院金融智能负责人......
2014年回国加入阿里巴巴的漆远,参与创建了阿里达摩院的前身iDST(数据科学与技术研究院),一年后他就担任蚂蚁金服副总裁,组建了蚂蚁人工智能部。
如今淘宝的拍照识图、支付宝的证件校核、阿里的语音识别、蚂蚁的快捷支付、小微贷款,这些应用背后都是漆远团队的技术支持。
漆远团队开发了阿里首个基于参数服务器的超大规模机器学习平台,目前在阿里和蚂蚁的100多个业务场景中广泛使用,曾在阿里巴巴内部被评为技术创新第一名。
在人工智能技术进步之前,支付宝的证件校验时间往往需要一天。但加入了基于深度学习的OCR系统,时间从一天直接缩短到一秒。
这些润物细无声的技术应用,是漆远为代表的技术大佬在幕后完成的变革。
漆远刚加入iDST时,马云几次毫不客气地形容阿里当时的技术水平,是“坐在金山上啃馒头。”
作为最大的电商平台,阿里巴巴拥有着海量数据。但“如果数据的价值不能被挖掘出来,那不过就是普通的土壤”。
时至今日,已经没有人怀疑阿里的技术实力。甚至过于精准的淘宝推荐,一度滋生许多阴谋论,让人对互联网大企的黑箱算法心生畏惧。
“人工智能正成为新一轮产业革命的土壤、未来数十年科技世界的底层基础设施。”
学术
也就在这个改变发生的时间点上,漆远离职了。
他此次就任的“复旦-浩清”特聘教授岗位,是由香港石油大王、复旦大学校董刘浩清先生捐资设立的,旨在复旦大学数学、物理和化学等基础学科及相关交叉学科集聚和造就一批具有国际领先水平的学科带头人。
复旦能够提供人工智能领域更优渥的研究条件吗?
从漆远自己的话中,似乎已经早有答案。
“阿里巴巴有真正海量的数据,有比学校更强的计算资源,有更难更具挑战性和现实意义的问题。”
2013年7月,漆远从美国回国探亲。中国工程院院士,时任阿里巴巴CTO的王坚邀请他去杭州聊一聊。
盛情难却之下,漆远来到阿里巴巴总部,不仅见了王坚,还和当时蚂蚁金服的CEO井贤栋、CTO程立见了面。
几个人聊得很投缘。漆远意识到大企业能提供更适合自己发展的平台。
于是漆远决定回国加入阿里。
此时他已经是普渡大学计算机系和统计系的终身教授,在这所世界知名的理工院校,开设了该校计算机系的第一门机器学习课程。
早在2003年,就有人想把他拉去创业。
那个人叫拉里·佩奇。当时漆远还在麻省理工的实验室,拉里·佩奇来这里招人,请漆远吃了顿饭,邀请他加入谷歌团队。
漆远当时一心想做学术、当老师,说了谢谢,拒绝了邀请。
第二年谷歌在纳斯达克上市,市值迅速上涨超过230亿美元,许多谷歌的雇员瞬间成为亿万富翁。拉里·佩奇作为创始人名声鼎盛,不知道漆远当年有多少感慨。
但他当时还是坚持着自己的人生规划。他从麻省理工又跑去了剑桥的微软实验室。在剑桥他遇到了Chris Bishop,还帮他审了几章书,名字被写入了前言的致谢。
这本书叫《模式识别与机器学习》,后来成了国际上机器学习的经典课本。
剑桥的实习结束,漆远去了伦敦城市大学的盖茨比中心待了3个月。日后名声大燥,把人工智能重新带回大众视野的AlphaGO,就缘起这里。
那时候Facebook还在大学里推广的时候,漆远许多同学就陆续去了这家还在起步的交友网站,Facebook也向他递来了橄榄枝。
而他则专注在机器学习领域的研究。机器学习和可穿戴计算结合用于分析学生学习专注度和司机开车注意力;分析大脑图像数据,基于小数据建立大脑皮层沟回发育模型;把大规模机器学习用于解码人类基因调控网络......
在人工智能还算冷门学科的时候,他已经是这方面的专家。
他在2008年开始研究使用如今大热门的GPU来加速机器学习算法,并探索分布式大规模机器学习,拿下了美国科学基金NSF Career奖和微软的牛顿研究突破奖。
他的学术生涯可以说是如鱼得水。象牙塔里的学者,31 岁麻省理工大学博士毕业,39 岁成为一流大学终身教授,在美国拥有自己的实验室和独栋别墅,学术成就斐然......朋友都以为他要把终生贡献在学术和教职上了,结果他突然决定回国了。
“因为它是一家非常独特的公司,不是复制美国的模式,完全是一个崭新的模式。这家公司所面对的问题规模和复杂度,是很多公司都没有的。”
初春
阿里的饼画的很大。
2014年中国互联网市场还处在模式创新的初级阶段。王坚为了拓宽“电商公司”的想象边界,要让这家以商业利益为本的企业,打造出一所技术驱动的研究院。
这在国内算是破天荒头一遭,没有任何成功的营运模式可以参考。
漆远接到的第一个任务是为阿里打造一套大规模机器学习平台。
需要落地到淘宝的广告平台阿里妈妈。项目刚启动时,阿里现有的存储数据却都不符合实验要求。他手上只拿到14 天的数据,2000万特征。这在机器学习领域,算是极小的数据量,项目至少要等待半年,积累足够的数据量才可能启动。
与此同时,供给他手头项目的服务器数量也严重不足。
他提交了一份申请书,计划拿到数千台服务器。
符合需求的一块英伟达的计算卡,最少要价 2000 美金。几千台服务网即使对整个阿里来说都不是个小数目。他等了半年,都没能拿到自己要的GPU 集群。
甚至还惹得阿里老员工们一顿抱怨。人家不信论文,只看实打实的业务水平。他们不相信漆远可以拿出更高效算法。
而漆远团队被困在一个悖论里,没有 GPU 集群,就证明不了自己的算法和技术高效。但如果不能证明自己的算法和技术高效,就没有办法争取到 GPU 集群。
“同事们认为,你们这帮教授老师过来,基本不懂业务,也不懂技术。”
漆远和高层僵持了半年,“团队一度走在解散的边缘”。终于拿到了足够的资源,启动分布式机器学习平台。
为了这个难得争取到的机会,全团队都放弃了年假和春节,终于在第二年双十一,首次实现了淘宝、天猫的个性化推荐。
俗称“千人千面”的算法应用,让手机淘宝在移动端站稳脚跟,也让蒋凡和张勇在阿里内部的地位急速上升。这是后话,不表。
漆远团队包揽了这一年阿里巴巴集团算法大奖16 项奖中的 6 项。漆远成为达摩院金融智能方向的负责人。
寒潮
但随着AI的风越吹越热烈,曾经高在云端的大厂技术,慢慢露出了自己的短板。海内外一度掀起热潮,一批大学知名教授先后跳槽到互联网大厂。
在行情好的时候,科学家的加入自然是锦上添花。从PR宣传,到兜售方案,大牛们的背书让品牌愈加金光闪闪。
只是这个投入产出比,让逐利的资本发现,这笔买卖已经没有当年划算。
科学家们拿着大笔预算做研究,同样背负CPI或者OKR的压力。美化数据的方法千千万,实际应用的效果见真章。
很多方案比起谷歌、微软、Facebook的开源算法,其实并没有什么优势。
一位知乎用户这样描述行业现状:很多披着“顶尖AI”的大厂解决方案这下就出问题了,ppt没输过,demo没赢过。
而机器深度学习的算法训练,越来越复杂,越来越需要海量资源投入。
据称“仅仅训练一个最新的 GPT-3 模型,可能需要 300 多块 GPU 跑一年,训练成本大约 600 ~ 1200 万美元。结果呢,反映到用户体验上,也就比以前的版本好那么一点点。”
这种成本下,再多发展几个项目,即使是家大业大的阿里,也不是那么好消化的。
而蚂蚁上市的戛然而止,或许就成了最后一根稻草。科学家无法从企业那要来更多资源进行研究,企业也不再需要科学家背书贴金。
随着技术发展暂且进入一段瓶颈,当初的潮水开始回流。
腾讯人工智能实验室的张彤,跳槽去了创新工厂当合伙人,还在香港科技大学和创新工厂联合实验室担任主任。
字节的副总裁,人工智能实验室主任马伟英回到清华大学智能产业研究院,总监李磊跑去了加州大学圣巴巴拉分校任助理教授。
连百度的首席科学家吴恩达都重返了学术界,在斯坦福兼职。
漆远曾说,相信人工智能是人类最后最伟大的发明。
眼看着技术大牛们一个个重返学术界,纷纷挥手告别有数据、有资金、有应用机会的大企业。看来我们距离AI彻底改变世界这一天,还远得很。