从ACM班、百度到亚马逊,深度学习大牛李沐的开挂人生
“大神”,是很多人对李沐的印象。作为一经推出便大受追捧的 MXNet 深度学习框架的主要贡献者之一,李沐功不可没。值得注意的是,这个由 DMLC(Distributed Machine Learning Community)打造的深度学习框架,创建者都是中国人,以陈天奇、李沐等为代表。现在,包括 AWS 在内的很多企业都将 MXNet 作为主流支持框架。
作为深度学习“大神”,李沐的开挂人生经历并不被所有人熟知。为了加深大家对李沐的了解,我们对其学习、职业和研究生涯做了一个简单的总结。
ACM班、百度、CMU、亚马逊,李沐的传奇人生
以倒叙时间线来看,李沐目前为止的职业和学习生涯大致是这样的:
亚马逊首席科学家,2017 年 3 月至今
百度首席架构师,2014.4-2015.12
CMU 读博士,2012-2017
Google Research 实习生,2013 年夏
百度高级研究员, 2011.4 - 2012.8
香港科技大学研究助理,2009 - 2010
微软亚洲研究院实习,2007 年夏
上交 ACM 班
现状:在亚马逊发光发热
按照李沐的领英个人页面介绍,他在亚马逊的工作职责主要有:领导 AWS AI 科学团队,使深度学习易于使用,包括
使用动手笔记本教授深度学习:https://d2l.ai
使CV / NLP / GNN更容易:https://gluon-cv.mxnet.io,https://gluon-nlp.mxnet.io,https://dgl.ai
减少深度学习的机器成本:
DL框架:https://.mxnet.io
DL编译器:https://tvm.ai
这其中提到的教授深度学习笔记,就是李沐在 2019 年 1 月在 UC 伯克利上线的深度学习入门课程 Introduction to Deep Learning。同授这门课程的还有李沐的亚马逊同事 Alex Smola。课程内容大致是按照李沐老师的开源新书《动手学深度学习》来安排的。
课程主页:http://courses.d2l.ai/berkeley-stat-157/index.html
GitHub:https://github.com/d2l-ai/berkeley-stat-157
2017 年,李沐在其个人微博上总结了这一年他所在的亚马逊人工智能部门的两大重点工作:更灵活的前端 Gluon 和更可拓展的后端 NNVM compiler。
其实早在 CVPR 2017 上,李沐就提出了 MXNet 的重要新接口 Gluon,还撰文介绍MXNet/Gluon 的教程:https://github.com/mli/cvpr17
随后,在 2017 年 10 月,亚马逊 AWS 和微软共同宣布推出深度学习库 Gluon。Gluon 为各种水平的深度学习开发人员设计,帮助开发者在云端、App 和其他设备上设计原型,创建、训练和部署复杂的深度学习模型。目前,Gluon 已经与深度学习引擎 Apache MXNet 合作,并已支持另一个深度学习引擎——微软认知工具包(CNTK)。
2017 年 10 月 7 日,亚马逊和华盛顿大学合作发布了开源的端到端深度学习编译器 NNVM compiler。NNVM 是华盛顿大学博士陈天奇等人 2016 年发布的模块化深度学习系统,2017 年 8 月中旬,他们又推出了将深度学习工作负载部署到硬件的端到端 IR 堆栈 TVM,支持将包括 MXNet、Pytorch、Caffe2、CoreML 等在内的深度学习模型编译部署到硬件上并提供多级别联合优化,使得速度更快,部署更加轻量级。NNVM compiler 对 CoreML 的支持,让开发者可以在非 iOS 设备上部署 CoreML 模型。
自带光环的过去
说完了李沐大神的现状,现在我们来简单回顾下他带有传奇色彩的人生经历。
ACM 班“沐哥”
2004 年,李沐从上海交通大学计算机系 ACM 班毕业,在学校人留下“沐哥”的传说。在同期同学的眼中,李沐作为 ACM 班的典型代表,是个颇有领袖气质的人,以至于自然而然地获得一个“沐哥”的称号。他还是一个德智体美劳全面发展优秀学生,从专业课到个人大学四六级考试成绩都名列前茅,且兴趣广泛。在上海交通大学,他又度过了四年硕士生涯。
在后,2011 年 4 月-2012 年 8 月,他在百度担任高级研究员,创建了一套分布式机器学习广告系统。同年,在接到 CMU 的 offer 之后,他决定赴美深造。在李沐于 2017 年发布的文章《博士这五年》中,他提及了这段经历。
2011 年,李沐收到 CMU 的offer,在当时还在百度的余凯和张潼的引荐下,李沐决定辞职离开百度,开启 CMU 博士生涯。
CMU 师从 Alex Smola 和 Dave Andersen
在 CMU,李沐师从机器学习大师 Alex Smola 和 分布式系统教授 Dave Andersen,在两个导师的辅导下,李沐迅速成长。
此后,李沐加入了余凯的百度“少帅计划”,他选择了与相熟的陈天奇一起,把 CXXNet 作为起点,开始做深度学习相关项目。
创建 MXNet
此后,在陈天奇写 xgboost 的分布式启动脚本时,他们发现很多基础部件例如启动脚本,文件读取应该是可以多个项目共同使用,而不是每个项目都造一个轮子,于是李沐与陈天奇在 Github 上创建了一个叫 DMLC 的组织,用来加强合作和沟通。也就是这个组织,此后创建了全世界最受欢迎的深度学习框架之一——MXNet。
MXNet 创建的背后,还有一段小故事:当时 CXXNet 其实已经达到了一定的成熟度,但它的灵活性有局限性,用户只能通过一个配置项来定义模型,而不是交互式的编程。此时,李沐同时还参与另外一个项目 Minerva(张峥起头,王敏捷带领),这是一个类似 numpy 的交互式编程接口,但这个灵活的接口对稳定性和性能优化带来很多挑战。同时给两个项目做分布式扩展的李沐很自然地想到,也许可以把两个项目合并起来,取长补短。
在召集了两个项目的开发人员讨论了几次之后,新项目就此诞生,并被命名为 MXNet,意为 mixed-net,即 Minerva 和 CXXNet 的组合。
当时,李沐同时在做 difacto 和 MXNet 两个项目,在同吴恩达的一次见面之后,李沐听从了他的建议,把全部精力放在了 MXNet。这样,在谷歌 Jeff Dean 牵头创建的 TensorFlow 开源压力之下,MXNet 专注于自己的所长,才有了后面的大获成功。
《动手学深度学习》热卖
最后再提一点,《动手学深度学习》这本由李沐,美国伊利诺伊大学香槟分校计算机科学博士 Aston Zhang,李沐在 CMU 的导师 Alex Smola ,以及来自社区的 100 多位贡献者合著的深度学习书籍,推出之后便大受欢迎,曾在 6 月份登上京东 24 小时热销榜 Top 1。
目前,这本书的交互式版本已推出了在线预览版,面向在校学生、工程师和研究人员,旨在帮助读者从入门到深入、动手学习深度学习,即使是零基础的读者也完全适用。
在线书地址:https://zh.gluon.ai/toc.html
GitHub 项目:https://github.com/diveintodeeplearning/d2l-zh
PDF:https://zh.gluon.ai/gluon_tutorials_zh.pdf
好消息!李沐亲授「深度学习实训营」
这里,我们要告诉大家一个好消息,那就是 AI ProCon 2019 邀请到了亚马逊首席科学家@李沐,在大会的前一天(9.5)亲授「深度学习实训营」,通过动手实操,帮助开发者一站式掌握 AI 核心技术,迅速上手深度学习应用。
除了深度学习「实训营」,李沐还将在第二天(9 月 6 日)作为 AI开发者大会(AI ProCon )的 Keynote 嘉宾,分享他对人工智能领域技术发展与行业应用的洞见。
2019 AI开发者大会(AI ProCon),我们集结了国内外来自阿里、华为、Google Brain、Amazon、微软中国、百度、京东、小米、快手、科大讯飞、商汤、旷视、图森、云知声、思必驰等60+ 技术大咖,在 Keynote 和机器学习、计算机视觉、自然语言处理、知识图谱、推荐系统、5G 驱动 AIoT、AI 开源、AI+小程序、AI+DevOps 9 大技术论坛上分享硬核 AI 技术,深剖行业痛点,助力开发者职业发展!
更多嘉宾正在确认之中......(最终出席嘉宾以现场为准)
丰富的机器学习相关话题和问题讨论,相信会带给观众全新的想法与思考。还在等什么?迅速行动起来,到现场感受人工智能领域产学研大神、顶尖开发者汇聚一堂的热烈气氛,与大神一起头脑风暴,刷新你对 AI 技术的认知!
特惠票价限时抢购中,扫码或点击阅读原文,了解更多嘉宾和大会信息。