实践者颜水成:在学术界「恋爱」 在工业界「结婚」
文/丁广胜
颜水成教授的办公室不大,摆满了各式各样的工程样机。
我先行一步来到办公室,门口的智能门铃已发现了我的到访,颜水成教授赶忙前来,这是360目前主打的一款智能硬件产品,由颜水成领衔的360人工智能研究院提供技术支撑。目前360在售智能硬件产品达到数十件之多,这也是颜水成来到360的初衷和使命。
“不以结婚为目的的恋爱都是耍流氓”他以此幽默的比喻人工智能落地实践的重要性,他认为学术界研究人工智能像谈恋爱,而在工业界做人工智能更像婚后生活。
三年以来,颜水成担纲的360人工智能研究院发力视觉、语音、语义和大数据四大方向,向业务部门提供技术支持,重点推出了运动、交互、视觉、决策四大AI引擎。
三年过去,颜水成作为横跨学界和工业界的AI实践者,如何理解二者的“爱恨情仇”,又如何一步步成为大师?用他自己的话说,“我们那代人运气不错,现在很多计算机视觉领域的大家熟知的科学家都出生于76年前后,李飞飞、吴恩达、孙剑等等。”
那运气之外呢?
学术界追求极限
念旧的颜水成在北京大学数学科学学院呆了9年,学习计算数学(Computational Mathematics)和应用数学,虽然身在数学系,但跟随导师程乾生教授主要研究模式识别和机器学习相关的课题。
而真正与人工智能结缘,则是在2001年进入微软亚洲研究院实习,启蒙师从李子青(Stan Z. Li),李子青是人脸识别和智能视频监控专家,在2000年辞去新加坡南洋大学终身教职,加盟微软亚洲研究院,并在微软研发了人脸识别系统EyeCU。
颜水成的整个PHD期间,几乎都是在微软亚洲研究院渡过的,后来主要师从张宏江博士,张宏江是世界多媒体研究领域一流的科学家,被称为计算机视频检索研究领域的“开山鼻祖”,他也是微软亚洲研究院的创始人之一。
周志华、颜水成、梅涛等如今活跃的科学家都曾是张宏江的门徒,图为张宏江
“微软的氛围非常好,非常自由同时方向非常多,以至于我当时在计算机视觉和机器学习两个方向都有非常广的涉猎”。期间与何晓飞(前滴滴研究院院长,现飞步科技CEO)一起将Subspace Learning与Manifold Learning两个非常火爆的领域巧妙而简单地串联起来,两人后来一共发表了4篇单篇引用过千的论文,在这个领域产生了广泛的影响。
但到了不得不作出选择的时候,如果选择留着微软,颜水成觉得可以一眼看到三年、五年之后的样子,还是应该去海外走一走,他首先来到了香港中文大学汤晓鸥教授的实验室,继续从事人脸识别相关的研究工作。因为汤晓鸥教授当时往返北京和香港两地,在这期间颜水成就带领大家一起推进项目研究,他的领导能力得以培养和锻炼,为日后奠定了基础。
在短短的一年多时间之后,颜水成又继续前往伊利诺伊大学香槟分校(UIUC),师从美国工程院院士、计算机视觉华人鼻祖黄煦涛(Thomas Huang)教授,在这里他见到了一群算法和编程能力能都超级棒的学生,其中包括大家后来熟知的周曦、韩旭以及JianchaoYang,见证了与这群人一起投9篇CVPR中7篇,剩余的2篇又快速中其他会议的完美经历。
绕了一圈,尘埃落定。
颜水成返回亚洲,进入新加坡国立大学,开启了最高产的八年学术生涯,他认为这里比美国和中国都具有优势,在美国一个教授需要花大量的时间写项目申请,并且命中率非常低,而在中国,年富力强的教授可能需要花太多的时间应付学术之外的事情,无法最大化利用宝贵的时间。
在新加坡则没有这些顾虑,颜水成约一年写一个项目申请,“在新加坡的八年是我做学术最专注的八年,而且产出非常大”,其团队多次是CVPR和ACM MM两个会议论文全球最多的团队。他的团队是最早参加计算视觉核心竞赛PASCAL VOC并获冠军的亚洲团队,2010-2012连续三年获得物体识别子项的冠军。同时其团队也多次参加ImageNet竞赛并获冠军,期间提出的Network-in-Network模型中的1x1卷积成为后续几乎所有计算机视觉CNN变种模型的基础模块。
目前,他在国际高质量期刊和会议上共发表了约600篇高质量学术论文,论文引用过4万次,H-index 92,当前他是新加坡Computer Science & Engineering 领域H-index 最高的学者,2014、2015、2016 、2018四次入选全球高引用学者( TR Highly-cited researchers )。
新加坡国立大学
在颜水成看来,在学术界就是追求极致,更多的是对技术和产品的憧憬,或者不停的进行技术升华,大多数时候并不需要真正把产品落地。
就这样,颜水成萌生了投身工业界的想法。
02
工业界在商言商
后来的故事想必大家就熟知了,颜水成在来360公司交流时与360一拍即合,一边是深入学术研究十余年的技术大拿,一边是求贤若渴希望筹建AI研究院的企业,2015年颜水成选择北上,投身工业研究的序幕就此拉开。
在工业界,颜水成开始“在商言商”,他把多年的技术积淀回归商业,产品落地成为工作的核心。他认为这时候最重要的是学术思维向工业思维的转变。
他幽默的将这种转变比喻为两个人谈恋爱,两个人谈恋爱是必修课,但婚后的生活才是本质,“不以结婚为目的的恋爱都是耍流氓”,在工业界必须以产品落地为自己的指导思想。
独特之处在于,颜水成还身兼新加坡国立大学副教授,这样跨领域的背景让他的研发工作更加从容,2016年,人体分割技术(Human Segmentation)在手机上展现可商用的可能性,欧洲的一支研究团队开始展示,颜水成团队感兴趣但无奈对方要价太高,这个时候他联合了自己的NUS实验室,得益于此前的技术积累,只花了一个月的时间就取得了成功,开始在手机上应用人体分割技术。
他将学术研究和工业实践结合在一起,撞出了火花。
他还建议身处学术界的教授在选择课题时,应该多拥抱工业界的需求,真真正正的瞄准社会价值,对于学生而言,大部分人最终都将进入工业界,真正有用的课题也对学生的长远发展颇有益处。天马行空的秀demo,很难产生价值,但他也承认,这个时代需要有人探寻科学的边界,很多实验室经常会探索出令人惊喜的东西。
对于李飞飞、李佳、张潼等AI专家重返学界,颜水成提到,学界和工业界的区别有目共睹,关键是能否和自己的价值观和追求所契合,如果有偏差选择离开是必然,但他相信这些科学家的理念已经渗透进所在的企业,未来肯定会产生积极的作用。
03
请回答2019
“人工智能行业会朝着更理性和更垂直的方向走”。
颜水成坦言,在火热的自动驾驶赛道,去年的时候大家普遍面向L4/L5,今年我们可以明显的感知到,大家回归理性,更多的人选择专注在受限场景,港口、高速、公园等。
而另一方面,计算机视觉公司会变得更加重视场景,成为一个整体的方案提供商,而不只是一家“纯粹”的只提供SDK输出或者技术的提供商,大家需要长远考虑。
变得更理性更专注是颜水成对行业趋势的总结,“2016年的时候,只要是一家人工智能公司,大家就疯狂的投,2017年的时候,大家会看这家公司有没有落地潜力,但是到了2018年和2019年,大家开始真正的重视一家人工智能公司赚钱的能力。”
从技术的维度,颜水成期待2019年AI芯片和5G的真正爆发,过去两年,大家只是尝试和探索,2019年我们希望看到AI芯片和5G快速的产品化推进。
移动通信网络技术演进
我们注意到,2019年将是5G应用元年逐渐达成行业共识,今年在全球范围内将有30多款5G手机上市,5G网络作为第五代移动通信网络,其峰值理论传输速度可达每秒数十Gb,这比4G网络的传输速度快数百倍,整部超高画质电影可在1秒之内下载完成,随着5G技术的诞生,用智能终端分享3D电影、游戏以及超高画质节目的时代已经向我们走来。
颜水成指出,AI芯片的规模应用将使得计算机视觉行业再次迎来机遇,有了AI芯片和5G这两剂“强心针”的加持,在资本寒冬到来的当下,尽管充满挑战,但他依然看好人工智能行业的发展,“大家投了那么多年,该考虑商业回报了”。
不过,对于那些进展缓慢的人工智能项目,未来一年将会相当难熬。
04
后记:
一个有趣的观点
“现在很多计算机视觉领域的大家熟知的科学家都出生于76年前后,李飞飞、吴恩达、孙剑等等。”
这让作者想到了马尔科姆·格拉德威尔在《异类》中谈到,“比尔·盖茨和史蒂夫·乔布斯都出生在1955年,1955年前后正是计算机革命的时期,如果你出生太早,就无法拥有个人电脑,如果出生太晚,计算机革命的好机会又被别人占去了,那些奇才异类,他们之所以神奇,得感谢机遇的眷顾。”
一个评语
“「网易2018中国AI英雄风云榜」商业创新人物先锋奖的获得者是周曦和朱珑,我非常看好这两位年轻的科学家,他们能够抛去学术光环,在商业领域脚踏实地一步一个脚印的往前走,他们的公司可能不是发展最快的,但未来一定会取得非凡的成就。”
往期推荐
独家|Roadstar.ai内讧背后 是佟显乔的CEO保卫战
AI英雄榜 l 「AI天才」何恺明
▲点击图片观看重磅 | 华为危机?任正非罕见接受采访,回应一切【附万字详录】
网易智能AI社群(AI芯片、医疗AI、金融AI、电商AI、自动驾驶、教育AI、AIoT、机器人等12个社群)火热招募中,对AI感兴趣的小伙伴,添加智能菌微信 kaiwu_club,说明身份即可加入。