AI行业求生之路:做算法的去养鸡场,做语音的卖鸡蛋,做视觉的送蛋炒饭
编辑 | 胡永波
2018年1月16日,全球最大中文 IT 社区CSDN在北京蔓兰酒店举办了“ AI 生态赋能2018论坛暨 CSDN AI 新战略发布会”。本次发布会上,CSDN重磅推出了企业智能化升级指南——《2017-2018 中国人工智能产业路线图 V1.0》,该路线图首次提出了AIMM——企业智能化成熟度模型,希望能为中国企业的AI转型提供有益参考。
发布会现场,美团点评技术学院院长刘江主持了题为“企业如何驾着AI起飞?”的圆桌论坛,圆桌嘉宾有代表视觉领域的旷视科技联合创始人唐文斌,代表语音领域的思必驰副总、北京研发院负责人初敏,还有第四范式联合创始人、首席架构师胡时伟,京东云副总裁刘子豪,太平人寿CIO熊明,真成投资管理合伙人李剑威,乌镇智库理事长、国家“千人计划”专家尼克。
这群业内人士怎么看人工智能行业的“泡沫”?怎么看人工智能在投资和实用方面的现状?而对三大AI明星企业的业务模式,这场圆桌也给出了最为恰当的解读:“开养鸡场”、“卖鸡蛋”、“做蛋炒饭”。
人工智能有泡沫,但未必崩盘
刘江:第一个问题我出给尼克。尼克做过很多AI宏观报道,最近还出了一本书叫《人工智能简史》,对人工智能的整个历史颇有研究。我的问题是这样的,人工智能两落三起,不少阶段你都经历过,对于这一次人工智能,你怎么判断?会不会重蹈历史覆辙?
尼克:这里大概属我岁数最大,30年前我到美国读书的时候,人工智能刚从第二次繁荣中退下来,那时候在计算机系,做系统跟做理论的互相看不起,但他们都同时看不起做人工智能的。不过现在不一样了,做系统的、做芯片的都往人工智能上靠,做理论的也开始做人工智能的问题,包括数学家在内,所有人都往这个方向钻。
可在上世纪80年代、90年代,我都不好意思说自己是学人工智能的,现在却能天天说我老师是谁谁谁。这说明整个行业起来了,我们也确实看到了很多应用场景,这在原来都是不可能发生的。里面有几个因素,数据、算法和算力,尤其是数据和算力几乎在同一个时间点到达拐点,致使原来不可能的一些场景变为可能,比如图像处理、人脸识别、自动驾驶,这些场景现在都是很实在的应用场景。
反过来说“泡沫”的问题,最近很多人都在讨论。甚至还有人在讲,某一类行业里面的同质化竞争是不是很严重?这个我只能说,就我的观察是有可能。但今天在座的都是业内专家,他们对各自的行业会有更深刻的了解。
刘江:总的观点是这一波形势还不错。
尼克:但是有泡沫,有在座的各位,这里我就不说了,可以让他们自己说说。
人工智能投资开始注重产品
刘江:第二个问题我问李剑威。李剑威是做投资的,比较喜欢投这种技术,他好几年前就开始看了。你怎么看这一波人工智能?现在你投AI还很积极很兴奋吗?从投资界角度来讲,人工智能现在是什么状态?
李剑威:从投资角度来讲,投资人接触人工智能肯定是比大众早,但是会比创业者慢上一两年。一般投资人看到标志性的事件,就知道某一个领域比较热了,大家会认为技术在某一个领域的爆发点可能来了,达到一定的渗透力,或者已经有一些现实应用了。这个时候大家就投进去。我记得最早投人工智能应该是在12年、13年吧。很多早期机构,包括工场、真格、红杉、联想之星,投的都是计算机视觉,但那时大家可能不会说这是人工智能。现在非常领先的视觉公司,像旷视、依图等相关的好几家公司都是这时候拿到了融资。
人工智能在投资界真正大热,我觉得主要是因为围棋。如果没有AlphaGo,人工智能绝对不是今天的样子。AlphaGo战胜李世石,这对投资界来讲也是标志性事件。之后,无论一级市场投资人还是二级市场投资人,大家都会花很多时间来看人工智能,认为它真的来了。我们可以看到,Nvidia股价涨了很多倍,AlphaGo赢李世石时大概30多美元,现在应该有200多美元了,上涨6倍多。初创公司就更是了,在座的有很多独角兽,之前大家觉得是技术公司,现在都是人工智能公司了。所以,在2016年和2017年,人工智能是非常非常热的。
但今年,或在2017年下半年,大家都开始觉得,人工智能的公司是不是太贵了?所以,有一些人会用审视的眼光来看了,这就是你刚才讲的是不是泡沫来了。现在,依然有同行在看人工智能,大家会觉得某些领域的估值肯定有一些泡沫。但这一次跟以前相比,有些地方其实挺不一样的——确实有很多公司找到了应用场景,而且很多公司都有着实实在在现金流,无论NLP还是语音识别领域,都可以解决一些问题了。对于投资人和一级市场的挑战,就是怎么找到那些对的公司。现在才买肯定是贵了,但你要看到企业的成长会消化掉那一点点所谓的泡沫。
总体来讲,这个领域比较活跃投资人都是非常非常乐观的,但核心前提是投到对的公司。
刘江:从李剑威的角度来讲,我觉得前几年可能看到一个AI公司就会下手,甚至投资公司互相之间还有竞争,但现在可能需要仔细看一看了。
李剑威:对。17年上半年,只要你打着人工智能的旗号拿钱都很容易。现在每个公司都会说自己是人工智能,所以大家要看产品了。
主持人自问自答:AI是美团送外卖的核心能力
刘江:第三个问题,我要问熊总和子豪,你们是用户企业,尤其是熊总。在你们看来,AI现在对你们公司的作用真的非常大吗?是帮助你们挣钱了?还是为你们降低成本了?成效是不是特别明显?有没有这样案例?
熊明:案例是有的,现在我们用智能客服却是增效降本方面有效果的。以保险行业为例,我感觉在理赔、客服、销售甚至预测模型方面,人工智能肯定是会有相当大的作用的。但是你不得不注意到这一切都依赖于数据,所以整个行业的数据壁垒还是蛮高的。
刘江:现在太平人寿在客服这块AI用的不错,起到了成效。下一步在其他方向做的事情,你是说已经在做了,但效果还没那么明显?
熊明:是的,我们正在开始做。
刘江:好,这是太平人寿的情况。那么京东的情况,请子豪说一下。
刘子豪:京东不是一个纯AI用户,因为我们有场景。所以从2017年开始,很多京东内部的人工智能能力都逐步通过京东云、其他合作伙伴赋能给行业。总体来讲,我们觉得生态一定是非常重要的一个环境。生态里面有非常多的企业,有芯片的、有上下游的、有算法的、有航空母舰型的,也有很多小的算法公司……但总体来讲,数据是人工智能现在最稀缺的资源,而在行业内拥有大量的数据的就是那几个寡头。寡头加上航空母舰,再加上一些合作伙伴,就会形成各自的生态,所以我觉得那些没有数据来源的孤立的小公司,可能很难在这一波AI过中获得实际收益。
从京东来讲,刚才刘江老师说我们是用户,其实不是。我们京东对AI的投入非常大,内部已经有很多应用也有实际场景,比如说智能补货、机器人、语音识别、NLP,我们内部都有研发人员在做。所以接下来,我们不光自己要有AI的能力,下一步还要通过合作伙伴和我们自己渠道把AI能力输出出去。
刘江:子豪说的智能补货对电商来讲特别重要。之前我在出版社干很多年,被传统的零售商害苦了——书给他以后,一年以后再退给你就不能卖了,这就赔了很多钱。在原来的图书行业,库存是癌症一样的东西,几大电商起来以后,这个问题有了很好的改善。因为电商有数据,如果人工智能能做得更靠谱,能够智能补货的话,这个行业的效率还可以再提升。
我给大家说美团点评的例子,美团点评大家接触最多的可能是外卖。其实外卖的背后,是一个很大的我们叫做“配送大脑”的AI,这是我们的核心竞争力。在外卖行业,我们跟饿了么、百度外卖竞争,用户体验最关键的是送得快。它背后的核心技术,我们称为“智能配送系统”,是清华老师带着团队干了一年多做出来的。
现在,我们的平均配送时间是28分钟。你在美团APP上下单,信息传到商家开始做,然后我们骑手过去取餐,到取完最后送给你,总的平均时间是28分钟。这背后实际上是大量很复杂的调度算法,由我们一个很强的研发团队在做。现在美团点评有500多个这样的算法工程师,就是互联网企业所有做搜索、广告、推荐、图像、语音、调度的人,现在看来都是搞AI的。其实调度这一块之所以是核心技术,是因为滴滴、摩拜等很多O2O场景都要用。这方面我们也得了大奖,因为它确实是一个核心竞争力。我们的口号是“送啥都快”,背后的保证就是他们这些算法工程师。
做算法的第四范式开“养鸡场”
刘江:这一波AI大朝里涌现出很多代表性的公司,接下来三位就是其中的代表,我们一个一个来看。胡时伟,你可以讲讲你们第四范式主要有哪些AI场景?用哪些技术解决什么问题?
胡时伟:我们2015年成立。为什么讲这个呢?因为2015年AI这个词还是跟骗子划等号的,就2016年下完围棋才有用,15年就不行。我们当时包装的是大数据,不敢说自己是AI公司。
但当时走的路不太相同,我们机遇比较好,一开始我们就做银行行业的企业服务。我们做的第一个场景完美绕过场景数据和各式各样的问题,就是用AI模型去预测你一个用户会不会办分期业务。跟我们合作的是国内最大的股份制银行,是直接线上的实时应用,让它每天的手续费收入提升60%之多。
后来的事情就没那么容易了。当时客户跟我们说,你们这样一个一个做怎么能做得过来,这么厉害的能力不如赶紧做一个平台……所以我们就想办法让企业自己解决自己的问题,而不是去解决别人能帮助他解决的问题。大概从2016年开始,我们用平台加上范式大学的能力来帮助企业构件它自己的AI能力,也就是让它自己的人用自己的数据来构建自己模型。
如果他不知道应该收集什么样数据,我们就教会他如何学习、如何收集数据、如何理解这件事情……后来沿着这个路线,我们顺理成章地跟国内最大的银行合作,建立它的基础AI能力,也就是逐步把它内部数百条业务线的研发人员全都培养成数据科学家。通过一些模式化的架构,我们把数学和统计上的细节封装起来,让他们的人利用数据认知和平台算法直接解决问题,就像石油工人在钻井平台上干活一样,他们无需了解怎么搭建钻井平台。
这是我们所做的一些事情,目前取得了不少比较成功的结果。
做语音的思必驰卖“鸡蛋”
刘江:接下来,问题交给初敏。现在语音这个行业,包括你们在做的其他事情,目前在整个行业的应用、落地和技术方面,都是一个什么样的情况?
初敏:语音概念一直在转换。早些年我上学的时候做语音,它不叫人工智能,我自己也从来不认为是人工智能,那时候我们的范畴是“信号处理”、“模式识别”。今天所谓的“AI热”,我觉得是很多概念的重组,但语音最核心的技术并没有发生本质的变化,无非就是深度学习使识别率之类的效果更好一些。事实上好多Demo 20年前都见过了,但是不能落地没有联网,就只是小样而已,今天看到的是真正可以落地的场景。
所以,我认为今天真正发生变化是外界,大家看到落地的场景很激动。特别是大家跟着媒体信息转,看到一些标杆案例觉得很神奇。但AI有没有泡沫不是看那几家标杆型公司,而是取决于我们能不能把这里的技术产业化,能不能把AI输出到那些自己不掌握AI技术的企业,让他们用起来,解决大把大把的问题。
今天大家对语音的理解范畴更大一些。传统语音是说语音识别合成,这是核心技术,本身比较难,可以由我们来搭建。今天所有提到语音的地方,其实指交互,包括识别、理解、声纹、自然语言理解和对话,还有对话背后知识的管理……这一切都需要数据。数据换了,场景换了,原来的模型就不工作了。而到一个场景就换一个模型,这个成本是非常高的。
所以说,除了核心的算法能力,今天AI技术能不能成功落地,关键是规模化生产的能力。也就是说,语音识别在我们精心打造的场景能做到97%,那么换到一个新场景,我们是不是还能很快地做到这个准确度?对话在新场景中是不是还能够持续地进行?它的本质就是我们能不能把所有这些机器学习的模型或方法规模化地移植到任何一个新的场景。这就相当于把新场景数据接进来,我们在多长时间能够使新场景中达到先前场景的效果?
可能这就是我们最终所需要的生产力,这样就有了规模化生产的可能,然后那么多有场景的企业才能够真正把它用起来,这个行业才会真正起来,这一点是我们今天特别关注的。
思必驰现在已经做到的,是优化个人在生活中、在家庭中、在汽车中、在其他场景中的体验。另一个很重要体验在企业当中,就是优化企业中每一个人。比如帮助HR的招聘助理,协助内部员工沟通的沟通助理……方方面面下来,企业中不同的角色可能需要20个、50个小机器人来为他们服务。我觉得这就是真正的规模化生产,每个场景的知识面不需要很广,关键是我们有没有办法快速构建起来,这是我们现在考虑的方向。
据说很多企业是无信息化的,或者说数据不够,那他们是不是就根本没有机会?我们的想法是用一个低成本方式让他们先用起来,感受到技术的好处,然后带动他们把技术基础建设起来。
刘江:对,初敏说的这一点很重要。我们现在要把一些很实际的场景能用起来,让它转起来,如果企业真能拿这个挣钱,真能够推动业务提升效率,那人工智能才是真的有价值的。不然不然期望太高的话,有些方面还是挺危险的。
做人脸识别的旷视送“蛋炒饭”
刘江:对于这一点,唐文斌怎么看?视觉现在是大热点,这个领域是什么样情况?我知道你们在安防这块很不错。
唐文斌:我们有一些落地的情况还很好,刚才两位聊的话题挺有意思,我想接着聊一下。
第四范式做什么事情呢?你想吃番茄炒蛋,第四范式卖的鸡,然后你喂一点饲料,过几天下蛋就可以炒了。第二种卖的是蛋,拿回去炒,炒什么什么样就是你自己水平。这是语音识别通过开放平台开放出来做开发和应用,鸡自己养着。第三种是直接吃番茄炒蛋,外卖直接送到家里,好厨子在哪就看不见了。
因为市场还在探索过程当中,这三种模式很难说谁好谁坏、谁的市场大。
我们最早从做蛋开始的,然后做蛋过程中我们非常努力在内部做了一只鸡,叫“Brain++”,用的是我们自己的训练引擎。我们发现,现在做深度学习无外乎两种类型:一种是你真的做本质性突破,发明新的网络结构,做新的东西出来,这确实需要非常聪明、极具创新意识的人来做,谁都替代不了;另一种实质是做Search,拿这个数据用算法和模型凑一凑,试一下不太行就再来一次,不断地、启发式地在做尝试,在边界之内做搜索。用搜索的方法来做AI这种方式,那AI为什么不能把你做AI这件事情也做了?这就是第四范式所做的事情。
我们通过Brain++,让AI在没有本质性的边界突破下也可以做成富士康,把东西分解开一步步搞,做成流水线。但是把流水线直接对外输出是很难的,所以我们还是先做好蛋。而不同的场景需要不同的蛋,下蛋标准不一样,炒法就很需要技巧,对“蛋”要有很深刻理解和体验,我们就发现别人真炒不好就自己炒了,所以就找来几个场景。
旷视做的是计算机视觉,最早从人脸开始,这是视觉信息最有价值的元素。但到底做什么样的番茄炒蛋最有人喜欢吃,口味最合适的场景是什么?我们一直思考,最早做的是一个蛋的平台Face++,给美图和各种娱乐类APP用,结果发现不够严肃,并没有长出什么太大的果实来。
后来人脸识别很有意思,是唯一一个拥有国家权威数据库的生物识别。于是我们就开始提供实名身份认证手段,最早是给支付宝。后来发现各种宝都需要,就通通搞了一遍,再后来给滴滴、Uber、神州、易道、e代驾等……四个轮子的共享经济很需要实名认证,万一司机在注册的时候盗用别人身份会很危险。人脸有一个很本质的场景,就是即便你不想被识别,你也拦不了我识别你,这个核心特征可用来识别坏人。所以,在公安场景下通过人脸识别对数据进行二次挖掘,可以为我们带来很多业务价值。2017年,我们给国内公安抓了大概4000多逃犯,这是蛮惊人的。
把当务之急的番茄炒蛋做好了,我们就能去找一个更好的定位。去卖鸡蛋还是去卖鸡?这是我们正在思考的。
人工智能已在颠覆银行业
刘江:讲到公共话题,我一直在想的是,技术发展上,云计算对IT格局的影响并不大,也没有哪家公司靠大数据成为巨头;但移动的颠覆性却很强,TMD都是因为移动起来的,今日头条在资讯的赛道上很猛,美团点评如果没有手机点餐就没有那么大的用户量,滴滴就更不用说了。那么,AI时代会怎么样?AI方面会诞生一个能改变整个市场格局的巨头吗?大家都怎么看?
唐文斌:我先反驳一下。我觉得云计算也好、大数据也好、AI也好,它们本质上都不是产业,是赋能工具,是帮助我们解决问题的。但最后定义你自己的,还是得说你到底解决了什么问题,带来了什么价值。
我觉得AI场景中最快涨起来的是“AI+行业”类公司,深入到一个行业中去,用AI重新定义行业。这是降维打击,用更少的成本、更好的方式来解决你原本不可能解决的问题,让整个行业的价值架构发生改变,这里是有机会的。第二类公司是当前面的“AI+行业”起来以后,会需要很多技术架构的东西,比如说芯片,比如说第四范式这样的平台,我认为也是有机会的,但会晚于“AI+行业”类的发展。
刘江:对,唐文斌强调的还是跟行业跟场景的结合。
初敏:如果一个公司最终把自己定义为技术输出公司,我觉得不会颠覆行业,也不会成为今天的BAT。如果一项技术要做成,如果做得特别难,需要用户付出很多努力才能用,那么输出这项技术的公司基本上成不了。过去也有做技术输出的企业,但是没有做到BAT这种水准的。
胡时伟:我特别赞同初老师刚才讲的,不能输出技术,最终AI的商业实现会需要一个载体,而这个载体至少应该是一个产品,这个产品能够解决什么问题呢?这就是我们通常所说的,AI能不能让人失业。如果AI真能让一部分人失业的话,那这个产品一定会催生出一个现象级的公司。我们知道,微软、苹果、思科这样企业让很多人都失业了,比如说打字员、邮递员。AI能在多大程度上颠覆一个行业的人、财、物关系,这个公司就有多大的土壤,关键就是它能够颠覆多少我们程序员之外的世界,那就有多少我们可以做的事情。
所以我特别认同蒋总说的,AI会让企业的决策过程发生变化,有可能让程序员摇身一变,从企业的成本中心、效率中心变成利润中心。毕竟你写的代码是真的可以让一个业务一夜之间提升60%,这也是我们已经做到的一个尝试。那么,原来负责这个业务的决策分析人员和其他员工就需要重新安置,安置的结果是把他们变成产品经理,给机器学习提供数据,研究怎么收集数据。我想,银行业里发生的这个事情,是值得其他行业借鉴的,至少是有一些启示。
长按下方二维码,关注“AI科技大本营”
回复“产业路线图”获取完整版告
(回复:技术路线图,获取《AI技术人才成长路线图》)