李开复清华演讲:为什么今天是人工智能的黄金时代(下)
导语
6月8日,应清华大学交叉信息研究院院长、世界著名计算机科学家姚期智院士邀请,创新工场创始人兼董事长李开复博士向清华大学的“姚班”同学做了名为《人工智能的黄金时代》的演讲。上半部分请点击:李开复清华演讲:为什么今天是人工智能的黄金时代(上)本文为本次演讲的下半部分,在这一部分,李开复博士着重探讨了人工智能的应用蓝图和深度学习的瓶颈等问题,并回答了现场同学的精彩提问。
人工智能将重塑亿万级别的领域
人工智能会重塑很多亿万级别的领域。当然这个不是明天就会发生,因为今天我们在很多相关方面仍存在相当大的欠缺。
比如,在我们的计算架构上面,现在还是需要时间去做算法的改进提升,需要去研究如何部署云端架构,另外深度学习用时仍太长,这些还都是需要探索的内容,而且并没有一个标准化的答案。
另外,算法框架也非常重要。我们可以看到有一些重要技术的推进,实际上是因为有了开源或者API或者标准的出现,但现在仍有很多方面还没有出现相关标准。当然我们知道Google的TensorFlow等提供了一些开源的方法,但是其实他们还没有真正的平台化,比如你把TensorFlow丢给一个没学过机器学习的人,哪怕是清华大学顶尖的计算机系学生,他也很难用其创造价值。如果清华的学生都不能,那它的普及性就有问题了。
为什么iOS、安卓能够做的很好,就是因为它产生了平台化效应,使得很多人能够比较容易的介入。然后我们可以看到像Hadoop这样七八年前很多人觉得很高深的东西现在也慢慢变得平台化了。今天,如何使得整个机器学习的体系平台化,以便于让更多的非专业人士能够使用,这个是目前面临的一个很大的瓶颈,需要一定的发展时间才能得以突破。
在一些领域中,很多技术性问题可以在两三年内得到解决,但是还有很多问题并非如此简单,比如说语义。我们说语音识别是相对简单的:音进来,字出去,这个非常明确,一个API就可以调动。但是音进来,确定是何种情境的语义出去就很难。这些我觉得两三年远远还不够,还需要更多的时间去理解。
传感器一定程度来说是价格的问题、如何普及的问题。现在我们看到Google Car虽然做的很牛,但是正如驭势科技的吴甘沙说的,Google Car实际商业化的一个巨大瓶颈就是价位的问题:传感器实在太贵了。因此要把这件事做下来就是一个鸡和蛋的问题——降低价格就需要量,但量怎么起来?价格不下去量也起不来。要解决这个问题也需要一定的时间。
最后还有很多机械方面的问题。控制机械运动的算法,硬件运动后给出的回馈等等在机械部门也还需要一些开发。
整体来说,虽然我认为机器学习、深度学习在突破人类的精确度方面已经做的非常好,但是以上几个领域还是需要一些时间才能取得突破。但是这一天肯定是会来临的,我们怎么知道会来临呢?
Google的野心
我们知道,不久前Google重新组织了公司架构,将搜索业务和其他前沿项目子公司都放进了控股公司Alphabet公司。很多分析师说,Google把搜索和其他的业务分开来做Alphabet,是为了优化它的股价,其实这种说法太表面了,他们没有了解一个真正有野心的公司在做什么。
一定程度上,Google之所以成立了Alphabet,是因为Google经过搜索和广告业务的积累,逐步发展了一套我们可以简称为GoogleBrain的模式。Google Brain其实就是机器学习的大脑,这个机器包括了平台也包括了专家,如果它用在搜索领域就是一个搜索引擎,如果它能够用在医学领域,那它可能就是一个癌症诊断系统,它也可以用于人类寿命的延续以及智能家电等各种不同领域。所以Google的野心就是把机器学习作为一个核心,然后用它去解决非计算机非互联网领域的各种问题。
当然它现在还不是一个整体平台,但Google 就会找一些极聪明的人来进军这些领域,有平台的用平台,平台未成形的就用聪明才智来想办法。现在看来,Google这种模式也做成了很多有意义的事情。所以,对于Google,我们千万不要低估了它的能力,因为这家公司可能是未来推动人工智能平台化的最大力量。
怎么证明这是真的呢?从最近Jeff Dean演讲的一张图我们就可以看到Google内部有多少项目在用深度学习。
我们可以看到,从2012年到今天,Google对深度学习的利用在快速增长,应用领域也极为广泛。从这张图我们就可以看到Google,也就是现在的 Alphabet在人工智能方面是多么的有野心。
再回到我原来的问题,我们现在是不是生逢其时,可以在正确的时候选择进入人工智能这个领域呢?如果我们相信Google这帮人很聪明,如果我们相信Google对深度学习的使用逻辑,我们也要相信人工智能的应用期即将来临。
深度学习的挑战
第一个问题,就是我刚刚提到的:目前仍然没有一个统一的平台。在深度学习方面,现在的人懂就是懂,不懂就是不懂。这就是为什么Google最近花了重金不断在挖业界顶尖的人才,给年轻人开出的年薪甚至超过200万美元。这些人也就是二十来岁,博士刚毕业不久,怎么会这么值钱呢?
其实就是因为两个理由,第一,这些人进入了公司之后,会被投入到健康、医疗、预防等等各个领域的研究。他们虽然每年拿走公司的两百万美金年薪,但是也许两年后他们就能在相关领域创造出两亿美金的价值,所以对Google公司而言,这些人才实际上不贵,是非常划算的。
第二个理由就是Google多雇一个,Facebook就得少雇一个。这不是开玩笑。因为在美国有三个大公司在疯狂挖人工智能的人才——Google、Facebook和Microsoft,他们之间竞争激烈,对人才的吸引力也不相上下。
第二就是深度学习的网络太大,需要海量的数据。
第三,因为数据太多,所以计算特别的慢,所以需要非常大的计算量。
第四点有点奇怪但也合理:机器无法用人的语言告知做事的动机和理由。即便机器训练做了很棒的深度学习,人脸识别、语音识别做的非常棒,但它不能和人一样,它讲不出来这是怎么做到的。虽然有人也在做这方面的研究,但是在今天,如果一个领域是不断需要告诉别人该怎么做,需要向别人去解释为什么的,那这个领域对于深度学习来讲还是比较困难的。比如Alpha Go打败李世石,你要问Alpha Go是为什么走这步棋,它是答不上来的。
即便有如此多的局限,我们还是认为人工智能在很多领域可以迅速应用,并且可以帮助企业打造竞争壁垒。
人工智能如何帮企业打造竞争壁垒?可以从如下四个方面思考:
第一,如果你有垄断性的大数据,你就会有很大的优势。关于数据需要注意的几点是,首先垄断性大数据不是公开的数据,不是剽来的数据,也不是买来的数据,因为这样的事情你能做竞争对手也能做。其次,无标签的数据也不会给你带来优势。再次,如果是人工标签的数据也不行,因为人工标签太慢了。最好的数据是闭环的数据,所谓闭环的数据就是在你应用的时候可以捕捉到数据并且知道最终你根据数据做出的抉择对或不对。我们投资的face++,它有和美图、阿里的合作,就一定程度形成了特别大的数据的优势。
第二,拥有庞大的机群。机群是很重要的,包括需要什么处理系统的支持,怎么去部署,用什么样的计算架构等等。
第三,你要有一批特别懂的人。没有平台的时候,你就只能把一批人丢进去,让他们去解决特别大的问题。
第四,当你没有平台的时候怎么办?我们就可以找一批特别聪明的人,让他们不断的调节算法——当然这构成一个短期的竞争优势,从长期看,一旦大的人工智能平台出来,这种优势就不存在了。所以现在来做人工智能,抓到这个先机是特别特别重要的。
人工智能如何快速商业化?
人工智能怎么能特别快的商业化呢?这里我要提供几个建议:
第一,不要用人工智能去取代人。
机器不一定要取代人,很多情况之下他只要能辅助人就可以了。我谈到了很多工作会消失,但医生会全部失业吗?一定不会,应该是最高明的医生创造很多机器人给他人使用。记者就不再需要了吗?写深度文章还是需要的,但简单拼拼凑凑的文字就不需要了。所以这些工具一定程度上是在辅助人而不是取代人。
第二,要聪明的找到容错的用户界面。
想想搜索引擎,搜索引擎的精确度其实是很低的,你想一想,当你去百度,Google搜索的时候,它们给出的第一条就是你要的答案的情况有多少?我估计不会超过50%,但是为什么我们都说搜索引擎聪明,不说他笨呢?第一个理由当然是因为它博学,第二个则是因为它的界面做的非常的聪明:它给用户提供很多结果,而用户只要能找到他满意的那个,就会认为搜索引擎很棒,因为没有它的话,用户可能什么也找不到。这一类的容错的界面,即便它的识别率很低,给你很多结果,让你在一定时间里得到满足,其实还是达到了一定的可用度。
第三,让用户提供自然的大数据。
当Siri推出的时候很多人都说“这就是个玩具而已”,认为它没有真实的用处,但是苹果靠Siri收集了很多人的真实语音,收集了大量数据。
很多人把Siri当成一个搞笑工具,会问它诸如“你是男是女”这种无聊问题,苹果就把这些无聊的问题深度分析了一下,去了解人们最常问的都是什么问题,然后他们就考虑能不能优化Siri,让它对正常问题的解答能让人们在一定程度上得到满足。人们满足了以后,就会继续的问,如此问题越问越多,苹果也就可以得到更多的数据。
苹果的这种数据收集方法非常聪明,值得借鉴。我们以前在学语音对话的时候,问的都是非常正经的问题,到最后分析来分析去,不过是那固定的几万句,一直没有跳出这个框框,得到的结果也就不会让人满意。但用一种有趣的方式,你就可以像草船借箭一样,去“借”到几亿个数据。这些数据哪怕不精确也无妨,因为整体来说深度学习非常聪明,能把那些不精确不精准的东西忽略掉。
第四,关注局限领域。
Google很伟大,它要做全天候全路况的无人驾驶,它想把全部竞争对手都击败,最后就剩一个Google。这个计划很宏伟,但是是不是一定要这么做呢?我觉得不见得。其实我们完全可以先做一个用于局限领域的无人车,把这样的一个产品先做起来,然后我们通过它获取数据,学习教训,不断改进。
想想无人驾驶叉车。这个叉车是产生价值的,因为它取代了一个叉车工人去开叉车;它技术难度相对低,因为它只要知道从A走到B;它不上路,不用担心政府的法律法规,不需要考虑撞到人怎么办,是不是要停下。
Google Car能在高速公路上比99%以上的人都开的更好,但是它碰到一些极端的情况,比如大风大雨的漆黑天,它就没辙了,因为它不知道该怎么办,从来没看到过这种情况。这种情况下只有把车子停下来,但那一停会发生什么呢?当然就追尾了。
既然这种情况连Google也避免不了,为什么我们不先考虑做一些可控环境下的商业驾驶项目?这也是一个值得思考的问题,不是说Google的路线不对,而是说有两种路线可以走。
总结:人工智能的未来蓝图
(图:人工智能的未来蓝图)
上图是我认为的人工智能的未来蓝图,这是我们创新工场现在对这一领域的理解,以及可能会发生的顺序。
大数据应用方面,现阶段我们已经看到很多互联网应用,BI、商业自动化马上也会使用相关的技术,未来几年,离钱最近、产生用户最多、产生价值最大的领域可能就是金融、医疗、教育,当然也包括任何有大数据的行业。
在感知方面,今天的人脸识别、语音识别已经做的蛮好。对于VR/AR,我们在短期还不是太乐观,但是随着它三五年以后慢慢得到普及,一定需要非常多的新的自然语言的界面。此外,我们大胆预测三到五年之内会有一个人工智能平台出现。
我们并不认可家庭机器人会很快出现,理由是消费者的期望值是最高的,今天机器人的技术还不行,犯错也太多,而且有时候会看起来太傻,另外价格也太贵,感应器不够灵敏。基于这些理由,我们对家用机器人的投资还只限于一些给小朋友的玩具,或者小鱼在家这种用于沟通的工具,这一类的家庭应用我觉得还是合理的,但要一个能够在家里帮你扫地做菜的机器人出现,恐怕还是一个非常长期的事情。任何行业都要有经济理由来投资这个领域,不断迭代优化它的技术,再进入下一个阶段,所以机器人简单来说应该是工业、商业,最后普及到家庭,所以今天很多对家庭机器人过火的观点和做法我们是不认可的。
关于无人驾驶,我们的观点是虽然Google Car很伟大,但是因为它要去适应各种路况,所以要到应用阶段也还需要很长的时间。我们认为可以先在局限环境中慢慢推进无人驾驶。
从长期看,未来人工智能会在所有的领域彻底改变人类,产生更多的价值,取代更多人的工作,也会让很多现在重复性的工作被取代,然后让人去做人真正应该去做的事情。短期来说,人工智能商业价值也很大,短期在很多领域都能产生价值。
(图:清华“姚班”同学在提问)
问题一:刚才听到了人工智能的介绍,真的认为人工智能给我们带来了很多的便捷,的确是快要步入到一个黄金时代,很多人可以从劳动密集型的工作中解放出来。我的问题是,如果很多事儿都可以交给机器来完成,那么剩余的劳动力是否会催生另一个黄金产业,比如服务业等等?
李开复:这个问题很好,我曾经写过一篇文章《如果十年之后有一半的人失业了,下面该发生什么》,讲过这个问题。悲观的预测是,因为现在的95后,00后大部分成长在虚拟世界里,现实世界只是他们一个小小的补充,所以他们可能深陷其中而不能自拔了。反正人工智能让他们失业,也找不到工作,同时政府也可以养着他们,他们不需要工作,那么干脆每天带着虚拟眼镜起来就玩游戏,不思进取就好了。这个是我特别担心的,也是可能发生的。
乐观的是上天让我们来到这个世界,本来就不是让我们来做中介、助理这类劳力的工作,我们被生为有感知,有大脑,应该是有更高的目标。那么,是不是上天让人工智能来到我们面前,就是让一批有思考能力的人帮人类找到一条新的出路,让我们每个人能够找到自己的更高目标,让一半失业的人找到他们的归宿,有自我实现的机会呢?
我对年轻人的建议是做最有热情的事情,要不然机器肯定取代你,要做就要做顶尖最棒最有创意的事情,要不然你肯定会被取代。
问题二:您讲了很多前景中的事情,我们都觉得美好,但是在实现前景的道路上,最大的几个技术瓶颈在哪里?在解决瓶颈的过程中,您看到的大公司解决这些瓶颈的方案是什么?
李开复:最大的瓶颈就是人工智能的平台。平台化会带来井喷的效应,但这个平台是什么我今天也无法描述。你可以看到iOS的平台,安卓的平台等等,每一次都造成了井喷式的效应,所以平台化是必然的也是必须的。对于无人驾驶和机器人方面,主要是感应器的价格等问题,一旦问题解决,这些领域也会发生井喷效应。这些都需要聪明的大脑试着去解决。
问题三:第一个问题,您刚才提到人工智能的黄金时代到来了,那么您能举一个到三个导致这种黄金时代到来的创新明星吗?第二个问题,当人工智能呼啸而来的时候,大家很快意识到人工智能第一个急需解决的问题是人,如果人类把持不住,可能人的时代就过去了。
李开复:今天有四位CEO,分别代表了芯片领域、金融领域、视觉识别领域和无人驾驶领域,这四个公司虽然目前领域不同,但在到达下一个阶段后,一定会做平台,一定要扩张。任何一个领域都是先做一个切入的应用,做好了之后再扩大,变成一个平台,最终获利最多的就是那些有上下平台连接的公司。
关于你的第二个问题,即人类将面临的下一个挑战问题,不是机器人占领了世界,我们被机器统治这样的问题。虽然我不排除这些事情发生的可能性,但是我呼吁大家先要应对一个现实问题——下一阶段50%的人可能失业的问题。这可能是一个最大的问题,毕竟在过去的工业时代也好,信息时代也好,失业率从来没有这么高过,今天的政治经济体系也不能承担这么高的失业率。所以我觉得聪明的人应该赶快解决这个问题,这个问题可能十年后就要到来了,当这个问题解决完了之后,我们再去想下一个问题。
问题四:您讲到的人工智能在各个领域都会以极快的速度超过人的领域,但是它是不是只在某些领域做的更好,在某些人类没有开拓的领域,它有没有自我开拓的能力,根据已有的领域和问题,开拓新的领域?“奇点”真的出现,是不是就说明人工智能有跨领域思考学习的能力?
李开复:从过去已经发生的事情来看,还不存在人工智能的自我开创,未来有没有可能,这其实是一个蛮有意思的话题。我想即便是一些人类未曾进入的领域,只要你能把它量化,变成一个input/output,我觉得机器还是可以学成的。但是我也相信大部分人类的伟大创意都不是那么容易量化的。
第二个关于奇点的问题,回到刚才讲的,机器学习并不知道它自己在干什么,它只是一个非常聪明的input/output而已。另外它没有自我意识。科幻小说和现实生活很大的差别是因为科幻小说里面的机器都有自我意识,所以我觉得,由于机器的自我意识和自我创造力,还有自我解释的行动能力,这三者都不存在,奇点来临也就不是那么容易的事情。我相信在未来的一百年,这三点都有可能被克服,也会给人类带来机会和灾难,但是我们现在真正面临的问题还是50%的人可能失业的问题。