李开复:人工智能的市场价值将超过整个互联网世界
【按】:12月18日,在北京供销大数据集团发展周年举行的“加快大数据中心一体化进程•2017北京峰会”上,创新工场创始人兼首席执行官李开复发表主题演讲,就人工智能与大数据结合的形成的一体化平台潜在的商机发表主题演讲。在演讲中,他谈到了多年前从事人工智能研究工作存在的先天不足,对比了人工智能与人类大脑各自在的优劣势,谈到了人工智能领域潜在的极大商业价值以及创新工场在该领域的一些举措。
创新工场创始人兼首席执行官李开复。
以下文字根据李开复现场演讲内容整理(未经本人审定)。
“大数据”这个词热了十年,“人工智能”这个词热了也超过了一年。
回顾近两年的发展,我们会发现在很多领域机器其实都超过了人类。前一阵微软发表了语音识别技术,我们也投资了其他一些人脸识别技术,这些技术早已经超过了人类识别的能力,所以机器一次又一次地超过了人类。这代表什么样的商机呢?是人类历史以来最大的商机。
十年后,如果我们回顾人类的发展,会发现没有任何市场比人工智能来得更大;移动互联网已经巨大,但它连人工智能的十分之一都没有,这一点我可以确切地告诉大家。
我从30年前就开始探讨索人工智能,但是没有天时地利人和——机器不够快,大数据中心不存在,数据不够多,算法不够先进……30年来,不断有科学家发明新的技术,从最近四五年开始,这项技术在很多独特领域远超人类。
虽然人工智能还有很多局限,如,没有情感,一次只能涉足一个领域,不能跨领域思维,但是在狭窄领域里已经远远超过了人类。
如何用一个更通俗的方法解释什么是人工智能?想象一台机器是刚出生的小宝宝,人类的小宝宝是用教育、用知识、用书本让他们慢慢成长,但人工智能用什么来帮助他们成长呢?就是大数据。大量的大数据灌进去,他们成长就比人快。
但是机器一次只能专注在某一个领域,你要教它旅游、搜索、识别、听语言、看文字、看人脸,在单一领域它可以做得非常好,但是跨领域做不到,所以人类还是有机会的。美国科学家发明的深度学习在中国已经普遍开始使用,就是这个道理。
灌输大量大数据可以帮助机器成长。姑且认为人的大脑还是比机器优秀,因为我们可以统筹各种知识和各种经验,但是机器有一个特别大的优势,即“过目不忘”,不仅可以储存特别大量的数据,而且能够从数据中学会推理。如果它能够看到的数据比我们多一千倍,哪怕我们比它聪明10倍,最后的结果是它还会比我们好100倍。
以无人驾驶为例,一个人,即便一天开100公里,一年365天地开,三五十年累积起来可能也就几百万公里的经验,但是算来,今天特斯拉已经有20亿公里数据,比我们多了1000倍,而且算法还在不断演进,它还在收集数据,还没有真实学会。即便我们现在比它聪明10倍,它也超过了人类。
人一辈子可能看几十万张脸,但记不住几张。我们投资的一家做人脸识别的公司,训练的是50亿张人脸,比我们多看了1000倍,我们要用一辈子时间,它可能是只用三天时间就记住了。所以现在保安这一类用人脸来做的工作根本比不上人工智能。
大数据的海量在各个狭窄的领域远远击败人类所能够做的极限,因为我们没有无限的时间,我们读一本书的速度是很慢的,而IBM人工智能参加电视比赛的时候,一天就能够把全部美国国会图书馆的所有藏书读完。
大数据正在各个领域帮助人类创造价值。今天人们都在做大数据的人工智能,如百度的一条搜索,今日头条的排序,淘宝推荐的每个产品,滴滴每次对接司机……背后都是人工智能;结合大数据的人工智能,可以广泛应用于传统领域,比如银行、保险、券商、机器人炒股。我个人的投资已经两年没有给人,都是机器人帮我理财,但回报一定比人要好,这些领域人类根本不是对手。
在一个狭窄大数据领域,人类永远不会有任何机会胜过机器。
在医疗、教育等其他传统领域都有大量数据,有超过人一生能看到的数据,机器算法、人工智能可能几天之后就能比人做得更好,产生的商业价值是不可想象的,绝对超过移动互联网,超过整个互联网,超过人类所有的历史累积。
创新工场不只是在做预测。我们所管理的基金投资孵化的项目,超过一半是针对这个领域的,我们是真金白银在赌即将来临的人工智能时代。
这个时代即将来临,我们能做什么事情呢?
首先是建立好一体化大数据中心。这个事情最重要。为什么呢?所有应用需要的数据不是一个公司能够收集的,是背后巨大的数据。这个数据中心必须一体化,因为除了应用里面的数据之外,用户填的数据,外面还要抓取各种数据。
我们还希望收集在一体化数据中心里的数据能得到很好的保护,具有安全性,从而能够探索将这些数据变成服务,帮助创业公司创造价值。
比如说要做一个贷款的APP,不能只是依靠用户填写的几样数据就决定贷不贷,背后还要有整个征信数据,包括出行数据、消费数据等等,它可能提交一个要求,让背后大数据人工智能判断这个人还款概率是多少,欺诈概率是多少,有否犯罪记录,贷款给他坏账概率是多少,这些都可以算清楚,而且并不需要暴露用户隐私数据。
对于大数据一体化来说,整合各个方面的数据是非常重要的。现在BAT三家公司都已经一体化了,可以想象在阿里内部,他们要来决定一个人的支付宝有没有欺诈,或者这个人想买东西就推给他什么,这肯定是用上了集团所有数据。如果能做到更跨领域甚至国家级别的一体化,机会一定是更重大的。
第二是数据量需要非常多。数据收集是一个逐渐的过程。有些数据可能不能公开,有些公司数据可能需要保护隐私,但是可以用API做一个接口,不泄露数据。还有一些数据可能是要特别保护隐私,比如医院诊断的个人数据,可以帮助更多人更健康,更早地提醒患者或者是诊断出一些问题,可以产生很大价值。
这些数据怎样整合起来?首先要有一个一体化数据中心。
谷歌成立了一家公司,旗下有100万台数据库服务器,是世界上最大的一体化数据中心,它把所有数据加以利用,用在搜索就是谷歌,用在诊断就是谷歌健康,用在汽车就是无人驾驶……背后都是人工智能加上一体化大数据。
所有这些我们都要尝试去做。虽然谷歌远远领先,BAT也做得不错,但是我们还要提供给更多公司有这样的数据资源。
三是计算资源。这对创业公司来说特别重要。APP时代,我们常说中国创业成本达到历史新低,三个小朋友写一些程序放到app商店就可以推出去了,几十万、一百万元就可以创业了。很不幸,人工智能加大数据,创业成本达到历史新高,我们投资的一家公司,七个小朋友,没有人超过三十岁,他们成立的第一天,就把我们打的款花完了,还只是买了一些机器,因为做的是无人驾驶。但我们不可能让成千上万的双创项目都买机器。要把这些机器放在数据中心里,将CPU和GPU的功能很好结合,谈个更好的采购价钱,不同的时段按照使用收费,这个也是未来大数据能够提供的很大的潜在机会。
四是要培训大量人才。人工智能听起来非常高深,但是培养一个人工智能工程师,需要多久呢?这么高深的技术也许至少要十年、二十年?做网络安全的都是要有十五、二十年的工龄,做计算机网络和其他的领域都要读博士再做十年工作吧?实际上 ,一个优秀的理工学生半年就可以成为AI工程师。应该做一个更大的平台培训年轻人,这个过程中还要有一体化的大数据平台,不可能让每个大学买几百万、上千万的设备。
总而言之,人工智能加上大数据时代,我们需要做什么事情?一是需要让这些机器能够集合起来,实现一体化;二是把数据收起来,无论是公开的、授权的、消费的或者隐藏的、使用的;三是培养下一代,吸引海外顶尖的人回来带着这些小朋友,让他们能够学习、成长。
创新工场看到了这些机会,正在策划成立一个产业联盟,在和相关部委沟通。这些事情要促成,一定是在北京,因为北京有中国最优秀的大脑,最领先的人工智能技术,北京也是创业的首府。我们非常希望把这个联盟建立起来。在计算方面,数据中心方面,和北京供销大数据集团合作,在购买大数据方面政府能提供多少,业界能买多少,能够授权多少,我们希望也能统筹大数据这件事。在吸引海外顶尖人才和培养中国年轻优秀小伙伴方面,我们也会准备一个完整的计划。
这几件事情里特别核心的一件就是大数据中心和人工智能算法的整合。
今天我们也非常高兴能够和北京供销大数据集团宣布一项合作,也希望得到各位的支持。
让我们一起来引领人工智能和大数据时代的来临。
(请长按二维码以关注公众号)