谷歌无人车之父Sebastian Thrun:摄像头才是无人驾驶最好的方式
来源:优达学城、新智元(AI_era)
【导读】上周,Udacity(优达学城)创始人、斯坦福终身教授、Google X 实验室创始人、被誉为“谷歌无人车之父的”Sebastian Thrun,在腾讯学院发表演讲《人工智能:离觉醒还有多远?》分享了他对AI发展和无人车前景的见解。Thrun认为,无人驾驶的最终胜利者可能是一家传统车企,此外,现在全世界都在用雷达做无人驾驶,实际上摄像头是最好的方式。Thrun介绍了Udacity的学生做的一个程序,只使用摄像头,3个月的时间,做到了谷歌用了很多年才做到的事情,“我觉得我们可以改变无人驾驶车的未来”。
Sebastian Thrun:谢谢主办方邀请我到这里,非常感谢腾讯以及腾讯大学为我们搭建了一个如此好的平台。我可以看到大家的T恤上写着“如果你不学习就代表你不合群”,我特别喜欢这件衣服。
在座的都是特别有才华的人,我们在这里不仅是为了怎么做好一件产品,这个世界是在向前发展的,我们要携手前行。
我今天作为Udacity的创始人的角色来跟大家分享,但是我今天更多想分享的是AI,我想在接下来的一段时间跟大家谈一下关于AI的一些细节,如果大家有任何问题也可以随时问我。
如果大家去看最近的一些新闻,可能大家可以看到最经典的一个议题就是AI,特别是机器的深度学习,Udacity和腾讯正式签约,在这方面深化合作,开展一些课程跟大家学习。
AI并不是什么新鲜的东西,在上世纪50年代美国就有这个概念,在过去的60年没有很多人特别在乎他,也就是在过去两到三年,AI突然受到大家的关注。我们说AI,最重要的一点就是机器开始学习了,电脑可以开始自行学习可能是一个比较新鲜的事情,它是怎么样开始的?
如果大家像我一样是做软件工程的,可能大家是在研究怎么解码,怎么写代码,可能会用很多的时间写下非常复杂的一些代码,然后希望把工作做得更好。作为软件工程师,我们需要花大量的时间了解这里面是否有一些bug,然后你的电脑能不能进一步做它应该做的事情。所以准确率要求非常高,这也是为什么我们的工资相对是比较高的,因为一旦代码做不好,电脑没办法使用。在座的诸位和我天天都在研究这些东西,一长串的代码,每一个细节都要求是准确的。大家写代码的能力可能很快会被取代。
接下来我们是要教电脑怎么学习,让电脑知道什么是狗,什么是猫,告诉它有100万只狗、100万只猫,它要了解怎么区分猫与狗。我们可以通过给它们看图片来区分猫和狗的差异,这样使它更像人。小时候你的父母会教你学很多东西,当时你并没有办法从父母那里学到各种各样的规则,世界充满了可能性,需要小孩子去尝试,小孩子会跌倒,在跌倒过程中不断地学习经验,现在我们处在一个新的时代,这个时代中计算机可以发现规律、发现模式,这样它们就可以越来越聪明。
大家看这幅图片,这是神经网络,神经网络在很多方面和人脑类似,左边是一些图片,这些图片非常小,可能看不清,有一层又一层的神经元,神经元可以来处理图片或者是图像,从这些图像中可以识别出人的表情,有一些人有胡子,有些人在大笑,这就是我们的大脑分析信息的方式。我们的DNA非常少,通过一点点DNA可以定义我们是谁,在DNA中有重要的信息来帮助我们识别出各种差异的特征,小孩子从牙牙学语,到后来掌握了语言,在这个过程中他们不停地吸收新的信息、新的语言,逐步地适应,我们也要让神经网络这样发展。
1995年我做我的博士论文的时候,还没有人研究这样的网络,当时计算机的计算能力非常弱,数据集也非常小,我当时用了很少的图片来训练网络——现在你可以用5亿张图片来训练你的网络,但是在当时我的信息和资源非常有限。大家看这些图片,左边是老鼠的大脑,右边是人的大脑,一个小的网络学不了多少东西,就像老鼠的大脑,它比人的大脑小很多,1995年的时候,计算机的能力很弱,没法学到很多的东西,现在计算机非常强大了,可以学到更多的东西,可以分析更多的信息,在未来可能更加疯狂。
我们来看一些例子。我最喜欢的一个例子来自谷歌 DeepMind。我在上学的时候,国际象棋对AI来说是非常难的,在我上高中的时候,也就是上世纪80年代的时候,AI没法打败人类的国际象棋冠军,1997年IBM做出了深蓝,打败了当时的国际象棋世界冠军,这个新闻在当时是非常有轰动性的。后来人们转向了围棋,围棋更复杂,在围棋中变化的可能性比宇宙里的原子还多,人们以为计算机不可能在下围棋时打败人类。2016年,深度学习的系统打败了人类选手。不过,需要指出,现在我们要设计规则给机器还是很难的,要给机器提供无数的数据帮它们去学习。同时,人类可以同时玩很多种游戏,而AI现在是专用的,围棋的AI就只能下围棋。
再看另外一个例子,在医疗方面也可以用AI,医疗是一个非常专业的领域,要当医生,就要花很多的时间培训,学习很多知识,每一名医生都是一个专家,即使在医学中某一个分支要做得很好,也需要很多年的学习。医疗领域技术要求最高的是皮肤病领域,皮肤病领域的专家的薪酬特别高,他们会研究人的皮肤的每一个状况,黑色素瘤以及其它的皮肤癌症都可能带来严重的生命威胁。这里面需要做出很多的决定,这些皮肤病专家要做出人命关天的决定,在美国,这样的医生一年的薪水可达40万美元,他们赚钱非常多,通常比一些CEO的工资都高。但是,这些皮肤病医生每天的工作很无聊,要用放大镜来看人们皮肤上的斑纹,这不是我想做的工作。
零级的黑色素瘤是没有什么伤害的,到了四级的时候就非常严重了,可能会扩散到其它的器官中,只需要8到10个月就可以扩散到全身,这时候你的状况非常糟糕,四级的黑色素瘤可能会危及到生命。在斯坦福我们和一些学生讨论,我们用AI来试图打败人类的皮肤病专家,我的学生发现了一些规律,他们找到了很多的图片,总共找了13万幅皮肤病的图片,这些图片后来都拿来做计算机训练,这些实际上是一些切片的图片,切片就是用来判断人是不是有癌症的,实际上这些图片非常难分类。
这里前5幅是良性的,不会威胁生命,下面这些是恶性的,如果不治疗的话,会出人命。这些图片就可以用来训练我们的计算机系统。要进行分类实际上有很多困难,哪些图片代表恶性的,哪些图片代表良性的,这就是皮肤病专家专业知识的价值所在。大家看这些边界,这些边界是模糊的,但是模糊的边界也有不同的特征,在不同的边界状况下,我们可以做出不同的诊断,判断出是不是会威胁到生命。
我们训练一个神经网络,你可以接触到关于皮肤病或者皮肤癌症的各种各样的信息,你可以拿到很多的信息,这些信息可能并不是相关的,在这幅图上,或许你可以找到所有的皮肤癌症,但是特异性如果是0,意味着特异性不足,这种情况下就不会造成皮肤癌。如果超过某个边界之后,你会发现更多的皮肤癌症,而有时候在这里你会发现一些误判,这些状况并不是皮肤癌症。有时候我们会有一些说法,A类和B类的误差,或者是敏感程度的误差,实际上有一系列的答案,在这些答案里面我们要判断,有不同的程度。我们看这个曲线,如果你看到门限在这儿,你会发现有20%的是误判,也就是把皮肤癌判断成非皮肤癌。
我们在研究中做了这样的分析,我们按照理想的状况,希望用它来检测皮肤癌应该在最右上角这个地方是最好的,在这里我们可以找到所有的皮肤癌的状况,如果是这样的对角线的状况,效果就会差很多,会成比例的下降。对角线的状况下就会丢失掉很多的正确信息,我们希望能在右上角。当时我想我们是不是可以写一篇非常好的论文,我作为核心作者。
如果你理解我刚才说的特异性和敏感度,这里的算法实际上是需要改进的,这里的假阳性可以大幅的减少,如果算法在右边,我可以将假阳性的比例降低4倍。我们希望大幅降低假阳性,这样才可以拿到好的结果,如果假阳性太高,这个系统是不好用的。我们做了一些测试,来看看结果是怎么样的,我们发现有些特别好,有些非常糟糕,然后有一个平均值在中间。
我们做的是黑色素瘤的研究,黑色素瘤非常危险,大家不希望它出现在左边这个状况,在这种 41 33095 41 13557 0 0 7751 0 0:00:04 0:00:01 0:00:03 7751态下有8%左右的误差,这是哈佛、耶鲁这个等级的皮肤病专家的表现,大家都希望这样的专家给你看病,人工智能可以实现这样的水平。
“现在全世界都在用雷达做无人驾驶,实际上摄像头是最好的方式”
我们再看无人驾驶方面的内容,我们Udacity提供的一些纳米学位的课程里面也会涉及到无人驾驶汽车的内容。
在Udacity我们为人们编织美好的梦想,我们提供的课程是非常全面的,我们会培养无人驾驶汽车工程师,我们与很多车商有合作,我们为他们直接培养人才。我们培养了很多无人驾驶汽车工程师,提供的工程师数量比所有大学培养的数量都要多。
这是用深度学习来做的一个结果,其实跟谷歌做的有点相似,这个是用了一个摄像机,看看在哪里走,谷歌一般是用雷达系统。测试时,如果结果不是很好的话,我们就会用上更多的数据,获得更多的细节。之前我在谷歌压根做不了这个事情,但是作为Udacity的学生,有很多聪明的学生,我给他们一个挑战,就是让他们只是拿一个很便宜的摄像头安装在车上,让这个车开在照明不太均匀的地方。
这是我们获取的结果,这些数据对我来说,我看到都觉得很难,我们给了学生大概48个小时,看谁可以获得一个最好的表现。我们可以看到这个方向盘,只连接了一个摄像头就可以驾驶,这种无人驾驶的车,在中国可能百度会做相关的研究,可能腾讯也在做相关的软件。现在大家都在用雷达系统做无人驾驶汽车,其实用摄像头是最好的方式,这样的成本是最低的,而且因为人开车是用眼睛看的,所以这样也更接近现实。我们给学生提出挑战,你能不能只用一个摄像头来实现无人驾驶,这是我们的学生交的一个作业。
我从2003年就开始做无人驾驶汽车了,我从来没有见过用一个摄像头可以实现这么多功能,它可以把每个细节都进行分类,把这个东西放在无人驾驶汽车上面,让它自动驾驶,它的成本并不高,而这只是一个开头,这也是我们很多很厉害的学生把他们的结果发到Udacity上,使我非常震惊。
大概我们做了三个月的测试之后,有一个团队做的无人驾驶车,在旧金山的上下班高峰期,用无人驾驶的车开过了繁华的道路,经过了100多个红绿灯路口。Udacity的学生做的这个程序,3个月的时间,他们做到了谷歌用了很多年才做到的事情,而我们只是用一个摄像头就能搞定。
所以,我觉得我们可以改变无人驾驶车的未来。
作为AI很重要的一点,它并没有被所有人所了解,AI可以做很多人类需要做的事情,基本上每一个人类需要重复做的事情,AI都可以帮助人类去做,如果你是一个医生,你说AI跟我没关系,肯定是售货员会被取代,但是我可以告诉大家,刚刚展示出来的一个医疗系统的AI,对于一个有12年的经验的医生来说,只要他做的工作有一定的重复性,我就可以找到一个系统来超越他。所以这样一个革命有可能比重要革命更重要,它可以把人类的工作方式进一步变革。
接下来可能是谁会被取代?可能出租车司机会被取代,因为无人驾驶汽车会改变美国10%的交通系统。还有货柜车的司机,飞行员也有可能被取代,有些时候在恶劣的天气下,可能无人驾驶的程序驾驶飞机比人员驾驶更稳定。还有医生、律师也有可能被取代,现在已经有AI系统用来做一个合同,这些已经可以取代律师做的工作。还有会计、信息搜索员、工程师,像在座的诸位,您的工作是否有重复性,有没有可能被AI所学习?还有CEO会被取代吗?我的工作是不是有一定的重复性?可能我不会被取代,然而我还是期待,有一天AI可以取代CEO 90%的工作,如果它能取代我90%的工作,我可能会更要效率地管理企业,赚更多的钱。
重点是,重复性的工作真的很无趣,很多时候我们会通过不停地做重复工作让自己的能力越来越差,因为人类希望可以得到更好的东西,我们希望可以创造更好的事情,很多时候在做重复性工作做多了之后,你的创新能力就会下降。大家可以想想,当年你们是在不停地农耕,现在我们在做什么?我们的创意比老一辈要多多少,为什么这种创意要停止呢?
想到AI我就非常兴奋,因为这是目前最重要的事情,它对我们会有很大的影响,我是特别乐观的人,我不觉得做重复性的工作一定很烂,但是你也可以有创新,现在我们的供水系统、汽车、飞机,在座诸位的手机,以及我们的社交软件,在150年内我们就创造出所有的这些东西,所以我们想想,我们可以有多大的几率再弄更多的东西?为什么我们还没解决癌症的问题,为什么我们还没创造出一个会飞行的汽车?可能过几年就会有,我们真的要从重复性的工作当中解放自己的天性,解放自己的创意,利用AI来帮助我们。
非常感谢大家的聆听。
无人驾驶的最终胜利者可能是一家传统车企
以下部分节选自Q&A环节的整理。
提问:您说蒸汽机代替了人的体力劳动,AI会替代我们的脑力劳动,如果AI真的开始的话,下一个革命是什么?
Sebastian Thrun:一两百年前我们让人变得更强大,我们可以做更多的农耕工作,我们就可以做更多有意思的事情,可以读书、可以写作,今天我们还可以有更多的时间做办公室的工作,如果有AI来帮我们,我们就会有更多的时间,我们可以用这些时间再去做别的创新。AI能处理的下一个问题是什么我并不知道,可能要等20年之后我们再来聊。AI可以改变社会、改变人类,之前没有这样的情况发生,未来很难想象。
提问:什么样的公司可能会在无人驾驶这个领域做得非常好?是一些传统的车商,比如宝马、比亚迪,还是网络公司,比如说腾讯、百度这类的公司。无人驾驶领域,哪种公司会取得胜利?
Sebastian Thrun:这个问题问得非常好,你说哪个公司最终会取得这场竞争的胜利,究竟是宝马还是比亚迪,或者是腾讯、谷歌这类公司,现在我很难预测谁会胜利,我的想法是基于美国的状况得出的,中国的状况可能有所不同。
有件事情出乎我的意料,在汽车方面的创新并不是OEM车商来引领的,并不是宝马、比亚迪这样的公司,他们有很多的专业知识,他们的商业模式也很好。百度、Uber、滴滴、腾讯等等这样的强大的技术公司也在赶上,但是这并不意味着腾讯一定可以从无人驾驶汽车中赚取很多的利润,其它公司也在一起做,最终可能赚不了太多钱。
对我来说,胜利者可能会是一家传统车商。你看看交通方面的经济细节,在美国你买一辆车,一英里的成本大概是60美分,如果打车是2.5美元,如果坐Uber是1.5美元,滴滴大概是1美元,Uber和滴滴比打车的成本低很多,这些出行的模式会降低很多成本,比出租车的成本更低。在城市里面你到底是自己买车,交停车费,还是去乘坐无人驾驶汽车,这些车可以将你带到你想去的地方,这些车的大小也可能根据需求不同而不同,有可以坐很多人的车,也可以有只坐两个人的车,交通系统会发生很大的改变,人们会有很多创意的方案,拼车会有非常大的潜力。
在无人驾驶领域,我觉得腾讯或者百度并不一定能赚取很多的利益,大家看看谷歌赚了多少钱?你用过去的思维看未来,这是比较危险的,腾讯不应该只关注在这个领域,我们可以关注一下家庭计算领域,比如说亚马逊在这方面已经做得非常好了,我们需要为这些领域带来新的解决方案,我们不应该仅仅考虑过去的状况,人们不一定总是买车,但是人们买房也是很常见的现象,我们应该更注重人们在家里的各种技术需求,人们希望有能力四处移动,这时候我们要提供非常好的交通移动解决方案。我们再看微信,这是一个很好的例子,微信上有很多的服务就是很好的整合。
OEM车商如果和我交流,他们可能也不相信我说的这些话,大家的观点都各不相同,这是非常好的现象,我们可以讨论。
提问:在未来AI是不是可能发展到机器有自己情感的程度?
Sebastian Thrun:这个问题很有意思,人们总是问我,为什么不让机器人有感情或者说情感?举个例子,你家有洗碗机,它实际上是机器人,可以帮你洗碗,我非常喜欢这种机器,你进到你的厨房里,洗碗机可能说,“我爱上冰箱了,你对我不好,我不想和你在一起”。我故意说这样一个笑话,如果机器有情感,就可能有这样的现象出现。
这样的机器是对于人类生活的补充,如果我的车有情感,我要对它非常好,否则我会出现生命危险,这是非常不好的。实际上在人类设计AI的时候,我们并不希望它们有情感,因为这样是非常危险的。这件事情我们一直在思考,成功的技术总是会给我们带来帮助,而不是来威胁和取代我们。如果微信变得像人一样,或者说有非常丰富的情感,那你可能会非常恐惧。如果车有情感,它是不是可以想跑多快就跑多快呢,就像有腿一样。如果我造的一辆车就像我一样有两条腿,也有情感,这样的车对我们有什么意义呢?我想重复一点,这些技术、这些系统对我们的生活、对我们的社会、对我们的世界是一种补充,我们不希望它们有情感。
提问:我想问您一个关于机器人的问题,您怎么看待机器人的未来?
Sebastian Thrun:机器人是一个很有意思的事情,基本上过去20年一直存在,美国的很多大学特别热爱机器人,如果你是一个机器人公司,可以来找我们,我们想想要解决的事情,然后找最好的解决方案,最重要的是要做一个好的应用。在机器人领域,无人驾驶汽车就是机器人的一种,我看了很多比较基础的项目,像家庭的应用,以及亚马逊这样的大型的机构都会用到机器人,机器人会应用到很多的领域和功能当中,这是可以改变社会或者改变工作规则的,所以对于机器人的未来我们还是非常乐观的。
提问:您刚才说AI是可以帮助我们做很多重复性工作的,作为非重复性工作,现在在谷歌是否有相关的AI的研究?
Sebastian Thrun:AI做重复性的工作是做得非常好的,可能我说的也不对,但是目前AI还没有看到可以做非重复性工作的可能,以后可能会有新的发展,但是暂时AI还打破不了这样的瓶颈,就是做不重复的东西。
提问:现在谷歌是否有用AI来解决一些环保的问题?环境保护是否可能成为一种指数或者指标来判断技术的好坏?
Sebastian Thrun:环境保护其实不是AI要解决的问题,它是一个社会问题,可能没有任何科技可以帮我们解决。在环境污染的情况下,可能有人会付出很多代价,但是也有人获益,所以环保是一个社会问题,它不完全是一个科技问题,如果让破坏环境的人付出他应有的代价,这样才能改善环境。哪怕谷歌他们创造一些可以改善空气的技术,但是有些人也不一定会用,所以它不是一个科技的事情。像我住在硅谷,我们会有很多很新奇的东西,我们会有好多不同的科技,科技不是解决方案,科技只是解决方案的一部分,社会才是提供解决方案的最关键的一环,可能需要花些钱了解一个解决方案,科技只是一个环节而已。
此次Sebastian Thrun博士的腾讯之行,是由于Udacity(优达学城)与腾讯正式签约,达成深度合作。今后,腾讯工程师将在Udacity平台上用硅谷最前沿的技术课程实现自我升级。腾讯学院院长及腾讯大学负责人马永武表示,腾讯已经做好准备,加入到席卷全球的人工智能竞赛中。