苏奎峰:从火炮控制到自动驾驶 | 腾讯科学家系列
2004年改编自阿西莫夫小说的电影《机械公敌》展现了2035年完全自动化的无人驾驶场景。如今,这一愿景正逐渐成为现实,业界甚至普遍预测2025年是实现完全自动化驾驶的时间,这比科幻电影整整提早了十年。
在中国,当大多数人还未意识到的时候,腾讯自动驾驶汽车已经上路,Pony也是试坐者之一。2018年年初,他搭乘腾讯的自动驾驶汽车从深圳的大族大厦出发,向西开往南海大道,上京港澳高速,再进入深南大道,最后返回大族大厦,行程20多公里。
自1994年进入军校学习和从事无人驾驶系统相关军工项目的研究,到2016年入职腾讯领衔自动驾驶实验室的工作,投身自动控制领域十余年的苏奎峰,也就从此开启了人生新征程。苏奎峰如何看待自动驾驶的进程?他自己又是如何进入到自动驾驶领域中,以及对自动驾驶有什么独到的见解?《腾云》杂志这一专访,将为你打开看见自动驾驶未来的一扇门。
苏奎峰 腾讯自动驾驶实验室负责人
采访/徐可、张谦
撰文/徐可
半个多世纪前,刚刚从美国陆军退伍的一名青年,开始一行一行地写下《我,机器人》的三大定律。彼时计算机尚未普及,他的小说里却描述着这样的街景:来回穿梭的车完全取消了方向盘,主角可以在车里睡觉和看书,车载电脑还可以人机对话,查询资料。这位青年就是科幻巨头——阿西莫夫。
2016年,中国的一位青年从部队离开后,转身加入腾讯。助力中国的汽车厂商实现阿西莫夫描述的街景,成了他现阶段最大的目标。
回到无人驾驶这个话题,现实或许要比科幻来得更早一些。2004年改编自阿西莫夫小说的电影《机械公敌》展现了2035年的L5级无人驾驶场景。现实中,2009年,谷歌宣布进军无人驾驶。2012年4月,谷歌自动驾驶汽车已经开了20万公里。两年后,中国互联网巨头百度宣布开始自动驾驶研究项目。2018年10月,百度首个“阿波罗”无人驾驶商业项目正式落地。
业界普遍预测2025年是实现自动驾驶L5的时间,这比科幻电影整整提早了十年。那投身自动控制十余年的科学家苏奎峰又是如何看待自动驾驶进程的?他又是如何进入到自动驾驶领域中的?他对自动驾驶有什么独到的见解?近日,《腾云》与腾讯科协对苏奎峰进行了专访,以下是经过编辑的访谈实录。
- 01 ------
短期内自动驾驶难有商业回报,
但长期市场广大
腾云:
可以聊聊您的从业经历吗,您是怎么加入到无人驾驶行业的?
苏奎峰:
我1994年高考进入军校,毕业后在北京郊区的一个研究机构专事坦克火控系统研究。在清华读博士期间我就做坦克火控系统,做过很多硬件。
火控系统本身是软硬件结合的系统。具体而言就是坦克在行进过程中会颠簸,火控系统就是确保坦克的火炮在瞄准某一个目标的时候,无论车怎么移动,驾驶员怎么开,火炮一定要紧盯着瞄准的目标不动。这个稳向系统,主要是一个控制和智能的跟踪闭环的系统。
2001年前后我也做了一些LT,即智能尘埃,实际上就是早期的物联网,远在现在炒红的物联网概念之前已经在开始做了。智能尘埃,指的是无人岛上撒的那些无人传感器,可以配合军方的无人机,监测整个战场态势。智能尘埃非常便宜,而且很小,只有约一个硬币大,但是能持续工作一年,把数据收集回来上传。现在很多民用技术应该也没有达到这种水平。
除此之外,我还做过无人的作战平台。装有火控系统的坦克可以有人驾驶,也可以无人。坦克的无人驾驶和我们现在说的汽车无人驾驶不太一样,前者强调的就是无人,不强调舒适性。坦克有一定的自主能力,碰到沟坎能自动绕过去,也可以支持远程遥控,遥控和自主驾驶是融合在一起的。
我在清华读博士期间,才真正开始接触现在这种形态的无人车。大概2008年,我就开始改装车,做了几年时间。毕业后回到原单位,做空地协同的无人系统。这个系统上面有一个四旋翼,下面会带几个无人的小作战平台,可以看高度,可以协同打击敌方,类似巷战使用的那种无人机,是完全自主的。加起来我应该跟无人系统打了十几年交道。
腾云:
2016年到现在,腾讯自动驾驶实验室发展的过程是怎样的?
苏奎峰:
腾讯自动驾驶实验室是2016年8月底,在我来后不久成立的。
2016年,我们就有一辆车在北京园博园做了实验,大概时速40公里以下,基本上无人车的简单功能都可以实现了。当然路上的人也很少。2017年我们就申请招人。
2017年下半年,我们的一辆改装车进行了第一次从北京到深圳的高速测试,后来又跑了第二次测试,基本上全程2300多公里,过了很多隧道。整个大概经历6、7次人工干预。通过隧道都没有问题,就是高速上车辆爆胎导致的一些黑的小的物体检测不到,再就是收费站这种场景会有一些干预。
之后我们在腾讯大厦里展示,还进行了直播试车,从深圳的大族出发向西到南海大道,到京港澳高速,到深南大道,再绕回来,这一圈大概20公里。后来邀请了好几位公司高管去试坐。2018年2月7日,Pony也去试坐过。我们现在还在招人。美国硅谷那边也在成立办公室,也在招人。
我们在自动驾驶云平台、仿真和高精地图等这些产品上面会做很多工作。我们也会逐步跟很多车厂进行一些合作。预计2019年会有一些订单落地。自动驾驶技术要经历一个长期的发展过程,短期内很难得到商业回报,但是长期来看,自动驾驶肯定是一个非常大的市场。
美国汽车工程师学会(SAE)自动驾驶分级标准
- 02------
汽车变成移动智能空间,
腾讯有望颠覆现有生态
腾云:
您可以介绍一下腾讯自动驾驶研发的模式吗?研究的重点是什么?
苏奎峰:
从长远来说,腾讯还是借助自动驾驶这个通路,获得一个更有价值的行业入口,然后把我们的内容生态,或者是其他的一些服务,从车的这一端送达用户。自动驾驶的核心问题是释放人的双手,把人从驾驶行为中解放出来。那时车就有无限的想象空间,车变成了移动的智能空间,我们可以颠覆现在所有车的布局和生态,把腾讯的优势慢慢结合进去。
在这个过程中,我们会挖掘腾讯的很多优势,助力车厂去实现。因为腾讯的重点不在于造车,或者说到现在还没有造车这个打算。我们会助力车厂实现L4,以共同实现移动出行的愿景。我们会把我们的能力服务提供给车厂,包含自动驾驶的云平台。以腾讯云为基础,把自动驾驶相关的数据存储,包括模型训练、算法平台相关的东西,都提供给车厂,这也是车厂欠缺的。
另外,我们也在利用腾讯强大的游戏基础做自动驾驶的仿真,未来自动驾驶系统的开发和认证,是需要大量仿真测试的。我们已经跑了70亿公里的虚拟仿真,这需要有强大的计算平台和虚拟环境来支撑。我们会给车厂开发满足自动驾驶需求的仿真环境,提供仿真云服务。
除此之外,腾讯有高精地图,我们团队自己也在做完全独立的高精地图。高精地图是未来自动驾驶必备的技术,我们有采集资质,也有地图的运营资质,可以把高精地图作为产品或服务,提供给车厂。在以上这三个方面,我们完全可以助力车厂去实现它的目标。
我们也要做L3。因为一方面我们掌握了Know-How,有利于打造我们的三个平台,更有利于车厂。另外,我们在AI、其他算法、人才等方面也有优势,那我们也会利用这些优势,把其他的一些L3相应的模块,车厂需求的模块,提供给车厂。我们以菜单的方式,用Pony的话说是Toolbox的方式,非常灵活地提供给车厂,让车厂去选择。
在此过程中,我们也逐渐构建自己的能力,或者跟车厂一起建立能力,将来也有可能会做Robot Taxing或者Mobility Service,也就是L4。腾讯有很好的条件和基础跟第三方合作来共同做这件事情。因为我们对用户有很好的理解,也有很好的用户数据、运营管理体系和技术积累。利用这些优势,加上车厂的经验和自动驾驶技术,可以构建一个比较好的移动出行的组合。无论如何,我们会从自动驾驶的基础技术开始,为车厂和合作伙伴提供这些能力。当然这里面有一定的商业价值,无论是云平台、仿真,还是高精地图,都有巨大的市场。
L3、L4的系统需要很高成本,互联网公司不擅长成本管理。但是互联网公司可以提供一些插接式的解决方案。我们提供部分技术,车厂提供整个产品。我觉得腾讯还是需要补很多课。所以我们的切入点和方向的选择性,还是考虑到自身的优势和特点。
硬件市场需要一个长期的经验积累,而且硬件确实需要成本管理。互联网公司本身经营模式比较轻,很难做好硬件成本管理。硬件的管理流程和供应链体系,是一套非常完整的体系,需要多年经验积累才能建立起来。就以一个采购体系为例,假如我们要买一个传感器,需要解决采购渠道、采购经验、压价等一系列的问题。很可能我们买的传感器25块钱一个,觉得很便宜,但是人家供应链上15块钱就能买到,这就是差异。人家做硬件能赚到很多钱,但是你做硬件就亏钱了。所以互联网公司里还没有看到谁把硬件做得非常好。
腾讯自动驾驶:L3级别自动驾驶红旗H7(左)和L4级自动驾驶博瑞GE(右)
腾云:
您觉得现在世界范围内,国外的自动驾驶比我们领先在什么地方?
苏奎峰:
我们先来介绍一下L3、L4。我觉得L3、L4只是美国的SAE(国际汽车工程师协会)倡导的一个概念,然后让大家向这个标准看齐。我觉得这样划分也不十分合理。首先自动驾驶是场景定义的,就是说在一定的条件下,可以满足自动驾驶的基础条件。在这个基础上分成不同的阶段,但是实际上有很多细分的功能性差异,比如说像特斯拉是L2,或者说L2 Plus,那Plus算是2.9还是什么。到底什么程度是L3,这个划分就比较模糊。对于用户来讲,更看中的是你有什么样的功能,能满足用户需求就可以。
真正L3现在有两款车,一个是奥迪A8L,还有凯迪拉克CT6可以算是L3。奥迪A8L它应该是TGP,就是属于交通拥堵的时候,60公里以下号称能释放双手,实际上现在市场还没有用。CT6在高速巡航时,应该也需要驾驶员时刻保持注意的。我们所谓的L3还满足不了释放双手,去做别的事情。
谷歌的Waymo是L4,它是国际上最领先的。他们技术比较新。Waymo现在也开始商业运营,但是它只能选择在美国个别州来运营,比如说地广人稀、气候干燥的美国中部,良好的自然条件减少了对自动加载系统的干扰。
- 03 ------
想真正做到躺在车上睡觉,
技术层面还有很多挑战
腾云:
您觉得现在阻碍这个行业的因素是什么?
苏奎峰:
我觉得核心还是技术问题。现实场景有很多意外,想真正的做到用户很放心躺在车上睡觉,在技术层面就有很多挑战和问题。比如说飘一个塑料袋过来,要分清它是塑料袋还是障碍物,对于系统感知来讲还是比较有挑战。现在很多人说是法律制约了发展,我认为首先还是技术没有达到。技术到了,法律的问题都会迎刃而解。
如果让Waymo来中国城市跑,它可能也跑不起来。技术是最大的门槛,需要去突破。而且自动驾驶的技术挑战在于对工程化相关技术的要求都很超前,要保障车的可靠性和稳定性。
自动驾驶的检测不是说做一个AI算法就可以了,需要传感器将数据反馈回来,有一定分辨力。如果路上过一只小狗,人在一二百米外就能看到,很容易,但是对于传感器、激光雷达、摄像头等而言,就成了一个很难的挑战。
传感器技术需要发展,算法、计算平台、计算机的计算能力也需要发展。复杂度越高,对计算能力的要求也越高,包括车的冗余系统。人就是一个车内的冗余系统,原本刹车制动失灵的时候,人可能有脚刹、手刹这些辅助手段来刹车。一旦人从司机位置脱离出来以后,相当于原来所有的那些天然冗余系统没有了,这对于车的性能提出新的要求,刹车、转向等关键的安全系统等都要双稳,一旦有一个出了问题,另一个能够随时介入。
但是,现在自动驾驶的整个冗余系统,基本上还没有实现产品化和完善。计算平台非常重要,一旦计算机宕机了,或者有什么问题,车要如何保证稳定、安全地停下来,这些都是很现实的问题。
这些需要大量的数据去打磨,利用网络平台、云平台、仿真技术,把各种场景的数据快速收集回来。谁的场景建得越多,谁的应对能力就越强。收集足够的案例,慢慢扩大场景、扩大范围,然后减少驾驶员的干预,一点一点成熟。这是一个循序渐进的过程,也要经过漫长的技术发展过程。有些案例你没有看到过,你就很难真正去体会或处理。所以现阶段对我们来说还是侧重这三个方向。这三个方向做好了,才能把其他问题解决好。
腾云:
关于数据收集,有人提出应该让这些厂商都共享数据,这样大家的数据都多起来了,才能促使解决方案出来。这个是不是很难实现?
苏奎峰:
短期内挺难,长期来讲可能会。数据共享就是利益的分配,你怎么去把这个利益分配好,需要业内达成一致。对于腾讯来说,可能开放会更好一点。不光是数据,高精地图也是一样的。原来的高精地图是有一个图商,腾讯、高德、百度,我卖给你,你用就好了,我为你更新,数据跟你没有任何关系,跟车也没有任何关系,你就是一个用户。
但是未来的高精地图,它强调数据实时更新,那边一旦拥堵,或者是道路施工,它要随时更新,以便车能处理。地图不可能是预先采集的,它需要马路上汽车的传感器从这些案例反馈回来到云端,图商去处理,再分发下去。这样车参与到数据的循环里。所以利益就要重新分配。
如果车不给图商数据,地图就是一个死地图,满足不了自动驾驶的需求,所以新的商业模式和合作逻辑都会去重构。实际上每个公司都在思考这些问题,我们也在想,用什么样的方式能够和更多的人去合作。实际上用户越多,或者你越开放,车厂给你反馈数据越多,你的东西会越好。
腾云:
自动驾驶何时可以实现智能移动空间,对此您怎么看?
苏奎峰:
这是一个循序渐进的过程,我觉得能彻底把方向盘取掉的话,可能还是比较漫长的。最理想的话,2025年可能在一些局部的地方能看到,再有7、8年的时间,应该会有一定的规模。Waymo可能今年年底或明年就会有一些showcase,但是真正的技术成熟,和能够给用户带来价值,我觉得可能至少要在2025年后。
一旦驾驶模式转向自动驾驶,它的人机交互应该会越来越重要。对于用户来讲,车是否好用已经是基本功能评判标准。就好像现在你买车不会关心车的快慢,而是关心驾驶的手感、体验、加速减速的感受。一旦未来你不需要开车,车对于用户来讲就是一个移动的智能空间,里边的用户体验反而很重要,这个按纽方不方便,语音交互识别率是否很高,手势识别是否很好,我想看的内容能不能推荐给我。这些都是腾讯可以发力的。所以我们说我们要切入一个技术,为腾讯获得一个更好的入口。反之,如果无法在自动驾驶上和别人合作,你就很难切入进去。
腾云:
最后一个问题,您在腾讯工作,和在以前的单位相比感觉有何不同?
苏奎峰:
最大的不同应该是原来单位更偏研究型,所做的工作从研究到应用需要经历一个漫长的过程,腾讯的工作把研究和实践结合得非常紧密,因此压力会更大一些。但是现在的工作更加令人兴奋,所以感觉上还是蛮好的。
(王晓庆对本文亦有贡献)
感谢您关注和支持《腾云》,第67期限量赠阅开放申请中,敬请点击阅读原文填写相关信息,即有机会获赠本期《腾云》。
小编说
人类距离实现完全自动驾驶还有多远?还有什么要做?欢迎留言说出你的观点~~
本期主要内容
王晓冰 Outside The Box
腾云编辑部 专访故宫博物院副院长冯乃恩:故宫的基因,就是时尚、开放、创新
徐可 苏奎峰:从火炮控制到自动驾驶
猫粮 在讨好新一代公众上,国际知名博物馆都做了哪些尝试?
刀娘 塔可:跟着典故里的中国往后走
孙信茹 当“中国大妈”们自拍的时候,她们想说的是什么
王烁 赫希曼:另一种忠诚
刀娘 萨拉斯诺:蜘蛛网、宇宙起源与人类的未来
阿改 House Vision:家的未来
Jared Robert Keller 利用区块链搭建可信档案库的挑战
Lisa Perez 大机构为何不愿共享数据
Trevor Johnston 3D打印的潜在安全威胁
Farita Tasnim 未来医疗黑科技的演进方向
想在第一时间看到我们的推文吗?
动动手指把腾云设置成⭐星标吧!