查看原文
其他

滴滴自动驾驶工程师们的「简单」梦想

不断探索的 滴滴技术 2022-11-12

桔妹导读:自动驾驶作为多种复杂人工智能技术的缩影,和传统互联网产品有着本质的不同,开发成本高、开发周期长、技术破冰难,身在其中的工程师们屡屡遭遇挑战,还要面对来自社会各界的压力。技术到底打磨到什么程度才能和人类驾驶相媲美,至今也没有人敢在机器与人类之间画上等号。用户体验的 “简单” 背后,是工程师们对技术“复杂”度的极限挑战,自动驾驶行业现在还处在发展初期,来到这个行业的工程师们,带着不同的经历,抱着同一个“简单”梦想汇聚在一起,为美好出行日夜兼程。




1. 
安全,是每行代码的起点

在滴滴自动驾驶,一切技术驱动的核心都是以「安全」为最高权重标准来去进行技术迭代和突破。而在一套完整的自动驾驶系统中,如果将感知模块比作人的眼睛和耳朵,那么planning&control就是自动驾驶的大脑。决策规划控制模块可以处理多么复杂的场景,也是衡量和评价自动驾驶能力最核心的指标之一。



所以作为大脑的「决策规划」其挑战和难度也是最大的。从0-1构建planning&control系统的过程,一路充满了未知挑战。

 

天宇是planning&control团队的leader,而提到当初是如何了解自动驾驶,为何加入滴滴时,天宇说“这些大家觉得枯燥的数学反倒是最我感兴趣的,所以本科在北京航空航天大学就读自动化专业,中间一直在思考如何用数学的方式去解决复杂问题,后来关注到美国的「DARPA Grand Challenge」大赛,发觉无人驾驶是一件非常有趣的事情。”


「DARPA」 是美国国防部先进研究项目局 (Defense Advanced Research Projects Agency) 机构名称的缩写,简单来说也就是美国黑科技研究所。

 

DARPA Grand Challenge其在无人驾驶业内的地位如同运动员圈内的奥林匹克盛会。第一场比赛于 2004 年 3 月份举办,赛道设置在美国Mojave 沙漠,全长 240 公里,第一名由(CMU)卡内基梅隆大学获得。当时的无人驾驶研究,还处在实验室的阶段,并不像现在成为一个行业在推动。


图片来源于网络


天宇在CMU无人驾驶的博士项目中,参与了全球顶尖的无人驾驶公司的项目,经历并见证了整个自动驾驶行业从实验室阶段,到现在快速崛起发展的阶段。

正因很多像天宇一样的成员的加入,给滴滴自动驾驶团队注入美国硅谷的文化、富有创造力、敢于打破条条框框。


在这期间中美团队成员的融合,不同工程师文化和技术栈背景,交织在一起,互相碰撞、不断地推动技术的迭代变迁。

 

天宇说“我个人觉得无人驾驶是一个非常难的机器人应用,它像一个木桶理论的践行者,任何一个模块差了,这个系统其实都不行,这不仅仅是算法,是一个很综合的 engineering,是工程很大的项目。对环境复杂,高速度等各种复杂极端场景,是需要一个积累过程,真的有一个算法或者说一个技术点的重大突破,才能够再飞越的往前走一步,它不是那种线性的东西,一定时间内是线性提升,偶尔阶跃上升一下。”

Planning & Control:顾天宇


“我们需要去在算法上突破。整体来讲,我们做的是一个长期持续探索的计划,不受外界的因素干扰,潜心按照自己的节奏去突破和推进。”



2. 
严谨,一以贯之

在一年前我们的几何库进行了一次重构,其实几何库是一个非常基础的底层, 不仅被planning&control模块所使用, 也被感知,预测,定位等其他模块所使用。


团队的李亨通,发现在一些极端的情况下,我们目前的几何库计算结果还存在优化提升空间,所以我们为了能够再度提升准确度,付出了很大的成本来重构底层逻辑。亨通和我们讲述了整个过程:


在重构过程前,我们花费最多精力的两个地方就是:架构设计、验证环节;

 

一方面,架构设计影响着我们整个技术应用的安全可靠性和、稳定性,像是盖一个房子,决定结构是否足够经历风吹雨打的各种考验。

 

另一方面,在编写完成后,验证环节,占据我们最主要精力,一行行代码服役前,需要进行大规模的场外验证,在通过我们定制的一系列标准准出后,需要经历仿真系统的验证、不断地路测,而这个过程,谁都不能急,来保证绝对的安全,因为安全对我们的影响很大,或许会有人因此付出生命的代价。

 

我们还要保证接口重构不会对现有代码造成影响,在进行了充分的测试之后,我们才将geometry上线。大家都非常细心仔细,不放过每一个细节。对于测试结果,大家仔细分析每一个指标变化可能带来的潜在影响,反复设计测试,确保安全。

 

经过重构,我们geometry库的易用性大大提升,接口更加清晰明确,运行时间和精度得到数量级提升,可靠性大大提升。

我在清华计算机硕士毕业后,进入阿里云做一些研发工作。而自动驾驶,是不同于传统的互联网产品,代码的质量和规范性更高,也更加需要一些门槛,在这里成长还是很大的,并且觉得做了一件科技向善的事情、很酷的事情,给个人探索发挥主观能动性的空间也更大,我觉得自己有一个很大的飞跃。


Planning & Control:李亨通



3. 
足够前瞻性,高效率进化

行为策略是自动驾驶技术中的核心地位,相当于人的大脑细胞,决定了如何聪明的像人类一样,做出最自然合理的反应,将复杂信息变成简单动作的过程是复杂的。


美国研发中心的谢丹是最早参与到这一模块的成员,让车变更聪明,化复杂为简是他一直在思考的问题:


本身无人车是一个复杂系统,不单单是只有各种技术栈和算法的交织,和环境也存在着复杂的交互。行为策略作为控制车辆下一个行动的模块,因此在设计上必须有足够的前瞻性,让自动驾驶这个理性思维里,加上人类的经验和交互应变能力。从而让我们的软件系统具备充分的可扩展性,可维护性,在未来表现的越来越聪明。


例如在变换车道的过程中,不仅要考虑能不能安全的变道,也要考虑变道的过程是否舒适,变道行为是否合理必要,以及变道之后是否会对我们未来的行驶造成影响。这些因素可能涉及不同的数据形式和算法。怎样将它们整合到可扩展的框架内,让我们的软件能够不断的进化,是非常重要的。另一个例子是当我们的车辆在一些高风险,不确定的环境中行驶时,应该像人类驾驶员一样适当调整速度,从而提高安全性和驾驶体验。而这样的环境千差万别,也对软件系统提出了挑战。


所有这些问题都需要我们在决策软件的架构上进行前瞻性的设计,同时也要充分利用数据,借助机器学习的算法,通过模拟器进行大量迭代测试验证,从而保证软件的高效率进化。




4. 
目标,长期价值

提到对于无人驾驶的思考时,天宇说:

 

在5G技术低延时的背景下,我们已经可以去探索在特定场景下的Driverless,但这并不能代表真正的实现。拿高速路段举例,车辆在高速行驶中,一旦出现特殊情况,但远程驾驶员由于不属于这个环境,需要一定时间去分析适应这个环境,想一想他怎么开?是没有办法快速的让远程驾驶员切换到这个情景下去。像这些场景都需要去解决好,真正保证安全,那才是真正的我们在追求的Driverless的状态。



现在是5G元年,真正大规模普及,可能还需要一段时间,到那个时候也许能够真正实现这种实时的响应,或者说可以在50毫秒或者20毫秒之内,能够做到极端情况下在一个运营区域内快速可靠的介入。

自动驾驶技术也许现在还不是百分百完美的,还有很大的空间需要去迭代,幸运的是,我把我的工作想做的事业和兴趣统一起来了,并且我喜欢这种状态,享受这个过程,用自己的方式去改变这个世界。




5. 
工程师文化:纯粹·严谨·创新

天宇——“我很欣赏同事之间的凝聚力,集体精神,包括跨美国中国地域的合作,团队成员90%以上都有着硕士以上教育背景,大家过往的经历都非常的优秀,在这样背景深厚的团队里,感觉每天都humbled。

 

亨通——“在这个环境里,能感知到纯粹、严谨的工程师文化,大家知无不言,不论是在项目进行中还是在决策之前,接受来自不同维度的评价和观点。“

谢丹——“能感受到团队里一直保持着创业文化,使命驱动。团队团结凝聚力强,做的工作在技术上非常有挑战性,且有望颠覆人类未来生活方式,感到非常幸运。”

 

在自动驾驶领域的研发工程师们,能感觉到他们每个人都有一个纯粹的简单梦想,可以让人类离开驾驶位,并用人工智能技术和传感器来替代,预防事故的发生。

像从业最资深的滴滴自动驾驶美国研发中心的张晓东,曾师从日本藤重悟教授,后赴美国攻读计算机科学,1996年就开始进入汽车自动化行业,2001年研发为货车司机提供路径的软件,自行开发了美国高速公路求路器,再到加入滴滴自动驾驶,依旧保持年轻、敢于探索。

我们佩服满腔热血、潜心投身于无人驾驶的工程师们,或许现在的自动驾驶技术不足够和人类画上等号,但他们敢于挑战传统、挑战权威、敢于探索这条路上的可能性,通过技术的演进打造一个可靠安全的无人驾驶,为世界创造一个更安全、更高效的出行方式,让我们感受到简单梦想的美好和伟大。

 


相信终有一天,世界上的各个街道、停车场、以及高速公路将成为更加安全、美好之地。


互动

欢迎留言区畅聊你对未来无人驾驶的场景想象

精选留言点赞TOP3

可获得滴滴自动驾驶 

独家定制版帆布袋+程序员保温杯



团队招聘


滴滴自动驾驶在北京和美国硅谷均设有研发中心,已全面构建感知、行为预测、规划控制、高精地图、基础设施及仿真、车辆平台、云控与车路协同、信息安全等多个工程师团队,团队长期招聘以上方向工程师。欢迎有兴趣的小伙伴加入,可投递简历至 diditech@didiglobal.com,邮件请邮件主题请命名为「姓名-应聘部门-应聘方向」。



扫码了解更多岗位



延伸阅读

内容编辑 | Charlotte
联系我们 | DiDiTech@didiglobal.com

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存