百度闭门不造车:增强现实的自动驾驶仿真系统走出实验室
原创:谭婧
来自中国人工智能学者的论文《基于数据驱动算法的,增强现实的自动驾驶仿真系统》(AADS: Augmented autonomous driving simulation using data-driven algorithms)发表在《科学》杂志子刊《科学·机器人学》上。《科学》杂志是全球最权威的学术期刊之一,代表了人类自然科学研究的最高水平,《科学·机器人学》杂志是其五个子刊之一,平均每期刊出不多于4篇的研究类文章,刊载难度很大。这篇论文的学者团队包括南京航空航天大学、北京大学、浙江大学、香港大学等高校的在读博士生。
通常意义上,仿真是实验室的模拟方法。但是,在自动驾驶领域,仿真是验证自动驾驶系统安全性的最可行方案之一,是开发和验证自动驾驶技术的关键。换句话说,仿真技术越“真”,越能精确、真实地测试自动驾驶系统。
仿真系统目前最先进的模拟方法是使用游戏引擎保真计算机图形(CG)模型来创建驾驶场景。李伟也在之前的采访中打过一个有趣的比方:
“如果说一些厂商做的仿真系统看上去像动画,那么增强现实的自动驾驶仿真系统(AADS)就是真人COSPLAY。”
这也是从另一个角度在强调仿真系统中“真”的重要性。
但是,现在的仿真系统存在几个缺点:
第一、创建保真计算机图形和车辆运动仍然是手工的任务,可能既昂贵,又费时。
第二、高保真计算机图形仍然缺乏真实世界图像的丰富性和真实性,使用高保真计算机图形生成的数据训练自动驾驶系统会导致其性能下降。
对于现有仿真技术还存在着“不够真”的问题。李伟博士坦言,他们的研究团队也曾面临现有仿真系统在呈现真实交通流、驾驶员与行人的互动等场景中存在不足的问题。美国肯塔基大学教授的杨睿刚博士评价——不同于现有的仿真系统,增强现实的自动驾驶仿真系统(AADS)技术能更准确、更真实地模拟自动驾驶汽车在路上收到的信息,在感知层面更接近于真实世界。杨睿刚博士同时也是李伟在美国联合培养期间的导师。
所以,一句话概括,“增强现实的自动驾驶仿真系统”,可自动创建逼真的道路场景,为自动驾驶车辆提供更为可靠且低成本的实验室模拟方法。论文《基于数据驱动算法的,增强现实的自动驾驶仿真系统》研究的是一种突破性的仿真技术,发表在《科学》杂志子刊《科学·机器人学》上也代表着该研究获得学术界的认可。
关于论文的一些细节,《亲爱的数据》出品人谭婧与论文的第一作者李伟展开了对话。
问题一:可扩展性(Scalability)对自动驾驶任务为什么重要?
答:自动驾驶系统对安全性的要求极为苛刻。其中一个重要方面体现在,自动驾驶系统能在边角案例(corner case)或者说极端场景依旧保持可靠,保证乘坐者和行人的安全。因此,可扩展性,即可以将现有的自动驾驶仿真系统扩展至多样的、特定的、甚至极端的场景,并用于训练、测试自动驾驶系统,是一个重要的、不可或缺的功能。
问题二:真实性(Realism)对自动驾驶任务为什么重要?
答:现有的自动驾驶仿真系统都使用人工构建虚拟的场景,虚拟的交通用于训练、测试自动驾驶算法。即便是花费大量的成本和时间,虚拟的场景据真实场景依旧存在不小的差距。差距越大,训练和测试的自动驾驶算法在真实道路上存在的问题便越多越大。
若仿真数据足够接近真实场景,那么训练和测试的自动驾驶便足够可靠。我们采用的一个特殊处理方法是使用标注的真实采集数据,这样能够让算法从真实采集数据直接合成仿真数据。
问题三:仿真和现实的差距,技术能够解决到什么程度?
答:仿真和现实之间,从底层的传感器仿真(CCD传感器、LiDAR传感器等)到上层的交通流仿真(行人和车辆等)都存在不同程度的差距。而这些差距,都可以通过不同的技术尽可能地缩小。对我们的系统而言,在大部分使用场景下,仿真和现实的差距已经被缩小到自动驾驶感知算法可接受的范围。
问题四:数据有什么特色?数据驱动的自动驾驶仿真方法能否详细介绍一下?(比如论文中提到,三维街景数据,大都市拍摄的图片数据,交通密集情况下的数据)
答:我们系统仿真数据的特定在于真实,其核心在于实际采集的自动驾驶数据集ApolloScape。我们的自动驾驶数据集在数量、精度等方面在全世界范围内也是领先的。仿真系统本身是比较庞大的,包括图像仿真、激光雷达仿真以及车流移动仿真等,还需要一些更深的技术将整个系统加以完善。
针对不同的仿真数据,我们有不同的仿真技术。在我们的系统中,针对图像传感器,使用了一种基于图像渲染的技术,可认为针对图像的一种特殊数据驱动方式;针对LiDAR传感器,使用了基于模型和数据驱动的技术;针对交通流,使用了多代理的数据驱动技术。
问题五:论文的突破点在哪?
答:论文的突破点在于自动生成真实感的数据和构建可扩展的系统。基于已采集的数据,该系统可自动的生成逼真的道路场景和场景中复杂的驾驶员(车辆)与行人的相互影响与运动。简而言之,即有效的还原了驾驶场景,并合成、组合形成了更多的驾驶场景。
问题六:为什么少量图像能实现?
答:得益于全新开发的基于图像渲染技术,包括该技术中的深度数据处理与优化技术、大基线视角外插技术等。我们的系统可在仅使用少量图像便合成大量视角。
结语:
自动驾驶技术的前沿学术发展早已不是“闭门造车”时代,学术研究与自动驾驶的应用史无前例的“近”。杨睿刚博士同时也是百度机器人与自动驾驶实验室的负责人。他认为,自动驾驶本身就是应用场景,该领域需要应用驱动型论文,也就是说,自动驾驶领域的论文应该超越纯粹科研和学术。该研究已经部分应用在自动驾驶系统的仿真、验证环节。
李伟也谈到,“我们不仅希望能够做一篇比较好的论文,更希望把研究成果应用到更多地方。”把学术前沿技术用起来,已经是自动驾驶领域前沿学者的共识与目标。
杨睿刚博士相关文章:
野外作业机器人四十年:推倒人工智能实验室的围墙
随手点“好看”,越长越好看~