编委专访 | 让汽车拥有“慧眼”的平行视觉
因公众号更改了推送规则,记得读完点“在看”哦~下次图图的新文章就能及时出现在您的订阅列表中
2021年1月,由中国科学院自动化研究所研究员、《中国图象图形学报》编委王飞跃老师主编的“自动驾驶技术与应用”专刊上线,王老师带领团队发表了两篇平行视觉的论文,提出将人工社会Artificial societies、计算实验Computational experiments和平行执行Parallel execution构成的ACP方法引入智能驾驶的视觉感知领域,解决了视觉模型合理训练和评估问题,为未来无人驾驶指明了一种新的实现途径。
论文信息
标题:面向智能驾驶的平行视觉感知:基本概念、框架与应用
作者:李轩,王飞跃
关键词:智能驾驶; 平行智能; 虚拟图像; 合成图像; 目标检测
全文链接:
http://www.cjig.cn/html/jig/2021/1/20210106.htm
标题:平行视觉的基本框架与关键算法
作者:张慧,李轩,王飞跃
关键词:计算机视觉; 平行学习; 平行视觉; 视觉感知模型; 实例分割; 目标检测
全文链接:
http://www.cjig.cn/html/jig/2021/1/20210107.htm
无人驾驶进入汽车领域以来,一直无法消除汽车上安装辅助系统对道路障碍的识别盲区。
2005年,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃研究员提出平行驾驶的概念。这一概念针对自动驾驶构建其社会—信息—物理系统模型,从人与车、车与环境、人与车与环境等多个不同层次考虑自动驾驶的实现,并独特性地提出使用云端驾驶与地面端驾驶“平行”的方式,指导无人车实现智能驾驶,为未来无人驾驶指明了一种新的实现途径。专刊出版后,引起了业内广泛关注。
《中国科学报》记者对王飞跃老师进行了专访,点击链接了解专访详情:
http://news.sciencenet.cn/sbhtmlnews/2021/2/360755.shtm
扫码关注,回复“自动驾驶”
免费获取专刊论文电子版
与依靠后视镜作为辅助的早期汽车相比,现代汽车早已经被摄像头、毫米波雷达、超声波雷达以及激光雷达等负责感知的智能传感器“武装”起来。“相比于雷达,视觉感知的智能之处体现在纹理信息提取和分辨率上。”王飞跃在接受《中国科学报》采访时解释道。智能驾驶需要对复杂的交通环境进行准确感知,其中就包括对交通标志、车道线等进行识别,这些交通要素的识别严重依赖色彩信息,而视觉感知可以有效地实现对这些目标的识别和判断,目前的雷达技术则无法做到。
不仅如此,“视觉感知提取的纹理信息还能够对同一类别的不同实例进行区分,有助于完成复杂环境下的目标跟踪、轨迹预测等任务。”王飞跃表示。此外,视觉感知能够以较低成本构建高分辨率图像,因此即使是对远处目标和较小目标,视觉感知方案依然能够保证有较多的信息来对其进行识别,从而大大提升车辆对环境的智慧感知能力。
图1 平行视觉感知的基本框架
李轩,王飞跃. 2021. 面向智能驾驶的平行视觉感知:基本概念、框架与应用
论文结果显示,目标检测的训练阶段虚实混合数据最高精度可达60.9%,同时精度受到环境与困难程度的影响。
“尽管我们认为在智能驾驶中视觉感知可以类比为人眼的一部分,它可以像人眼一样获取外界的视觉信息,但是目前还无法做到像人类强大视觉系统一样进行推理。”王飞跃坦言。为此,他举了个例子,比如在复杂城市道路环境中的交叉路口或者人行道上,人类可以根据当前环境推理其他车辆或者行人意图,并可以与其他车辆或者行人交互并根据情况礼让,而这一点,目前的视觉感知系统无法做到。
“因为视觉感知是通过车载摄像头或雷达对自动驾驶汽车周围环境数据进行收集,利用计算机视觉为代表的深度学习技术,对收集到的数据进行图像识别、图像分类,并对有价值的信息进行检测、跟踪,将其处理成自动驾驶系统能够读懂的语言,进而为控制决策系统提供依据。”
图2 虚拟图像任务的多样性
在这项研究中,研究人员将视觉感知应用到“长尾场景”中。该场景主要涉及日常驾驶中出现概率极低、很少遇到的复杂挑战场景,如极端恶劣天气、突发交通事故、突然出现的行人等。
“由于长尾场景发生概率极低且危险系数高,往往难以采集到相应数据来训练和测试视觉模型,导致目前基于深度学习的视觉算法没有经过充分测试,只在简单的受约束环境下有效。一旦运用到实际复杂开放的交通环境中,算法很容易失败。”王飞跃说。
图3 平行视觉感知的虚实互动和平行执行
李轩,王飞跃. 2021. 面向智能驾驶的平行视觉感知:基本概念、框架与应用
因此,研究人员希望用平行视觉来解决这一问题,团队采用图形学仿真工具构建了大规模的人工城市场景,生成了面向交通视觉研究的虚拟图像集:平行眼(ParallelEye),目标是实现一种“长尾常规化”模式,通过人工虚拟场景来仿真模拟复杂的实际场景,利用计算实验进行视觉模型的训练与评估,最后借助虚实互动的平行执行实现视觉模型的在线优化。
点击图片了解“平行眼”图像集
早在2005年,王飞跃就提出了平行驾驶的概念。为了解释这一概念,他曾在一次演讲中以马车举例。上世纪末,马作为主要的交通工具,随之而来的却是无法分解的马粪。这一问题困扰了人们很多年,甚至有专门的国际会议来研究当时面临的“马粪危机”。
汽车的到来,成功地消除了马粪的问题。而在人工智能时代,即便给车辆安装高线束激光雷达等传感器感知,配上“足够算力”的计算单元,优化算法,将汽车改装成繁杂的智能体,仍无法避免无人车在长久时间内不出现事故。“这就像是这个时代人类面临的马粪问题。”王飞跃说,“有人驾驶、远程控制、网络车和无人车需要统一起来,成为平行驾驶,根除无人驾驶的‘马粪问题’。如果一定要将这几种因素分开,恐怕就是用马车技术解决马粪问题。”
在平行驾驶中,视觉感知作为基础环节,处于智能驾驶车辆与外界环境信息交互的关键位置。王飞跃认为,其关键在于使智能驾驶车辆更好地模拟人类驾驶员的感知能力,从而理解自身和周边的驾驶态势。而随着自动驾驶中人为干预度的不断减小,视觉感知获取环境信息的全面性、准确性和高效性要求越来越高,其始终属于智能驾驶的核心部分。
他同时解释道,当前视觉感知依赖相机系统实现对环境的感知,在实际任务中会产生大量冗余的数据,从而导致计算复杂度和存储负担的增加、计算效率降低。“平行视觉则更加主动,基于描述学习构建软件定义的具有可控性的人工场景、基于预测学习完成人工场景中的计算实验、基于平行执行实现虚实互动,以解决虚拟与现实差异性问题。”
图4 平行视觉分析框架
张慧,李轩,王飞跃. 2021. 平行视觉的基本框架与关键算法
目前,王飞跃团队采用Agent建模方法,模拟北京中关村区域和常熟智能车测试区域,在图形学工作站上建立人工场景,设计丰富典型的环境条件和目标运动,生成大量带详细标注信息的图像视频数据集。同时,部分研究工作采用生成式对抗网络聚焦于虚实交互过程中存在的领域迁移等问题,并生成了具有真实驾驶场景纹理和细节的合成图像。
“现在,视觉感知已经从道路感知逐步向环境认知方向发展。它已成功应用于识别交通信号、道路标志和标线等静态环境信息,以及行人、车辆和其他移动的障碍物。接下来,将会进一步理解道路目标之间的交互关系和逻辑,进行意图分析、预测和决策,有效提升无人驾驶车辆的智能认知能力。”王飞跃说,“随着深度学习技术的进步和推广应用,对车载感知计算平台的性能有了更高要求,将来会在保证算力的情况下降低计算成本。”
“上述成果让我们有信心布局平行视觉方法在中国智能车未来挑战赛上的应用。平行视觉是平行智能体系的重要一环,结合平行驾驶、平行测试和平行学习等重要理论研究,智能车先在人工世界试开,‘要在人工世界吃多堑,物理世界长多智’。”王飞跃有信心地表示。
论文作者
李轩,博士毕业于北京理工大学控制科学与工程专业。现任鹏城实验室博士后/助理研究员,共发表论文11篇,其中SCI论文4篇,授权发明专利2项,获鹏城博士后人才培养计划。参与省部级/国家级项目 5 项,主持中国博士后科学基金特别资助项目、中国博士后面上项目。现担任中国指挥与控制学会认知与行为专业委员会副总干事和委员。
主要研究方向:图像合成、计算机视觉、仿生视觉计算、智能交通系统和机器学习等。
E-mail:lixuan0125@126.com
张慧,中国科学院自动化研究所与美国罗德岛大学联合培养博士,目前就职于腾讯科技有限公司(北京)。近5年来,本人在计算机视觉与图像处理领域发表论文9篇,其中5篇期刊论文影响因子均在5分以上,2篇刊发于图像处理和智能交通领域顶级期刊(JCR一区),Google他引总量90余次。
主要研究方向:计算机视觉、机器学习、模式识别、智能交通系统。
E-mail:zhanghui2015@ia.ac.cn
图图的2020
本文系《中国图象图形学报》独家稿件
内容仅供学习交流
版权属于原作者
欢迎大家关注转发!
编辑:秀 秀
指导:梧桐君
审校:夏薇薇
总编辑:肖 亮
声 明
欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。
网址:www.cjig.cn