ICME 讲习班 《CV in Transportation》,177页PPT带你了解出行领域的计算机视觉技术
点击上方“滴滴科技合作”,选择“置顶公众号”
精彩资讯,即刻送达
导语
在垂直领域找到与技术深度结合的应用场景是当前计算机视觉技术落地的一个重要命题。计算机视觉技术的落地也势必会直接影响我们衣食住行的方方面面。特别在出行领域,计算机视觉技术的应用将会极大提高交通运行效率和安全水平。滴滴Computer Vision in Transportation讲习班以实践应用为核心,多方面地讲解当前视觉技术在交通领域的应用与原理。第一部分覆盖交通领域视觉应用背后支撑的方法和原理,包括深度学习知识、图像分类以及目标检测等;第二部分主要集中讲在交通领域的应用中所需要的前沿性探索问题:域适应(Domain Adaptation)和轻量级模型(Lightweight Models);最后一部分讲述了计算机视觉在出行领域的两大应用方向。
接下来小编带大家回顾一下课程内容,教程PDF原文请点击阅读原文获取。
第一章
计算机视觉导论
(Introduction to Computer Vision)
讲师:滴滴AI Labs 车正平博士
大纲:
• Computer Vision Basics
• Representation Learning
• Activation Functions
• Neural Network Structures
• Convolution Operators
• Pooling Layers
• Batch Normalization
• Image Classification
• Datasets & Competitions
• Roadmap
• Classification Networks
• Experiments
• Object Detection
• Introduction & Roadmap
• Region-Based Methods
• Region-Free Methods
• Experiments
亮点:在本演讲中,简明扼要地讲述了深度学习时代的视觉技术基础,如表征学习、激活函数、神经网络、卷积操作、池化层和批归一化等入门知识,详细地介绍了图像分类和目标检测的全局路线图和代表性工作,分享了在实践中发现的几个痛点:模型对昂贵的标注数据的依赖性;已有模型无法在新的环境中直接使用;对计算资源的高需求;以及端上能力推广的局限性。
相关阅读:
《密西根大学40页《20年目标检测综述》最新论文,带你全面了解目标检测方法》
车正平博士讲解计算机视觉基础知识
2
第二章
前沿话题
(Advanced Topics)
讲者:滴滴AI Labs 首席研究员,加拿大carleton University郭玉红教授
大纲
• Domain Adaptation
• Introduction
• Application in Computer Vision
• Domain Adaptation Methods
• Lightweight Models
• Basics
• Inception, Xception *
• SqueezeNet
• MobileNet / MobileNetV2
• ShuffleNet / ShuffleNetV2
亮点:基于前文提出的痛点与挑战,在本演讲中分享了两个前沿话题:Domain Adaptation和Lightweight Models。其中Domain Adaptation旨在解决如何从原始问题学习到的模型能够很好地适应与之不相同的目标问题。而Lightweight Models可以很好地解决模型存储和速度问题,通过构建轻量级模型让深度卷积神经网络保持精度的同时,模型体积更小,占用更少的资源。
郭玉红教授讲解前沿话题
3
第三章
应用
(Application)
讲者: 滴滴AI Labs沈海峰博士,李广宇博士
大纲
• Driver Identification
• Application
• Overview
• Experiments
• Driving Scenario Understanding
• Vision Perception
• 3D Reconstruction
• Behavior Analysis
亮点:本演讲中举例计算机视觉在交通的两大应用点,司机认证和驾驶场景理解。其中司机认证主要涉及人脸检测和识别技术。沈海峰博士介绍了人脸技术的一些典型应用,特点和挑战;回顾了人脸检测主流技术以及识别主流技术的演进。并且分享了滴滴在NeurIPS2018的论文Virtual Class Enhanced Discriminative Embedding Learning以及WIDER FACE人脸检测竞赛5项单项第一的算法模型。驾驶场景理解是一个涵盖全方面视觉技术的应用话题。李广宇博士从场景中有什么,物体和车之间的关系(距离)以及司机对环境的反应三个角度,即视觉感知、三维重建和行为分析进行讲解。视觉感知简单地讲述了通用视觉和驾驶场景理解视觉技术不同点,分享了行人检测、车辆检测、车道线分割、交通灯检测等应用;三维重建部分深入浅出地介绍了基础知识和语义重建;最后演讲关注于驾驶场景的深度感知与理解。
相关阅读:
[1] 滴滴AI Labs包揽WIDER FACE评测五项世界第一
[2] Learning Better Features for Face Detectionwith Feature Fusion and Segmentation Supervision
https://arxiv.org/abs/1811.08557#
[3] Virtual Class Enhanced DiscriminativeEmbedding Learning. https://arxiv.org/abs/1811.12611. 2018
[4] 滴滴盖亚开放数据:
沈海峰博士分享人脸技术
李广宇博士分享驾驶场景理解应用
编辑 | 洛羽