基于深度学习的视频中人体行为识别研究简介
摘要:
基于机器视觉的人体行为识别是将包含人体动作的视频添加上动作类型的标签。近年来, 随着视频采集传感器及信息科学技术的不断发展, 这方面的研究在视频监控、 人机交互、 基于内容的视频检索等方面逐渐成为一个具有广泛应用前景的研究课题。自动化监控对生产生活产生很大的影响, 可以应用在商场、 广场以及工业生产的监控中; 作为人机交互的关键技术, 可以将其作为智能家居的一部分应用在家庭中, 如监护小孩或者老人的危险行为等; 传统的视频检索方法都是人工对其进行标定, 其中有很多主观因素, 如果能够将人体行为识别方法应用到该领域, 将大大提高建立索引的效率及搜索效果。当深度学习遇到视频大数据
人工智能(AI)是当今科技世界最炙手可热的词语。人工智能技术已经全面进入了以深度学习为核心的黄金时代。计算机视觉是计算机代替人眼对目标进行识别、跟踪和测量的机器视觉,一直以来都是人工智能技术领域的热点之一。研究结果表明:人的感知、学习、认知和活动有80%~85%是通过视觉介导的。如果不能获取并处理视觉信息,就没法研究真实世界的人工智能,由此可见计算机视觉对人工智能发展的重要性。视频信号在大数据中占很大比重,现在网络上 70%~80%的流量是由视频信号所组成的,可以说它是大数据中的大数据。这些数据可能在几年前还不太容易得到,但是随着各种摄像头的普及,视频数据得以更详细的记录物理世界发生的一切。由此产生了海量的大视频数据,这种大数据给我们带来了存储、传输、处理、管理等方面的挑战,同时也提供了很大的机会。数据显示,人们在视频上花费的时间是图片的2.6倍,越来越多的人正在主动成为视频内容的消费者。让机器帮助分析理解视频大数据就成了我们观察了解物理世界的一条捷径。
深度学习方法以其强大的表示学习的能力,使得机器视觉在图像识别任务上能比人类视觉完成的更优秀,即机器与人眼相比已经能从图像上获得更多的信息。2016年ILSVRC的图像识别错误率已经达到约2.9%, 远远超越人类的5.1%。计算机视觉技术的突飞猛进和深度学习的发展不仅拓宽了图像领域的应用,同时也给互联网视频内容带来了新的可能性。视频中人体行为识别的应用前景
基于深度学习的人体行为识别研究概述
挑战及下一步发展方向
参考文献:
[1]胡建芳, 王熊辉, 郑伟诗, 等. RGB-D 行为识别研究进展及展望[J]. 自动化学报, 2019, 45(5): 829-840.
[2]Wang L, Huynh D Q, Koniusz P. A Comparative Review of Recent Kinect-based Action Recognition Algorithms[J]. arXiv preprint arXiv:1906.09955, 2019.
[3]Asadi-Aghbolaghi M, Clapes A, Bellantonio M, et al. A survey on deep learning based approaches for action and gesture recognition in image sequences[C]//2017 12th IEEE international conference on automatic face & gesture recognition (FG 2017). IEEE, 2017: 476-483.
[4] Kang S M, Wildes R P. Review of action recognition and detection methods[J]. arXiv preprint arXiv:1610.06906, 2016.
[5] Han, F., Reily, B., Hoff, W., Zhang, H., 2017. Space-time representation of people based on 3D skeletal data:A review. Computer Vision and Image Understanding
[6] Presti, L.L., La Cascia, M., 2016. 3D skeleton-based human action classification: A survey. Pattern Recognition 53, 130–147.
[7] Guo, G.; Lai, A. A survey on still image based human action recognition. Pattern Recognit. 2014, 47, 3343–3361.
[8]Wang P , Li W , Ogunbona P , et al. RGB-D-based Human Motion Recognition with Deep Learning: A Survey[J]. Computer Vision and Image Understanding, 2018, PP(1):1-22.
中国保密协会
科学技术分会
长按扫码关注我们
作者:白入文 李 敏
责编:丁 昶
往期精彩文章TOP5回顾
近期精彩文章回顾