封面故事 | Show me your hands
点击中国图象图形学报→主页右上角菜单栏→设为星标
(图片来自网络)
无法用语言表达或文字不通时,你会如何传递信息?相信肢体语言是个不错的选项,手舞之,足蹈之,形象且直观。其中手势是较为常用的肢体语言,它表示方便,信息量大,部分手势已有约定俗成的含义。让机器读懂我们的手势,是实现人机交流的新桥梁。
《中国图象图形学报》第七期封面描述了一个儿童手势识别的应用场景。对于尚不擅长语言表达的儿童、身体虚弱的老人以及一些病患而言,手势识别能极大的方便他们的生活。对于普通人而言,则可以很好的提升其生活质感。
引用格式:Bao W X, Xie D W, Zhu M, Liang D.Gesture recognition based on aggregate channel feature and dual-tree complex wavelet transform[J]. Journal of Image and Graphics, 2019, 24(7): 1067-1075. [鲍文霞, 解栋文, 朱明, 梁栋. 结合聚合通道特征和双树复小波变换的手势识别[J]. 中国图象图形学报, 2019, 24(7): 1067-1075.][DOI: 10.11834/jig.180504]
主题词:聚合通道特征;双树复小波变换(DTCWT); 方向梯度直方图(HOG)特征; 二值模式(LBP)特征; 特征融合; 支持向量机(SVM)
全文链接:
http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20190706&flag=1
这是一个挑战
理论上讲,手势识别就是通过检测提取图像或视频流中对象的手部特征信息,分析手势对应的类别,从而对相应领域提供技术支持。
但现实是,图像或视频场景中人体背景复杂多样,干扰信息数不甚数。由于人的随意性,传入摄像头中的光线、手的角度、与摄像头的距离等都具有多样性。
因此复杂环境下,高精度且实时的手势检测和识别仍是一个巨大的挑战。现有的手势识别算法难以得到大量的应用,也不能完全满足现实要求。
针对这一问题,封面论文改进了传统机器学习相关算法,进行复杂环境下的手势识别研究。
(图片来自网络)
让我看到你的手:实时手部检测
Step1基于多通道特征提取的目标检测算法以ACF(中文或英文全称)为图像特征,构建特征通道金字塔,通过滑动窗口提取图像的ACF特征。
Step2使用由决策树构成的弱分类器Adaboost来训练特征,并做出手势是否出现在窗口中的判定。
Step3 使用NMS(Non-Maximum Suppression)算法得到唯一检测窗口,即为最优的手势位置。
你想说的我都懂:基于双树复小波变换的手势识别
传统的手势识别算法大部分都是在空间域或时间域上进行特征提取,但图像的空间频率往往很繁琐,有冗余信息,妨碍提取判别特征,或提取到的特征维度较高,导致特征提取效率降低,不能保证实时性。
封面论文采用双树复小波变换在频域上对图像进行高低频系数提取并分别计算高低频上的特征。将特征融合,实现双特征识别,使特征更鲁棒,排除了因光线、旋转等因素带来的影响。文章方法的平均识别精度达到95%左右,平均识别时间为63.44ms。
手势识别示意图
作者介绍:
鲍文霞,副教授,主要研究方向为计算机视觉、模式识别。E-mail: bwxia@ahu.edu.cn
解栋文,硕士研究生,主要研究方向为图像处理及模式识别。E-mail:xdw0727@163.com
朱明,副教授,主要研究方向机器学习、图像处理。
E-mail:zhuming@ahu.edu.cn
梁栋,教授,主要研究方向为图像处理、计算机视觉。
E-mail:dliang@ahu.edu.cn
安徽大学计算智能与信号处理教育部重点实验室依托安徽大学于1999年筹建。实验室的重点研究方向为信息感知和智能处理的计算方法。目前建成的公共平台有智能计算实验室、计算信号处理实验室、安徽省工业图像处理与分析重点实验室、物联网频谱感知与测试工程技术研究中心、农业生态大数据工程实验室等。
2019年9-11月图像图形会议集锦
本文系《中国图象图形学报》独家稿件,
欢迎读者转发朋友圈
文章部分配图来自网络,仅供学习交流,
版权属于原作者
编辑:狄狄
指导/审核:梧桐君
声明
前沿丨观点丨资讯丨独家
扫描下方二维码 关注学报公众号
中国图象图形学报 | 订阅号