其他

电子科大PhD:基于深度学习的中文唇语识别 | 学术青年分享会

2017-10-17 不灵叔 AI研习社


分享背景

唇语识别,即通过运动的嘴唇,识别其说话内容。通过LSTM模型将CNN抽取出来的图片特征进行时序建模,最后引入Seq2Seq的翻译模型将发音转换成汉子。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),随后对中文唇语识别展开详细讨论。


《Lip Reading Sentences in the Wild》


论文地址:https://arxiv.org/abs/1611.05358


《LipNet:sentence level lipreading》


论文地址:https://arxiv.org/abs/1611.01599v1



分享主题

基于深度学习的中文唇语识别



分享人简介

戴锡笠电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。


分享时间

北京时间10月18日(周三) 20:00 



参与方式

扫描海报二维码,点击底部菜单


如果你觉得活动不错,欢迎点赞并转发本文~

                 ▼▼▼   

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存