实验室成功举办“面向语音教学的发音可视化研究”学术讲座
4月13日下午,人工智能与人类语言重点实验室(以下简称“实验室”)特邀中国社会科学院语言研究所副研究员方强博士为我校师生做了题为“面向语音教学的发音可视化研究”的专题讲座,讲座吸引数千名网友在线观看。实验室首席专家顾曰国教授主持讲座。
讲座开始,方强博士首先解释了发音可视化的发展现状,并通过视频示范发音模型研究对发音训练的意义。在数据库构建方面,方强博士介绍了发音器官形态数据采集手段和发音器官的标注结果,以及如何使用改进的SNAKE进行舌边缘的半自动提取。在发音器官形态建模方面,方强博士讲解了如何构建好的几何模型,分析了半级坐标量化法的不足并提出了解决方案。随后,方强博士细致讲解了在发音器官控制建模方面的基本思想、特点和结果。方强博士也分析了在发音逆推方面的传统方法,并介绍了融合简单语音知识的方法,对比了两种方法在关键发音器官的RMSE和非关键发音器官的RMSE的不同。最后,方强博士展望了发音可视化未来的研究方向,指出发音模型研究框架在流体力学模型、发音运动建模、发音偏误等方面有待进一步完善,并强调该研究在探索实际发音教学方法的实践意义。
讲座最后,方强博士回答了线上听众提出的有关语音教学示范辅助软件和资源的问题。顾曰国教授就多模态数据的底层管理在集成、同步、叠加等层面的技术问题与方强博士进行了讨论,并高度评价了本场讲座科研成果的创新之处。至此,本场讲座圆满结束。
北京外国语大学人工智能与人类语言实验室是教育部首批哲学社会科学实验室。为拓展学术视野,传播知识热点,促进优秀科研成果交流,实验室围绕重点研究领域隔周举办系列高端学术讲座,已形成常态化学术活动机制。欢迎关注实验室微信订阅号,获取讲座资讯和回放视频,我们将持续分享更多实验室研究动态和精彩学术活动!
实验室系列讲座回放