查看原文
其他

ICDM 2019 | Speech&NLP教程,195页PPT带你从入门到精通(附下载)

龚诚Angel 滴滴科技合作 2021-09-05

点击上方“蓝色字体”,选择“置顶公众号

精彩内容,即刻送达


导语

11月10日,在ICDM上,滴滴AI Labs负责人叶杰平教授、自然语言首席科学家Kevin Knight教授、自然语言处理和数据挖掘平台负责人李奘、语音负责人李先刚、研究员韩堃博士带来5.5小时《Speech and Language Processing: New Tools, New Applications》教程,详细介绍了自然语言处理和语音领域的基础内容和应用,以及滴滴的探索及进展。



教程内容下载地址:https://outreach.didichuxing.com/internationalconference/icdm2019/tutorial/

(也可点击【阅读原文】获取)



主讲人


叶杰平 滴滴AI Labs负责人、滴滴副总裁,密西根大学教授

叶杰平教授总体介绍整个教程的大纲及NLP和语音在滴滴的应用实例


Kevin Knight(上)滴滴自然语言处理首席科学家,南加州大学教授;李奘(下中);李先刚(下左); 韩堃(下右)在ICDM教程现场



教程大纲


近几年自然语言处理(NLP)在深度学习浪潮下取得了突破性的发展。许多新的模型层出不穷,这其中包括预训练的词向量,它使NLP任务准确性大幅提高。这些向量可提供有关单词和句子的含义,语法,情感和主题的大量信息。本次教程描述了矢量训练方法,并提供了使用此新技术处理非结构化文本数据的许多实际示例。此外还描述跨语言的表示形式和存在社会偏见的问题以及NLP技术在对话理解上的应用。


而对语音处理来说,虽已经研究了数十年,但随着深度学习的兴起,近年来出现了许多突破。本次教程涵盖了语音处理中关键领域的方法,并提供了这项新技术的实际应用。此外本次教程还基于语音的对话理解,讨论了语音和文本结合的多模态方法。



教程摘要


Kevin Knight教授总结了过去5年中在自然语言处理领域的快速进步。教程描述了如何将单词自动转换为适合于机器学习的数值向量。Kevin还展示了如何处理单词序列,并且重点提及庞大的预训练NLP模型(如BERT),此模型通过简单的微调便可执行其他NLP任务。


基于在自然语言处理领域的技术积累,滴滴AI Labs研发了一套Pipeline来处理海量平行语料的提取和清洗,以及句子对齐和语料拼接等流程。这个框架中包含了一套新颖的过滤机制来解决语料噪音的问题,这个机制在过滤掉较少语料的同时,也大幅提高了精度,此外在句子对齐模型上也有创新。目前这一翻译模型已经广泛应用于日本滴滴出租车的司乘实时消息场景,帮助日本出租车司机和使用中文的乘客更顺畅地进行沟通,相关翻译结果准确度已经行业领先。




李奘在教程中介绍了如何基于文本向量来解决常见的NLP问题,例如文本分类、文本对齐、文本相似性判断,以及常见的信息抽取任务例如搜索等等。随后将文本学习扩展至图神经网络,首先介绍图挖掘技术的两种主流方法-图嵌入和图神经网络的思想和趋势,并基于智能客服场景展开介绍了自然语言处理及图神经网络的一些应用,包括对话机器人、推荐系统、知识点挖掘、智能回复辅助以及智能摘要生成等。摘要生成的相关算法实践也被写入《基于深度学习自动生成客服对话摘要》论文被KDD2019接收。


相关文章滴滴KDD2019论文详解:基于深度学习自动生成客服对话摘要





语音识别技术将语音转化为文字,是语音数据分析中非常关键的一步。本教程中,李先刚从基于GMM-HMM,DNN-HMM,以及端对端建模等角度介绍语音识别的技术演进,对比不同建模方法的差异,并针对近年来的研究趋势,重点介绍端对端语音识别算法,尤其是基于Transformer的语音识别技术。李先刚在教程中详细分享了近期滴滴AI Labs的语音组提出的无监督预训练方法。此种方法又称为masked 预测编码(masked predictive coding,MPC),可以应用于基于 Transformer 模型的无监督预训练,堪称语音届的BERT。论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。


论文链接https://arxiv.org/pdf/1910.09932.pdf

相关文章语音版BERT?滴滴提出无监督预训练模型,中文识别性能提升10%以上





对话理解(conversational understanding)是对话系统中的核心模块之一。韩堃在教程上对各个模块涉及的模型算法进行讲解,从经典方法到最近的深度学习的方法都进行了全面的介绍。对话理解目前已经在滴滴客服,语音接单等领域实际应用。此外,韩堃也针对基于语音的对话理解,讨论了语音和文本结合的多模态方法。教程的最后介绍了滴滴开源的基于深度学习的语音和NLP的机器学习训练与部署平台DELTA,此平台今年ACL 2019上首次发布,一度登上GitHub热榜 。


相关文章滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署无缝衔接

可以登录GitHub https://github.com/didi/delta了解更多


(教程PDF可点击【阅读原文】获取)



相关阅读

AAAI 2019 | 滴滴详解交通出行中的人工智能 多项算法模型亮相

ICME 讲习班 《CV in Transportation》,177页PPT带你了解出行领域的计算机视觉技术

KDD 2019教程 |《深度强化学习在交通领域的应用》,带你知晓DRL在交通领域最新进展 (附PPT下载)

IJCAI 2019 | 4小时244页《AI in Transportation》教程带你系统梳理人工智能在出行领域的应用




编辑 | 贺贺


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存