查看原文
其他

直播预告 | 58同城&来也科技NLP技术沙龙

58同城AI Lab 58AILab 2023-12-21


58同城&来也科技NLP技术沙龙

6月22日、6月30日、7月6日,来也科技、58同城AI Lab联合AICUG技术社区举办58同城&来也科技NLP技术系列沙龙,由来自来也科技的3位嘉宾和58同城AI Lab的3位嘉宾为大家分享NLP技术的应用实践。


活动信息
活动:58同城&来也科技NLP技术沙龙
出品:来也科技CTO胡一川、58同城AI Lab负责人詹坤林
嘉宾:58同城宋玉美、桑海龙、杨森;来也科技张原、张晓庆、段沛宸
主办:58同城、来也科技、AICUG
时间:6月22日、6月30日、7月6日晚18:30~20:20,每晚两场分享
地点:网络直播间,报名流程如下


6月22日

1. 文本视觉认知问答 | 18:30

智能自动化场景中,大量文档以扫描图片的形式存在。而在具体业务中,用户又经常以提问的形式询问这类文档中的内容。这一任务区别于文档阅读理解,因为原始文档具有结构化信息。同时也区别于传统的视觉问答,因为图片基本以文字内容为主,需要对文字内容具有深入的理解能力。本次分享以一次实际的文本视觉认知问答比赛为例子,详细讲述了针对这类问题的流水线结构,以及不同设计对最终结果的影响。

张原

来也科技 | 算法工程师

张原,硕士毕业于伦敦大学学院机器学习专业,本科毕业于清华大学电子工程系。于2019年2月加入来也作为自然语言处理算法工程师,主要负责探索强化学习在对话系统中的应用,预训练语言模型在业务场景中的实现。

2. 语音机器人中应用端到端模型控制话术跳转 | 19:25

语音机器人即利用语音识别、语义理解和语音合成技术赋予机器多轮对话交互能力,使机器能模拟真人与用户对话,它可以代替或辅助人工来完成一些例程化工作,被广泛应用于产品营销、服务通知、用户调查等多种场景。本次议题将首先介绍58语音机器人的总体架构,然后介绍基于规则、文本匹配的对话跳转策略,最后介绍一种基于端到端模型的对话跳转策略,并比较不同方法的线上实际效果。

宋玉美

58同城 | 算法高级工程师

宋玉美,58同城AI Lab算法高级工程师,2019年7月硕士毕业于大连理工大学,毕业后加入58,目前主要负责智能语音分析平台、智能语音机器人项目中的算法研发工作。


6月30日

1. NER技术在对话系统中的应用实践 | 18:30

在58同城C端用户和B端商家IM微聊在线沟通场景下,我们应用对话机器人打造了商家智能聊天助手,在人机对话过程中我们需要识别出电话、地址、时间、服务对象等商机信息。本次议题将重点分享对话场景下的NER技术实践,首先介绍模型选型,然后介绍数据增强、模型融合、对话上下文引入等调优经验。

桑海龙

58同城 | 算法高级工程师

桑海龙,58同城AI Lab算法高级工程师,2019年10月加入58同城,目前主要负责智能客服算法研发工作。2017年硕士毕业于哈尔滨工业大学,曾就职于猎豹移动,从事多轮对话算法研发。

2. 知识图谱及智能问答系统构建 | 19:25

知识图谱在知识表示的完备性、语义刻画的准确性、体系结构的组织性上,显著优于传统Corpus的表示,对于信息检索、推荐系统、问答系统都至关重要,本次议题将以电力行业为背景,分享如何使用深度学习NLP技术挖掘和构建知识,产生行业知识图谱,并结合机器学习和深度学习对知识进行表示、对多种形式的问答进行建模,包括FAQ、KBQA、阅读理解等,验证其在电力领域问答上的效果,同步总结应用过程中的遇到的问题及解决方案。

张晓庆

来也科技 | 资深算法工程师

张晓庆,来也科技资深算法工程师,2016年加入来也,目前主要负责FAQ问答、知识图谱构建及推理、智能文档后处理纠错等项目的算法研发和优化工作。曾就职于百度NLP,负责度秘聊天语料的挖掘优选工作,2013年硕士毕业于武汉大学计算机应用专业。

7月6日

1. 低资源问答实践 | 18:30

在对话机器人领域,检索匹配式问答是工业场景中最为常见、可控性最高的解决方案。然而在实际落地过程中,难免会遇到场景复杂度高、需要占用大量人力资源构造相似问题和规则来泛化知识点的问题。本次议题主要分享机器学习和深度学习在吾来低资源问答上的应用,以及模型量化和模型蒸馏对模型性能的提升。

段沛宸

来也科技 | 算法工程师

段沛宸,来也科技算法工程师,2018年加入来也科技,目前主要负责吾来对话机器人问答方向优化、机器阅读理解和实体关系抽取等项目的研发和优化工作。曾就职于浦发银行,2015年本科毕业于中山大学信息管理与信息系统专业。

2. 改进的Wide&Deep模型在文本分类中的应用 | 19:25

语音是58同城用户之间的重要沟通媒介,58同城C端用户和B端用户之间可以通过电话(隐私通话)、网络音视频通话(微聊)建立连接,这些场景下产生的语音数据有巨大的挖掘价值。本次议题主要分享语义标签的文本挖掘技术,首先介绍使用主动学习技术解决冷启动时样本少的问题,然后对比了关键词匹配、XGBoost、TextCNN等模型的效果,最后提出了一种改进的Wide&Deep模型,在我们的场景下取得了最优效果。

杨森

58同城 | 算法高级工程师

杨森,58同城AI Lab算法高级工程师,2019年7月硕士毕业于中国科学院大学,毕业后加入58,目前主要负责智能语音分析平台、智能语音机器人项目中的算法研发工作。



欢迎关注AICUG公众号:

欢迎关注来也科技公众号:

欢迎关注58技术公众号:

欢迎关注AI Lab

58同城AI Lab隶属TEG技术工程平台群,旨在推动AI技术在58同城的落地,打造AI中台能力,以提高前台业务人效、收入和用户体验,目前部门人数规模为60+,包括产品经理、后端、数据、算法开发人员。

部门介绍:58同城AI Lab部门介绍
部门历史58同城 TEG AI Lab 成立三周年纪念
招聘信息58同城AI Lab招聘产品经理、开发工程师

部门微信公众号:58AILab

AI Lab公众号二维码

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存