查看原文
其他

NLPCC 2022 诚邀参赛!思必驰-千言 对话文本分析评测比赛报名进行中!

AISpeech 思必驰 2023-09-02

NLPCC是自然语言处理及中文计算领域的国际学术会议。NLPCC 2022也将继承往年大会活动优势,组织多种学术活动。就此,思必驰(www.aispeech.com)与千言开源数据集项目(www.luge.ai)联合举办首届“对话文本分析评测比赛”,并发布模拟对话场景数据集。



报名链接:

https://aistudio.baidu.com/aistudio/competition/detail/162/0/introduction

竞赛详情链接:

http://tcci.ccf.org.cn/conference/2022/cfpt.php TASK6


传统文本分析是在篇章级、段落级甚至句子级分析意图、理解内容、挖掘有价值信息,而对话文本分析任务则是在对话中挖掘明显的和潜在的信息。在对话领域,对话角色多变,使句子间的交互关系多样化,对话主题也随之复杂多变,这使得对话文本分析极具挑战。


本次比赛在NLPCC 2022官网发起,现已启动报名并发布训练数据,获奖者不仅可获得NLPCC和CCF-NLP双重认证证书,亦有机会在NLPCC 2022发表论文。



任务详情

随着语音和对话技术的发展,大量的语音对话数据产生出来,这些数据中蕴含了丰富的价值信息和知识,比如对话参与者讨论的主题、对话的摘要都是近年来学术界和工业界研究的重点。在实际应用中,对销售场景对话信息的深入分析可以提升销售人员的服务质量,也可以评估消费者的购买意愿和兴趣点。


本次比赛以销售领域的对话为基础,提供两个对话领域的典型任务:

1

对话主题抽取 [1]

2

对话文本摘要生成 [2]


对话主题抽取任务,即给定一篇完整客服和客户的文本对话记录,要求从中抽取谈及的主题。


对话文本摘要生成任务,旨在总结销售时关注的问题,以便于销售审核、理解和掌握客户的核心需求。该任务的角色是销售和客户,输入是多轮对话的形式,输出是该对话中客户关注的问题的总结。


以下描述一个具体的样例:

输入:

客户:那个,聊一下贷款的问题吧?


客服:你首付想大概想付多少?


客户:你家现在不是首付五万吗?


客服:首付的话,咱家能给你做到百分之十


客户:完了剩下的六万三年免息是吗?


客服:一年免息


客户:那你那广告白打了呀?


客服:嗯,咱家第一天是三十个名额,已经完事儿了

参考主题:

一级主题:洽谈商议


二级主题:贷款、首付、优惠 

参考摘要:

客户要贷款并希望能得到优惠


这是取自一个样例片段,对输入的文本,算法需要抽取出主题并生成精简的摘要结果。本赛事将分别采用Micro-F1和ROUGE分数两项指标,综合评估参赛系统的效果。



赛程安排

时间

事项

2022/03/15

开始注册报名

2022/04/05

发布训练数据,开放评测入口

2022/05/05

报名截止

2022/05/10

发布测试数据

2022/05/20

截止提交结果

2022/05/30

发布评测结果



参赛奖励

本赛事获奖者为各子任务的第一名,获奖者将获得NLPCC和CCF-NLP证书。


同时,参赛者也将获得:

1

学习交流机会:在赛事群中与参赛者、组织者深入交流;

2

前沿技术实践:在竞赛平台展开前沿的多任务建模实践;

3

精美礼品&参赛证明:正式报名参赛并提交最终结果的队伍每位成员将获得千言数据集精美的定制周边一份,并发放参赛证明。



参考文献

[1] A Joint Model for Document Segmentation and Segment Labeling.In Proceedings of ACL 2020.

[2] Topic-Aware Contrastive Learning for Abstrac-tive Dialogue Summarization.In Proceedings of EMNLP 2021.




—如有合作意向,请发邮件—

marketing@aispeech.com




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存