其他
特别报道 | 2022语言与智能技术竞赛(5.30报名截止)
本文摘自中国中文信息学会,点击最下方阅读原文了解更多。
任务设置
段落检索:段落检索是指从大规模语料库中找出相关段落,它是自然语言处理和信息检索领域中的重要任务。传统的检索系统基于倒排索引,采用稀疏段落检索(例如BM25)的方法对查询和候选段落进行匹配,主要考虑关键词的匹配特征,无法处理语义相近但字面匹配程度低的情况;近年来,随着预训练语言模型的快速发展,稠密段落检索方法的性能取得了质的飞跃,逐步超越了传统的BM25等方法。这种方式能够对查询和候选段落进行语义级别建模,在问答等语义匹配要求高的场景表现更好。为了进一步推动该方向的研究进展,我们发布首个大规模中文段落检索数据集DuReader-retrieval,该语料来源于真实搜索场景,包含了用户的真实查询和真实文档,任务难度大,覆盖了真实应用中诸多有挑战的技术问题。 知识对话:真实世界的人机交互会涉及大量知识相关的内容,但即使是在参数中存储了大量知识的预训练对话生成系统,在进行细粒度知识聊天时,也容易产生不准确的回复。同时,系统蕴含的知识很难更新,对于用户需求较大的时事聊天,往往表现较差。为了应对这一挑战,本次竞赛提出了利用搜索引擎实时获取知识然后基于该知识进行对话的任务,搜索引擎获取的知识具备时效性高、内容丰富等特点,且经过数十年的技术积淀,能够在给定合适搜索问题时,返回准确的答案。为此,我们建立了开放领域的搜索知识对话数据集,希望系统能够学习1)基于对话历史生成检索query;2)基于对话历史与基于query查询到的知识生成对话回复的能力。希望通过此次竞赛,助力开放域对话技术进一步发展。 情感分析可解释性:深度学习模型常被当作一个黑盒使用,其内部决策机制是不透明的。这种不透明性导致使用者对其结果的不信任,增加了落地难度,尤其是在医疗、法律等特殊领域。近年来,深度学习模型的可解释性受到广泛关注,涌现出很多致力于分析和增强模型可解释性的工作,如模型预测依赖证据提取、基于证据的可信增强等。为了进一步推动该方向研究发展,我们构建了可解释评测数据集和评估指标,用来评测模型的可解释性,及证据抽取方法的准确性。本次比赛提供了情感分析任务的评测数据,所有输入均来自真实用户的评论数据。针对每一输入文本和其标准结果,我们提供了人工标注的词粒度的标准证据,以及从干扰、敏感、泛化等角度构建的扰动数据,旨在从合理性、忠诚性角度评估模型的可解释性。希望通过本次比赛,推动模型可解释性研究进一步发展。 视频语义理解:传统基于感知的视频内容分析缺乏语义化理解能力,而充分利用知识图谱的语义化知识并结合跨模态学习和知识推理技术,有望实现更深入的视频语义理解。本评测任务以互联网视频为输入,在感知内容分析(如人脸识别、OCR识别、语音识别等)的基础上,期望通过融合多模信息,并结合知识图谱计算与推理,为视频生成多知识维度的语义标签,进而更好地刻画视频的语义信息。此任务来源于真实应用需求,提供了中文大规模视频语义理解评测数据集,同时提供了视频相关的知识图谱。任务难度大,考察点丰富,覆盖了真实应用中诸多有挑战的技术问题。
奖项设置
一等奖:20000元+荣誉证书 二等奖:15000元+荣誉证书 三等奖:10000元+荣誉证书
时间安排
2022/3/30:启动竞赛报名,对报名者发放全部训练数据和第一批测试数据,开放评测入口和在线排行榜 2022/5/30:报名截止 2022/6/1:发放最终测试数据 2022/6/10:系统结果提交截止 2022/7/5:公布竞赛结果,接收系统报告和论文 2022/7/30:论文提交截止日期 2022/8:在“语言与智能高峰论坛”上交流和颁奖
注册报名
征文 | 山东省图书馆学会第二十九次科学讨论会征文(3.15截止)
参会 | 第二届科学计量学与信息计量学青年学者论坛第四期(1.7,线上)
征文 | 第十一届上海国际图书馆论坛征文通知
参会 | 第二届“‘京科情’—懂情报•知大势•善创新”主题论坛(1.6,线上)
参会 | 第18届数字图书馆前沿问题高级研讨会(ADLS2021)延期举办通知
参会 | Covid-19 discussions on Twitter: Identifying key issues
会议报道 | 第二届科学计量学与信息计量学青年学者论坛第四期成功举办
参会 | 数位人文与文学研究工作坊(1.29,线上)
参会 | 第二届科学计量学与信息计量学青年学者论坛第五期(1.14,线上)
会议报道 | 第二届科学计量学与信息计量学青年学者论坛第五期成功举办征文 | 2022年 EMIS 工程管理与信息科学国际学术会议(1.27截稿 )
参会 | 第二届科学计量学与信息计量学青年学者论坛第六期(1.21,线上)
会议报道 | (主题一)第二届科学计量学与信息计量学青年学者论坛第六期成功举办
会议报道 | (主题二)第二届科学计量学与信息计量学青年学者论坛第六期成功举办
二月结束或召开的会议
参会 | 教大-台大数位人文工作坊:语料库工具与文本分析 征文 | 首届文博专业图书馆创新发展学术研讨会征文通知 征文 | 第二届物联网与智慧城市国际学术会议 (2.15截稿) 征文 | 2022年区块链、信息技术与智慧金融国际学术会议(2.21截稿) 参会 | 第二届科学计量学与信息计量学青年学者论坛第七期(2.12,线上) 特别报道 | 中图学会关于举办“中华传统文化经典”系列研修班——中西文古籍的装帧与修复专题的通知