2019“中国法研杯”司法人工智能挑战赛(CAIL2019)开始啦
经过几个月的精心筹备,“2019‘中国法研杯’司法人工智能挑战赛(CAIL2019)”终于正式拉开帷幕。诚邀学术界和工业界的研究者和开发者积极参与,对于比赛中发现的重大基础性问题,在国家自然科学基金专项资金中将予以重点考虑。
在去年的比赛(CAIL2018)中,我们构建了全球最大的司法文本数据集,包括涉及183条刑事罪名的215万法律文书,并对这些文书中所涉及的罪名、法条及罪犯的刑期进行了标注。比赛引起了学术界和科技界的广泛关注,共有来自全球各地的200多支参赛队伍参与了比赛并取得了成绩,从基线模型到获奖模型,各个任务的正确率也得到了显著的提高。推进了自然语言处理技术在司法方面的应用和进步。
竞赛详情
CAIL2019将司法领域内的常见需求与自然语言处理领域内具有挑战性的问题进行相应的结合,共设置了阅读理解、要素识别、相似案例匹配三项赛题:
阅读理解任务
要求选手们的模型通过对文书的读取分析,回答针对文书中部分信息,比如时间、地点、人物关系的提问。该任务旨在通过机器阅读理解裁判文书,智能化的辅助人类获取所需信息。
要素识别任务
要求选手们的模型针对文书中每个句子进行判断,识别其中的关键案情要素。该任务的结果可以用于案情摘要等实际司法业务中,有着很强的应用价值。
相似案例匹配任务
要求选手们的模型对文书之间的相似度进行计算,从候选集文书中找到与询问文书最为相似的一篇文书。该任务的结果可以帮助法官查询相似案例的判决结果,方便司法实践中的同案同判的实现。
今年的赛题相较去年的难度有所增加,与上届赛题相比,不再是一般的文本分类任务,对技术的要求更高,更加具有挑战性。
在赛题数据方面,因为这次比赛的3个题目的差异较大,所以相应使用的数据也不尽相同。我们的数据均来自“中国裁判文书网”的已公开文书,并经过了脱敏处理,隐去了相应隐私信息。从三个任务的数据来看,阅读理解任务的数据涉及较广,包含多类刑事和民事一审裁判文书;要素提取任务的数据涉及婚姻家庭、劳动争议、借款合同这三类案件;相似案例匹配任务的数据涉及民间借贷、知识产权纠纷和海商海事这三类案件。为了向参赛者们提供更好质量的比赛数据,我们主办方在数据标注工作上也做了更大的努力。
比赛设置
选手们通过发放的小规模数据进行模型编写调试,成绩好于baseline的队伍可以进入下一阶段的比赛。
2复赛阶段:2019.6.15-2019.7.15第一阶段晋级的队伍可以下载到更大规模的数据集,并进行新一轮的模型调整和测评,这一轮的成绩将计入最终比分。
3封测阶段:2019.7.15-2019.7.25将使用新的数据对第二阶段选手们提交的最终模型进行测评,和第二阶段的成绩一起计算,得到最终成绩。
技术交流和颁奖阶段
组织单位
为了保证比赛的公平性并分散测评工作的任务压力,大赛组委会采用了企业+科研单位共同负责的模式,以保障大赛的正常进行。
指导单位
最高人民法院信息中心
中国中文信息学会
共青团中央青年发展部
主办单位
中国司法大数据研究院
中国中文信息学会社会媒体处理专委会
中国中文信息学会计算语言学专委会
中国中文信息学会语言与知识计算专委会
中国中文信息学会评测工委会
中国电科科技部
中国电科团委
承办单位
阅读理解:
哈尔滨工业大学
社会计算及信息检索研究中心
科大讯飞股份有限公司
要素识别:
北京大学
计算机科学技术研究所
中国科学院自动化研究所
模式识别国家重点实验室
北京国双科技有限公司
相似案例匹配:
清华大学
自然语言处理与社会人文计算实验室
中国科学院软件研究所
中文信息处理研究室
北京幂律智能科技有限责任公司
指导委员会
许建峰 最高人民法院信息中心主任
张 龙 中国电科科技部副主任
王 珩 中国司法大数据研究院总经理
申卫星 清华大学法学院院长
孙茂松 清华大学教授、清华大学人工智能研究院常务副院长
刘 挺 哈尔滨工业大学教授、哈工大人工智能研究院副院长
林鸿飞 大连理工大学教授、大连理工信息检索研究室主任
孙 乐 中国科学院软件研究所研究员、中国中文信息学会副理事长
赵 军 中科院自动化研究所研究员
李涓子 清华大学教授
王士进 河北省讯飞人工智能研究院院长、科大讯飞研究院副院长
评测委员会
刘知远 清华大学
胡 振 中国司法大数据研究院
刘 铭 哈尔滨工业大学
伍大勇 科大讯飞股份有限公司
崔一鸣 科大讯飞股份有限公司
王宝鑫 科大讯飞股份有限公司
冯岩松 北京大学
刘 康 中国科学院自动化研究所
韩先培 中国科学院软件研究所
涂存超 北京幂律智能科技有限责任公司
张天扬 北京幂律智能科技有限责任公司
参赛方式
报名时间:
2019年5月13日-2019年6月30日
报名方式:
目前比赛报名已经开始,大家可以访问我们比赛的官网,http://cail.cipsc.org.cn进行报名。
参赛对象:
相关领域的个人、科研机构、高等院校、企业单位等人员
联系方式:
邮箱:cail@cjbdi.com
官方讨论群:QQ群237633234。
奖项设置
为了提高大家的积极性,我们今年的比赛为最终的优秀团队准备了中国中文信息学会认证的获奖证书及丰厚的奖金。今年预计于10月在北京举办颁奖会和技术研讨会。诚邀学术界和工业界的研究者和开发者积极参与。
一等奖
共一名,20,000元奖金(税前)+获奖证书
二等奖
共两名,10,000元奖金(税前)+获奖证书
三等奖
共四名,5,000元奖金(税前)+获奖证书
点击下方“阅读原文”可进入比赛官网
来源:中国司法大数据研究院公众号
本期责编:范友健
让我知道你“在看”