首届中文NL2SQL挑战赛圆满结束,产学研携手共推智能交互发展
筹备8个月,初、复赛鏖战3个月,千支队伍角逐,开启数据库交互创新之路。
10月12日,由追一科技主办、南京大学计算机软件新技术国家重点实验室协办的“首届中文NL2SQL挑战赛”总决赛答辩暨颁奖典礼在南京大学举行。经过初赛、复赛的激烈角逐,决赛现场的答辩考评,最终战绩揭晓。
冠军:国防科技大学团队
亚军:国双科技团队
季军:观安信息与妙盈科技联合团队
优胜奖:浙江大学团队 | 华南理工大学与佛罗里达大学团队
国防科技大学选手团队夺得冠军
由中国移动研究院首席科学家冯俊兰博士、复旦大学教授肖仰华博士、新加坡南洋理工大学副教授毛可智博士、南京大学教授俞扬博士、追一科技CTO刘云峰博士等产学研多方代表组成的专家评委团,对选手方案进行了专业、精彩的分析点评,从而产生最终结果。
中国移动研究院首席科学家冯俊兰
复旦大学教授肖仰华
新加坡南洋理工大学副教授毛可智
南京大学教授俞扬
(向右滑动,了解现场评委)
“惊喜、满意、期待”,挑战赛评委代表、复旦大学教授肖仰华点评说,利用自然语言访问关系型数据库里的数据,挖掘大数据价值,一直是业内梦想。“追一科技虽然是一家创业公司,但主动承担社会责任、发起组织这一领域技术比赛。去年开始筹备,携手产学研合作并开放数据集,短短几个月里,就实现了大家多年夙愿。”上千只队伍参赛,让NL2SQL挑战赛成为近期“NLP领域一流的比赛”。决赛5强让人惊喜,92%准确率成绩,表现了选手们扎实的理论功底、对深度学习和自然语言技术技巧的娴熟,更显示目前国内学界和工业界人工智能发展,都到了一个非常好的水平。
追一科技CTO刘云峰博士
作为大赛主办方,追一科技联合创始人兼CTO刘云峰博士表示,NL2SQL是自然语言转换成可执行机器语言的最佳技术路径之一。随着NLP基础能力的发展,更多复杂型的任务挑战成为可能,“众人拾柴火焰高”,追一科技将与更多院校、企业界同仁携手,共同推动中文NLP研究与应用突破。
南京大学人工智能创新研究院院长詹德川
作为高校嘉宾代表,南京大学人工智能创新研究院院长詹德川表示,此次比赛除了选手的热情和参与,更看重比赛的交流机会,“学界和产业界可以进行深入的交流。”他同时表示,产学研携手,“AI的热情不会进入冬天” 。
智能交互,
唤醒沉睡的“数据库”
数字经济的本质是数据驱动。但太多的数据“沉睡”在关系型表格里,而对这些数据的查询通常是使用SQL语言, 对普通人来说是一道不低的门槛,影响了对这些数据的充分利用。
通过自然语言转SQL,有望真正释放数据库价值。
“这也是追一科技发起比赛的初心”,追一科技CTO刘云峰博士表示,追一在服务企业的过程中发现,很多企业的知识和数据都是以关系型数据库的形式存储,例如银行用户的消费记录、基金公司的基金属性、保险公司的保单记录等等,如果想更好地利用,“亟需将自然语言转换成可执行的机器语言技术”。
刘云峰认为,NL2SQL正是非常好的技术实现路径。为了推进相关研究,追一科技发布了业内首个大规模中文数据集,包括4870张表格数据、近50000条标注数据以及相应SQL语句,帮助选手挑战任务。
创新工场董事长兼首席执行官李开复祝贺
这一举动也得到了多方伙伴支持。
“追一在AI商业化应用突破同时,还在不断探索NLP前沿技术的创新。今天在AI与数据库交互上,我们又一次看到了突破,新的想象空间。”对于NL2SQL比赛的发起,创新工场董事长兼首席执行官李开复表示。
这次比赛还获得了南京大学等院校机构、产业伙伴大力支持。南京大学教授俞扬博士,为比赛提供了全程的指导建议。此次活动中,南京大学计算机软件新技术国家重点实验室与追一科技合作,协办比赛,助力产学研合作。
92%准确率,
挑战赛成绩远超评委预期
NL2SQL(自然语言转结构化查询语句)是一个新兴的研究领域。在国外,Salesforce、耶鲁大学等机构曾发布了WikiSQL和Spider数据集,WikiSQL取得了90%的准确率,但在国内,才刚刚起步。
但短短几个月,中文NL2SQL领域研究如火如荼,不断刷新纪录。
本次挑战赛初期,准确率尚为60%多,至8月份初赛结束时,榜上头部分数已经达到89%,有了很大提升。复赛结束时,选手最高成绩达到92%。并且,最终晋级决赛的5支队伍,个个都在“90分”以上。
国防科技大学选手答辩
国双科技选手答辩
浙江大学选手答辩
华南理工大学选手答辩
观安信息选手答辩
(向右滑动,查看5强选手答辩)
“最终选手成绩,完全超出了评委们对于比赛的预期。”作为评委代表,肖仰华表示,实际上中文自然语言转SQL的挑战更大,选手们的成绩“让人惊喜”,他同时期待选手,不要满足于提供一个更好的模型,可以大胆尝试更多融合型创新研究。
产学研协同,
“众人拾柴火焰高”
创纪录背后,是产学研多方协作,“众人拾柴火焰高”的奇迹。
1457支队伍,来自院校、机构和企业开发者多方力量,历时3个多月打磨、探索。
其中,学生及科研人员占比48%,企业技术员工占比52%,最终晋级决赛的队伍中,学生与企业开发者“平分秋色”。并且,院校与院校、企业与企业等联合“组队”挑战,成为比赛的一大亮点。比如5强中的华南理工大学与佛罗里达大学,上海观安信息与妙盈科技等,均为联合战队。
“NL2SQL 是自然语言处理的一个非常重要的应用领域,涉及到多个自然语言处理领域的核心问题”,作为产业界的专家评委,冯俊兰表示,非常高兴看到这么多高水平的队伍参赛,并取得了非常好的成绩,让大家感受到产、学、研共同提升技术的热情。
众多评委还表示,这次比赛有望激发更多人参与推动NLP技术发展。特别是企业界,拥有丰富的数据、场景,在人工智能方法研究上,与学术界可以相互学习。“如果有更多类似NL2SQL这样的比赛涌现,那么NLP爆发将会更快到来。”
相关阅读:
1.首届中文NL2SQL挑战赛决战在即,10月12日AI在南京
2.NL2SQL挑战赛30强决出 中文数据集成绩已接近WikiSQL
● 关于追一
追一科技成立于2016年3月,是中国首批智能语义AI公司,致力于用最前沿的人工智能技术,满足企业对外服务、营销,对内运营、办公等多种场景的智慧化升级需求。3年来,获得招商局资本、创新工场、晨兴资本、GGV等投资,融资共计7000万美元。
公司在业内率先实现AI技术多场景落地。2016年,追一科技就搭建了“技术+场景+服务”的三位一体服务模型,为招商银行、中国移动、南方电网、中国人保、腾讯等300多家行业标杆客户提供智能化升级服务。合作企业人力成本降低50%以上,运营服务效率提升30%以上,营销转化持续提升。
公司深耕金融、政企、运营商等领域,同时,坚持以研发技术作为核心竞争力,布局语义、语音、多模态等智能语义技术。以深圳为中心,先后建立北京、上海、南京、香港等研发基地,并布局新加坡、明斯克等海外人才战略。
追一科技的快速发展也得到了业内和权威机构认可。创新工场董事长兼首席执行官李开复博士评价追一科技为国内乃至全球最好的NLP公司之一。公司连续入选机器之心评选全球30大AI创业公司、工信部中国产业创新榜“最具投资价值50强”、首批智能语音产品国标检测优秀案例、胡润“中国最具投资价值新星企业百强榜”、“安永复旦中国最具潜力企业”种子奖等。
商务合作:yi_partner@wezhuiyi.com
简历请投:recruit@wezhuiyi.com
媒体采访:pr@wezhuiyi.com
官网:zhuiyi.ai