终极十强英雄在此,“达观杯”文本智能处理挑战赛完美落幕
获取本次十强团队现场分享的 PPT 合集,可直接翻阅文章到最下方。
9月17日,“达观杯”文本智能处理挑战赛颁奖盛典在上海正式举行。本次比赛历时74天,由达观数据主办,Datacastle承办、机器之心和浦东软件园协办,并得到了复旦大学、上海交通大学、东南大学的合作支持,以及 CIO 时代、中国中文信息学会、51CTO、CSDN 等行业和媒体合作伙伴的大力支持。
最终比赛角逐出的十强团队:TNT_000_、未提交参与排名、会说话的机器狗、随缘比赛、地表最强、CIKE-华腩鲤、NLPRookie、redhand、彳亍口巴、万里阳光号。颁奖当天十支获胜队伍带着各自在比赛中的技术实践心得前来现场,颁奖盛典也因此成为了精彩的技术交流盛宴。
微软,腾讯,阿里巴巴、百度、京东、携程、小米、中国移动,以及著名金融巨头、运营商等354个国内外知名企业的技术人员,以及来自斯坦福、北大、清华、复旦等国内外知名高校的学生。
3500 3000 14127
在颁奖典礼现场,达观数据创始人陈运文倾心分享了自己曾经参加各大国际算法比赛的经历:“创办达观数据之前,我曾和大家一样,喜欢写算法,打比赛,但在成立达观数据之后,我发现让算法在实际工业中发挥作用需要做更多的工作。想要灵活应用好在学校里学习的基础算法,需要更多的应用练习。这也是我们做达观杯的初衷,给更多算法爱好者提供真实的场景练习,让技术在真实的场景中发挥它最大的价值。探索技术在行业的应用场景是达观数据持续在做的事情。”
本次赛题任务为”建立模型通过长文本数据正文(article),预测文本对应的类别(class)”,本次算法大赛命题人达观数据联合创始人张健也在现场分享了命题的初衷。
自然语言处理一直是人工智能领域的重要话题,而人类语言的复杂性也给 NLP 布下了重重困难等待解决。长文本的智能解析就是颇具挑战性的任务,如何从纷繁多变、信息量庞杂的冗长文本中获取关键信息,一直是文本领域难题。随着深度学习的热潮来临,有许多新方法来到了 NLP 领域,给相关任务带来了更多优秀成果,也给大家带来了更多应用和想象的空间。比赛中达观数据提供了一批长文本数据和分类信息,张健表示,从比赛结果来看,选手们做了非常多的尝试与应用,取得了很好的效果。
十强分享,精彩连连
本次比赛的十强选手,现场分享了他们在比赛过程中的经历,如何对算法调参,如何突破效果瓶颈 ,每支团队分享结束后,观众席中举手提问的人络绎不绝,预计的演讲分享成为了算法交流的盛会。
季军团队CIKE-华腩鲤的成员谈星伟在分享最后总结了他们在比赛中对文本分类算法的发现:
亚军团队:未提交参与排名、会说话的机器狗 代表分享
冠军团队TNT_000_的成员肖小粤在比赛分享了他们的“获胜秘诀”:
颁奖盛典,荣耀时刻
本次比赛主办方达观数据也为各优秀的参赛选手准备了丰厚的奖金和直通面试机会。
比赛有始终,技术交流无止境。
颁奖结束后,季军团队【随缘比赛】成员朱翔宇DOTA表示:
“达观杯”是达观数据发起的,专为技术和算法爱好者举办的线上算法比赛。至今已顺利筹办两届,吸引了4000多名选手参加。从第一届个性化推荐算法挑战赛到本次文本智能处理挑战赛,达观数据希望在技术与应用场景之间搭建互通的桥梁,让优秀的技术在解决实际问题中发挥最大价值。
明年达观杯,我们不见不散。
BOUT
获取本次十强团队现场技术分享的 PPT 合集,请在公众号后台回复【达观杯】获取下载链接。