学而思参与发起的全球大模型数学解题竞赛,结果出来了
近日,国际人工智能会议AAAI2024智慧教育研讨会在加拿大温哥华召开,好未来作为活动的发起方之一,深度参与了这次精彩的活动。
本次研讨会为期两天,以搭建创新与责任桥梁为主题,旨在探讨人工智能尤其是生成式人工智能在教育应用中的创新与责任伦理。
此前,好未来(学而思)、联合谷歌、暨南大学等多家知名科技企业及高校的专家学者,依托智慧教育国家新一代人工智能开放创新平台,启动的AAAI 2024 全球大模型数学解题竞赛,也在此次会议期间发布了比赛结果。
国际先进人工智能协会(Association for the Advancement of Artificial Intelligence, AAAI)是人工智能领域的主要国际学术组织之一。该协会主办的AAAI年会(AAAI Conference on Artificial Intelligence)是国际顶级人工智能学术会议之一。
聚焦生成式人工智能,深度探讨创新与责任
过去一年中,最热门的话题莫过于以大语言模型为代表的生成式人工智能。随着全球大模型热的流行,有关其创新应用与责任伦理等问题成为了关注的重点。为此,来自智慧教育国家新一代人工智能开放创新平台、好未来、谷歌、普林斯顿大学、暨南大学等全球领先科技公司和科研机构的专家学者、技术研究人员在AAAI2024期间发起“人工智能为教育”研讨会。
针对大模型技术在教育领域的影响,有专家表示,教育者应该积极拥抱大模型而非抵制他们,禁止学生在完成作业时使用大模型就像20年前禁止互联网的应用一样徒劳。教育者应该重新设计作业,而非把精力花在发现作弊人员身上。
更有专家表示,大模型的出现让人们看到了教育的未来——每个学生都有一个与之相匹配的家教,他们更懂得孩子的需求,也知道如何让孩子更为投入。
全球大模型数学解题竞赛落下帷幕,120支队伍同场竞技
为了提高大语言模型的数学和科学推理能力,中国领军科技公司好未来(学而思)、联合谷歌、暨南大学等多家知名科技企业及高校的专家学者,依托智慧教育国家新一代人工智能开放创新平台,于2023年10月启动AAAI2024全球大模型数学解题竞赛。
会议期间,主办方还正式对外发布AAAI2024全球大模型数学解题竞赛正式发布比赛结果。这是全球首个围绕大模型数学能力的比赛,要求参赛者用大模型对给定的数学题目,生成推理步骤与答案,吸引了来自全球多个国家、地区的120多支队伍参加。历经4个多月的激烈竞争,CPDP-ICST 、cogbase 、MathEducators 、CTYUN-AI 、zuiii 、shengkai 、loveisp 、数学解题推理等8支队伍最终胜出,赢得比赛。
为了更好地探究各类大模型在不同语言上的数学能力,主办方将比赛设置中英文两个赛道。由好未来提供比赛所用的中英文数据集——TAL-SAQ7K-CN、TAL-SAQ6K-EN,囊括了国内外多个中小学数学竞赛真题。
(中文赛道调用第三方大模型比赛结果)
(中文赛道未调用第三方大模型比赛结果)
(英文赛道调用第三方大模型比赛结果)
(英文赛道未调用第三方大模型比赛结果)
一直以来,数学都被视为人工智能的试金石。目前,大语言模型在应对数学推理方面问题时仍然有很多挑战。智慧教育国家新一代人工智能开放创新平台相关负责人表示,教育作为大模型最先落地应用场景之一,当大模型数学能力得到突破时,将能够带来长久性甚至革命性的变革,能够让更多的人享有更多优质教育资源,真正实现大规模个性化教育。此次支持发起全球大模型数学解题能力竞赛,希望能够借助平台的力量,积极推动科技创新,让更多的人可以享受到科技进步的红利。