好未来AI团队斩获UbiComp 2020国际竞赛冠军 探索下一代字符识别技术
近日,全球人机交互与普适计算领域顶级会议UbiComp2020(The ACM International Conference on Pervasive and Ubiquitous Computing)公布了竞赛成绩,好未来AI中台机器学习团队从全球50多支优秀参赛队伍中脱颖而出,以显著优势夺得冠军。
再夺国际冠军,展示中国AI竞争力
UbiComp竞赛是UbiComp2020会议的重要组成部分。该竞赛由UbiComp组织,埃尔兰根大学机器学习和数据分析实验室、弗劳恩霍夫集成电路研究所联合主办。近几年,UbiComp的参会者及团队数量高速增长,其中不乏谷歌、亚马逊、微软、阿里巴巴、腾讯等国内外领先互联网研究机构及企业。今年,埃尔朗根-纽伦堡大学、杜伊斯堡-埃森大学等50多支专业团队参赛。
本届竞赛以面向教育领域的前沿探索为主题,要求参赛者不依靠传统的图像识别技术,直接利用智能笔书写轨迹信息,并对相应的书写内容进行字符识别。经过两轮的激烈角逐,好未来AI中台机器学习团队最终获得冠军,向世界展现了中国教育AI技术的硬实力。
现阶段,OCR(光学字符识别)技术是大部分企业经常采用的文字识别技术,一般需要对书写的最终结果进行拍照后识别。但这一过程容易受光线、阴影、拍摄角度、清晰度等因素影响,且完全忽略了书写过程、动作及习惯等信息,导致识别结果不够精准。
比赛中,好未来机器学习团队完全不依赖OCR技术,而是使用E-RTCR模型,并融合两种前沿深度学习模型R-Transformer与CRNN,成功地捕获了智能笔中的多模态传感器信号、学习数据中的局部突变特征与整体趋势特征,即直接对智能笔的传感器原始数据,包括书写轨迹、角度、速度、加速度、停顿、笔画等书写过程进行建模识别。
相比使用OCR技术直接对图像进行分析,该方法克服了传感器信号极端抽象、不同人书写习惯迥异、多传感器信号分布差异大等难题。好未来机器学习团队最终以评分远超第二名的优异成绩夺冠。
(好未来机器学习团队以远超第二名的优异成绩夺冠)
随着人们对教育体验提升的不断追求,智能笔等硬件设备逐渐开始在教学场景中投入使用。这类设备既能保留学生的纸面书写习惯和自然感受,又能保证书写轨迹、角度等信息被实时记录。好未来机器学习团队自主研发的、业内领先的基于传感器信号时间序列的字符识别技术,为教学场景的数据分析、内容识别、自动批改等打下了良好的基础。
加大科研投入,夯实研究能力
自成立以来,好未来始终秉承“爱和科技让教育更美好”的使命,致力于让每个人都能享有公平而有质量的教育,不断加大科技研发投入。2019 年 8 月,科技部批准依托好未来建设智慧教育国家新一代人工智能开放创新平台。
依托于智慧教育国家新一代人工智能开放创新平台,好未来AI中台不断加强底层学术能力的构建,在与国内外优秀高校保持密切科研学术合作的同时,也在各技术细分领域的全球最高学术舞台上,展示了中国教育AI的领先实力。如,好未来AI团队的数十项学术成果入选AAAI、WWW、AIED、NCME等国际顶级学术会议,获世界计算机视觉领域顶级会议CVPR-EmotioNet竞赛冠军。在纽约国际人工智能顶级会议AAAI上,好未来AI团队成功组织了首届AI for Education学术研讨会,推动教育AI领域的国际学术交流。
近年来,好未来AI中台不断取得前沿核心技术突破,并在语音技术、视觉理解、知识图谱等AI能力持续积累的基础上,实现多项技术的产品化应用,打造了包括AI课堂、教学过程评估、口语表达能力评测、作业拍搜批改等创新产品解决方案,覆盖“教、学、测、练、评”各教学环节。
截至目前,好未来已拥有100余项针对教育行业的AI能力。其中,行业领先及独有的模型数达到半数,周均调用量达到5亿以上。好未来表示,将持续向全行业开放AI+教育实践成果,全面赋能行业伙伴,共同推动实现公平而有质量的教育。
本文始发于“好未来科教频道”公众号
更多精彩,请关注“好未来技术”