查看原文
其他

汪张龙 等:新基建背景下教育考试数字化转型的路径与前景

汪张龙 李俊杰 中国考试 2022-07-25



原文刊载于《中国考试》2022年第7期第69—76页。

作者

汪张龙,科大讯飞股份有限公司副总裁,广东讯飞启明科技发展有限公司总经理。


李俊杰,科大讯飞股份有限公司高级教育技术研究员。


摘要

  以人工智能为代表的新型基础设施建设,是实现教育考试数字化转型的有效路径,是教育考试高质量发展的基础性支撑。在分析教育新基建和教育考试数字化转型相关背景的基础上,提出教育考试数字化转型的实施路径和以教育考试数字基座为核心的全场景应用框架,重点讨论了教育考试数字化转型的6个关键应用场景及其发展趋势,最后从考试领域整体发展角度,分别对政府、考试机构、技术公司和专家学者等不同角色群体提出了期望与建议。

关键词

教育考试数字化转型;人工智能;新型基础设施;智能考试应用


正文








 0 引言


  在2018年底召开的中央经济工作会议上,习近平总书记首次明确提出“新型基础设施建设”[1](以下简称“新基建”)的概念。不同于传统基建项目,新基建的战略意义在于,它是“第四次工业革命的基础设施,数字时代的新结构性力量,供给侧结构性改革的重要基石,实现全要素数字化转型、全要素生产率提升的有效途径”[2]。目前,我国新基建已经在诸多方面取得突破性进展,如5G技术、新能源、人工智能、大数据中心、工业互联网等,带动了国家经济的转型升级、改善民生能力的大幅提升。教育领域及考试评价作为新基建的重要应用场域,具有广阔的发展空间和前景。

  2021年7月,教育部、发改委等6部门联合发布《关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》,首次使用了“教育新型基础设施”(以下简称“教育新基建”)概念,指出教育新型基础设施是以新发展理念为引领,以信息化为主导,面向教育高质量发展需要,聚焦信息网络、平台体系、数字资源、智慧校园、创新应用、可信安全等方面的新型基础设施体系[3]。加快推进教育新基建进程,助力我国早日从教育大国发展成为教育强国,为我国教育事业的发展带来了新机遇、新动力。

  近些年来,数字化转型的概念越来越广泛地被提及。美国高等教育信息化协会(EDUCAUSE)将数字化转型定义为,通过文化、劳动力和技术深入而协调一致地转变,优化和转变机构运营、战略方向和价值主张的过程[4]。教育部2022年工作要点将“实施教育数字化战略行动,加快推进教育数字化转型和智能升级”列为重点工作[5]。为推进信息化时代的教育变革与创新,引领教育现代化发展,需要大力推动教育数字化转型,实现教育高质量发展。对于教育考试领域来说,教育考试数字化作为教育数字化的重要组成部分,是从数字化社会发展角度思考人才评价与考试实施、创新评价工具和考试内容、优化和升级传统考试环境、推动考试体制和机制创新,最终建立适应智能时代的现代化考试体系的过程。

  对于新基建与教育考试数字化转型之间的关系,新基建的战略意义已表明:新基建是数字时代教育考试变革的重要牵引力量,是实现教育考试全要素数字化转型的有效途径,是教育考试高质量发展的基础支撑。因此,在新基建大背景下,数字化、智能化应用是教育考试数字化落地实施的关键抓手,非常有必要对相关应用框架和重要应用场景进行整体构划与深入研究。








 1 教育考试数字化转型路径


  结合教育数字化转型相关理论研究和多年实践经验,教育考试数字化转型应包括5方面内容,如图1所示。

  第一,建立数据标准体系。从数据分类、数据汇聚、数据管理、数据安全、数据服务等方面,建立包括数据标准、交换标准、认证标准等在内的教育考试大数据标准规范体系,为实现数字资源的互通共享奠定基础。

  第二,建设教育考试新型基础设施,包括:升级优化教育考试专网,融合5G、IoT 等新型网络;创新教育考试终端,变革考试投送方式;改造数字化标准考场,实现无感式入场识别、多样化考试交互、智能化巡考监考、伴随式数据收集,为创新考试评价形式提供支持;建设区域考试评卷数据中心,满足各类考试的阅卷评分需求;等等。

  第三,打造教育考试数字基座,包括:升级建设集约统一的教育考试大数据中心,归集区域各级各类考试数据,实现考试数据开放共享、应用互联复用;搭建考试AI能力中心,为教育考试应用提供智力支撑,实现应用智能化;等等。

  第四,聚焦考试场景需求,创新考试技术应用。场景落地是教育考试数字化转型的关键,必须以场景需求为根本,改造或创新一批可复制、可推广、高质量的考试技术应用,形成转型经验案例和示范场景。

  第五,建立数字化教育考试的机制保障和安全屏障。机制保障和安全屏障是教育考试数字化转型的重要支柱,是转型工作顺利开展和确保考试公平的关键。

  新一代数字化教育考试是以教育考试新基建为基础、以教育考试数字基座为核心、以服务教育考试全场景业务为目的的应用框架。框架主要由教育考试新基建、教育考试数字基座、智能考试应用和相关保障体系构成,具体见图2。

  教育考试新基建,主要包括人工智能、大数据中心、5G、IoT等可应用于教育考试场景的融合基础设施,是数字化转型发展的基础。如果把教育考试比作一台智能化计算机的话,这些基础设施相当于这台计算机的硬件;缺乏相应操作系统和驱动程序,再强大的硬件也难以发挥应有的作用,这就需要教育考试数字基座来实现。

  教育考试数字基座,是专为教育考试场景打造的一套教育考试数字化操作系统,用以实现各类应用的统一管理和数据的统一治理。数字基座是数字化教育考试的中枢和大脑,统一管理人员、设备、数据、应用,实现开放共享、技术集成、应用联动、资源协同。得益于顶层规划设计和规范的考试大数据标准体系,数据资源可以共享互通,打破传统的数据孤岛,有助于推进教育考试的应用创新。数字基座主要包括考试大数据中心、考试AI能力中心、新型网络、基础技术平台等内容。考试大数据中心相当于教育考试这台智能计算机的存储管理软件,AI能力中心相当于CPU,新型网络相当于网络控制器,基础技术平台相当于主板驱动程序,在功能单元协同工作下,这套操作系统驱动教育考试新基建并提供各种智能化考试应用所需的能力。例如,在评卷场景下,数字基座驱动数据中心和智能评卷算法,可以实现主观题智能评分,减轻考试评卷压力;而在考试资源不均衡、突发不确定事件时,数字基座提供快速5G移动化考试能力,能够满足临时性大规模计算机化考试需求。

  智能考试应用是人工智能、大数据分析等技术在教育考试领域中的应用,服务于考试业务全流程,可有效实现考试活动提质增效。同时,随着智能考试应用的不断创新探索与深入融合,将进一步驱动教育考试数字基座的升级与完善,达到创新融合、应用驱动的目的。按考试流程的环节划分,考前应用包括智能题库、智慧考务等,考中应用包括智能化机考、智能语言测试、智能艺术类科目机考、智能体育测试等,考后应用包括智能评卷、智能考试评价等。除终结性评价外,智能化应用还可以实现德育、体育、劳育等项目的过程性评价,帮助构建过程性评价与终结性评价相结合的科学评价体系。

  相关保障体系为教育考试数字化转型有序发展提供保驾护航。数字化转型保障机制包括鼓励场景创新的激励机制、部门联动的工作机制、政产学研的协作机制、网络安全保障的监管机制等。标准规范与安全保障体系包括教育考试大数据标准体系、考试数据开放访问规范、数字化考试安全保障体系等。








 2 智能化教育考试的6大应用场景


  人工智能等新一代信息技术应用,在我国教育考试领域已有一定的实践基础和成功经验,如智能口语评测技术已在大规模中英文口语测试中应用多年并取得了丰硕成果,以5G为代表的新型网络在教育考试管理中也有了初步应用。随着技术与场景的不断深入融合,应用层面对技术提出的要求越来越高,必将推动技术不断发展与进步。基于上述新一代数字化教育考试应用框架和对未来技术发展方向的思考,下面对框架中6个关键应用场景逐一展开讨论。

2.1 智能题库

  智能题库利用人工智能、大数据分析等技术,涵盖题库业务场景,形成命题考试大闭环体系,解决试题查重、命题过程追踪、难度预估等关键难题,并且能够根据学科特征制定灵活的配置策略,满足各类考试命题组卷全业务流程需求。智能题库中的所有试题均按试题内容属性进行完整标注,主要包括试题考查的必备知识、关键能力、学科素养和核心价值4个方面[6]。初中、高中学业水平考试,作为课程教学的指挥棒,要求将核心素养考查作为命题的重要目标,包含完整试题内容属性的智能题库支持基于学科核心素养的命题模式,以引导学校调整教学重点。

  智能题库在高考、研考、自学考试、学业水平考试命题等领域有着广泛的应用前景。以教育部教育考试院的国家题库为代表的智能题库系统,已经发展成为具有征集试题、研磨审校、组卷和统计分析等多功能全流程的信息化系统,为服务保障国家考试命题任务发挥着重要作用[6]。然而,由于不同考试类型的特点和要求不同,智能题库系统仍面临着试题查重、试卷难度控制、试题知识点标注等一系列难题。新一代信息技术的发展,为解决此类问题提供了全新视角。

  在试题查重方面,大量相似试题进入题库不仅会严重影响组卷质量,还会影响考试的权威性和严肃性。现有的查重多基于文字形式,而试题内容多样,还包含公式、符号、图表、声音等,如何实现这类试题查重面临技术上的挑战。基于OCR识别、语义理解、图像识别等技术,实现文本、语义、公式、图片及音频等多种试题内容查重,将是未来查重技术研究的重点。

  在试题难度预估方面,传统的专家预估方法已难以满足新形势下考试内容和形式不断变化的需求。在自然语言处理、图像识别、文本语义识别等人工智能技术的辅助下,以先前试题、考生作答等作为大数据基础,通过人工标注建立训练集,基于深度神经网络的机器学习算法构建AI难度预估模型,经过不断的拓展训练和训练迭代,能够持续提升模型的准确度。新命制试题经过分词、词嵌入、深度表征等步骤,进入模型中,程序会自动计算该题在训练数据尺度上的难度值,从而为命题专家提供参考,对辅助命题及开展相关工作具有一定的积极意义[7]

  在试题知识点标注方面,传统人工标注试题考查知识点的方式需要大量具备专业领域知识的命题专家参与,标注颗粒度不一,且存在主观因素的影响。人工智能技术中知识图谱的构建思想可为试题知识点标注提供参考:首先要对试题文本进行命名实体识别,以获取试题中的概念实体,然后通过实体关系抽取得到实体间的语义关系,以此完成对试题知识点的自动化提取[8]

2.2 智能语言测试

  经过多年发展,语言测试方式、评测方法等都发生了重大变化:从面对面测试到计算机化测试,从人工评分到人机耦合评分,再到人工智能评分,测试效率和质量大幅提升。国家普通话水平测试和中考、高考英语听说考试就是智能语言测试的典型案例。然而,普通话水平测试受困于机位名额限制,英语听说考试仍存在评分结果输出缓慢等问题,究其原因,与网络条件参差不齐、运算能力不够、训练数据不集中等技术条件密切相关。

  随着教育考试新型基础设施的不断建设完善,智能语言测试得以进一步发展,特别是在5G通信加持下,原来受到技术局限的一些测试交互模式逐渐走入实践。例如,人机对话、小组讨论、视频辩论等强交互口语测试模式,甚至目前较为火热的元宇宙概念,这类无限接近现实的互动场景对话类考试模式成为智能语言测试新的发展方向。

  首先,监考模式和数据传输模式将会发生变化。当前以场次形式组织考试,考场数据不能实时传输到云端进行实时汇总和监控;在5G网络条件下,可以进行实时数据传输,实现云端实时汇总统计,进而加快智能评测的步伐,整体提升测试效率。

  其次,从项目分散运算到运算中心集中评测的模式变化。随着互联网技术进一步发展以及在考试中应用逐渐被接受,可以将分散在一个个项目的运算能力,组建成一个集中运算中心,充分发挥运算能力,实现单任务快速运算。另外,以该运算中心为基础,可以将更多的AI能力单位构建成AI能力中心;多种AI能力结合之下,无论从适用度还是准确度上都能更前进一步。

  最后,建设语言数据中心。将各类测试数据全部入库,形成大数据仓库,这些跨区域、跨时间、具有不同特征的数据集合可以作为计算机深度学习的基础库,通过不断地积累和学习,优化通用模型的效果,进而可以逐步实现少量定标或不定标下的评测等。

2.3 智能化机考

  计算机化考试已经在多项考试实践中得到初步应用。相较于传统纸笔考试,计算机化考试具有如下3方面优势:1)结合多媒体信息特征,实现了创新性题型的应用;2)考试实施组织流程标准化,考试组织形式多样化,提高组织效率,大幅降低成本;3)实现评分自动化,减少人为干预,减低风险[9]。然而,当前计算机化考试依旧存在不少局限:在组考组卷方面,传统计算机化考试基于卷库而非题库,做不到试题维度的参数标定,无法实现真正的随到随考和个性化试卷;在考试交互方面,主要依托于键盘鼠标操作,限制了创新性题型进一步拓展;在监考方式上,依旧需要大量人工参与,特别在疫情背景下,考试安全性难以保障。

  未来依托教育考试数字基座提供的核心能力,以及智能题库、智能评分等智能化考试应用的支持,计算机化考试将全面实现智能化。智能化计算机考试(以下简称“智能化机考”)相较于传统计算机考试,将进一步实现组考模式个性化、考试交互多元化、监考方式智能化。

  首先,组考模式个性化。将智能化机考与智能题库融合应用,与当前素质教育及综合测评的理念相结合,依托项目反应理论,为每位学生动态生成个性化试题,真正体现因人施测的理念。实现随到随测,能在较短时间内有效测得学生真实能力,既能精确评估学生能力水平,又能减轻学生考试负担;对每个考生个性化地呈现试题,能够避免考试过程中的舞弊现象,减轻监考人员的负担。

  其次,考试交互多元化。5G技术凭借超高速率、低时延、万物互联等特点,与人工智能、物联网、大数据、区块链等技术结合,将推动计算机考试交互技术的应用升级。屏幕呈现+手写板、屏幕呈现+高拍仪、移动化考试等多种考试交互形式的探索应用,将会让机考作答介质不再限于键盘和鼠标,拓展了智能化计算机考试的题型支撑;尤其是在疫情背景下,智能化机考可以满足同时保障考试实施与疫情防控的双重需求。

  最后,监考方式智能化。随着信息技术的不断发展,考试安全问题较之以往更加复杂。智能化机考将充分利用人工智能技术,用计算机视觉、图像处理、模式识别及深度学习对视频图像进行分析和理解,把考试安全植入每一项与考试相关的规划和环节中。无论是考场内的考试,还是不受时间和地点限制的在线考试,将最终实现无人监考。2021年,因疫情原因,某地中考的某些科目采用了云考试模式。考生通过手机、PAD等终端进行考试,智能化监考系统对考试全过程实时在线录像监控,对设定的违规情景进行智能分析并予以实时警示及上报,有效保障了考试的顺利实施。

2.4 智能评卷

  2010年以来,随着以深度神经网络为代表的新一代机器学习算法的发展,以及文档图像识别、自然语言理解等技术的突破,推动了人工智能评测技术在考试领域的研究应用。在智能扫描阶段,中英文、数学公式手写体扫描图像达到97%以上的识别率[10],为智能评卷的应用推广奠定了基础;在智能网评阶段,系统通过深度神经网络对不同科目、不同试题专家评分标准进行学习,形成科学的主观题评分模型。实践表明:经过学习的评分模型在部分题型阅卷方面具有极高的准确性,智能评分与人工评分一致率在 95%以上,达到评卷教师水平[9]。鉴于当前技术,可以实现主观题智能评分、相似卷智能检测、异常卷评分智能化预警等功能,系统可作为辅助质检模块与传统网阅系统整合,形成纸笔扫描阅卷新模式,打造多样化的评卷质量监控体系,帮助考试管理部门实现评卷工作的中央监控与误差控制。

  目前,智能评卷技术已在高考、中考、学业水平考试、研考、大学英语四六级等项目中成功应用。自2017年开始,安徽省高考阅卷连续多年使用智能评分技术作为辅助评分质检,在空白题检测、高相似度作答检测、作文内容与抄写试卷题干内容或默写范文库现象检测方面发挥了重要作用,对于未来加强评卷管理、改进评分方式具有示范意义。

  随着人工智能技术的发展,基于深度学习的多维度计算机智能评分将会更加准确。就中英文作文评分而言,经过算法优化、数据挖掘、自主学习和应用积累,计算机在文章结构、句法应用、字词表达等维度上对作文的评价将能达到更高水平。针对包含理科复杂公式、图表的特定题型,人工智能技术在转写识别、解题过程逻辑推理准确率等方面仍有提升空间。

  对于未来考试评卷智能化应用,预期主要在以下2方面:其一,智能评卷替代人工一评或部分替代人工评分。鉴于智能评卷系统在文字转写识别上的高识别率,以及建立在自然语义理解等核心算法上的多维度计算机智能评分的高准确率,未来在高中学业水平考试的合格性考试、自学考试及社会证书考试等低利害考试中,可以考虑采用计算机智能评分替代多评模式下的人工评分。这种人机结合的阅卷模式是未来考试阅卷智能化应用的发展方向。其二,智能评卷向多科目、多题型应用扩展。当前,智能评卷已覆盖语文、数学、英语、文科综合等科目,可支持填空、改错、简答、作文、证明等主观作答题型,未来仍需在更大范围建立科学的智能评卷模型,扩大智能阅卷应用科目范围,实现对包含公式和解题过程的特定题型的智能评分,将智能评卷成果向纵深扩展。

2.5 德智体美劳综合素质评价

  2020年10月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》提出坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性[11]

  传统学生综合素质评价采取的主要形式是纸质档案袋,一般通过人工进行数据统计和分析。这种评价存在多主体评价难落实、评价信度难保障、评价资料难处理、评价价值难实现等诸多问题,同时效率低下,且容易出现人为失误。综合素质评价结果作为招生录取的重要参考,若不能真实地反映学生的个性、特长和优势,不能用于预测学生的发展潜能,这样的评价信息参考价值将大打折扣。如何提升综合素质评价的有效性,将其从软参考变为硬挂钩,进一步拓宽多元录取机制,是新高考改革向纵深实施的关键[12]

  教育考试数字基座的建设为德智体美劳的科学评价提供了可能。在智育评价方面,智能化计算机考试模式可实现考试全过程数据的收集与分析。通过记录和分析考生作答行为数据(答题时间、答题反复性等),可以有效反映考生的性格特征、学习特点,为考生提供个性化学习建议。在体育评价方面,随着计算机视觉分析技术、物联网技术、智能穿戴设备的成熟与应用,可实现无感知体质健康数据的采集与监控,精准诊断分析运动行为,智能指导纠正错误动作,促进体育教师精准教学、学生有针对性运动,结合增值评价结果激励孩子参与运动、热爱运动,达到体育育人的目的。在美育评价方面,音乐评价可以借助类似口语考试的方式进行数据采集,通过智能语音测评技术,在音乐体验、知识掌握、音乐表现等方面进行客观准确的评价。在德育与劳动教育评价方面,利用电子档案袋可实时记录学生的学习过程性资料和成长过程,保障评价结果的科学性和公正性。

2.6 智能化教育考试管理

  考试管理模式数字化转变可极大减轻考务组织成本和考务人员工作量,提升科学管理与决策水平。比如教育考试辅助决策系统,通过数据中心平台将各类业务系统数据进行抽取与归集,并按业务归类统计,通过辅助决策系统进行数字地图大屏直观展现,全面掌握区域在各阶段、各业务环节的全考情动态信息,为考试过程中突发事件应急处置与决策提供参考和依据。此外,通过工作流的协同办公软件,管理人员可以在网络上将各种文件、申请、单据在各部门之间进行审批、签字、盖章,大大提高教育考试管理机构内部的办公效率。基于内部即时通信构建的考试机构自动化办公平台,可支持云文档多人在线协同编辑、多任务协同工作、闭环跟踪,高效完成任务目标。在财务报销环节,基于图像识别和自然语言理解的智能报销助手,可通过拍照一图导入发票金额、票号、代码、类型等关键信息,大大节约发票录入时间。以海南省教育考试综合管理平台为例,该平台以考试综合管理门户、考试数据平台、辅助决策指挥为基础,可以统一集成管理各类考试业务,自2020年建成以来已为当地考生提供服务12万人次。

  教育考试业务信息化、智能化的管理对提升教育考试管理工作具有重大意义。教育考试管理的智能化建设不仅是基于业务场景进行软硬件的智能化改造,更是考试理念与考试方式的更新升级,是教育考试管理模式的智慧转型。








 3 推进教育考试数字化转型的建议


  在新一轮科技革命与产业变革中,新基建作为数字时代的新结构性力量,已上升为国家战略。中国是考试的发源地,基于新基建的数字化转型是我国从传统考试大国迈向现代考试强国的必由之路。人工智能等新技术的不断发展进步,将为教育考试数字基座扩展出更强的智力、更快的算力、更广的连接能力,从而为我国教育考试数字化转型奠定坚实的发展基础,数字化教育考试应用框架也必将不断延展其应用的广度与深度。

  我国各行各业数字化转型发展已成大势所趋,在此大背景下教育考试领域的各利益相关群体可以从各自不同角度积极作为,汇聚合力,共同推进我国教育考试数字化转型进程。对于国家及省级教育主管部门来说,应重视考试数字化在教育数字化转型中的重要地位,出台教育考试行业数字化、智能化发展的扶持政策,鼓励教育考试机构应用创新,为教育考试数字化转型提供政策支持和指导。对于各级教育考试机构而言:应充分认识教育考试数字化对于机构长远发展和提升竞争力的战略价值,形成数字化意识和数字化思维,主动加强考试数字化的顶层设计与规划;应强化需求对行业发展的牵引作用,勇于创新技术赋能考试应用,推动相关核心技术不断升级优化;应注重试点应用示范,克服转型融合过程中的阵痛与困难,深化教育考试与数字基座进一步融合。对于考试技术服务公司而言:应主动参与到教育考试数字化转型的规划与实践中,以前瞻性视角持续加大人工智能、考试大数据等核心技术的研发投入;同时,联合考试机构基于场景痛点创新应用开发,真正做到技术的行业落地,助力考试机构减负增效。对于科研领域的专家学者而言,应注重产学研相结合,发挥其在教育主管部门、教育考试机构和技术公司之间的桥梁作用,以智囊角色影响政策制定与出台,以专家角色为考试机构改进业务规划并为技术公司的产品研发提供指导。

  教育考试数字化的转型进程不可能一蹴而就,尤其是当前在我国各地教育考试观念及基础设施条件差异巨大的情况下,仍然有很长的一段路要走。各省市在创新试点智能化考试应用的基础上,可以因地制宜、扬长补短、协同推进,探索走出符合本区域实际特点的教育考试高质量发展之路。相信在上下多方面的共同努力之下,转型战略目标必然能够达成,我国教育考试现代化的宏伟目标一定能够实现。


参考文献


“《中国考试》杂志”

学习强国号



需要本期杂志可长按二维码识别购买。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存