乡村研究||谢治菊 兰凌云 余燕婷:大数据时代的教育扶贫论析
大数据时代的教育扶贫论析
摘 要:与传统的扶贫方式相比,大数据能够让教育扶贫对象识别精准、资金发放精准、培养过程精准、就业辅助精准和脱贫成效精准。在与其他技术相配合的情况下,大数据教育扶贫平台的优势更为明显,使教育扶贫呈现出精准识别、精细管理、精确监控和科学评估等特征。但实证调研和案例分析的结果发现,教育扶贫领域存在的数据量较小、数据挖掘利用较少、平台数量繁多、数据共享程度不高等弊端,让大数据的价值并未真正发挥,制约了教育扶贫的有效开展。因此,建议未来在系统采集数据信息,全面整合平台数量,有效打破数据孤岛,深入挖掘数据价值的基础上,关注大数据在教育扶贫领域的适用性问题,真正促进贫困代际传递的阻断。
关键词:大数据;教育精准扶贫;教师能力提升;贫困代际传递
文章来源:谢治菊、兰凌云、余燕婷:《大数据时代的教育扶贫论析》,《中国教育政策评论》(CSSCI来源集刊)2021年第1期,上海教育出版社,2022年8月出版。
作者简介:谢治菊 广州大学公共管理学院教授、乡村振兴研究院院长,博士生导师,主要从事贫困治理与乡村振兴研究;兰凌云 俄罗斯高等经济大学硕士研究生:余燕婷 广州大学乡村振兴研究院研究助理。基金项目:本文受2020年国家社科基金后期资助一般项目“大数据时代的贫困治理研究”(项目编号:20FZZB005)一、背景缘起:大数据引领教育扶贫进入2.0时代
教育扶贫理论起源于西方的反贫困理论,在研究反贫困的历史演进里,学者由研究单一的收入致贫转向多元分析,逐渐提出要从人的角度出发来消除贫困。“人们消除贫困的最终目的绝不是为了赋予权利、增加收入和提高能力,而是通过这三种举措来实现人自身的全面发展,从根上消除贫困。” [1]以习近平同志为核心的党中央深刻认识到了这一点,提出了“内源式扶贫”的思想,注重贫困地区及人口发展的内生动力,将物质扶贫与精神扶贫相结合,提出了“扶贫先扶志,治贫先治愚”的理念。确实,贫困人口集聚区长期形成的贫困文化,不仅会让贫困户形成胆怯懦弱的习性,还会影响其下一代的人生发展轨迹,这种贫困文化一日不除,就无法阻断精神贫困所造成的贫困代际传递。要根除这种贫困文化,教育的作用极为重要。让贫困地区的孩子们接受良好教育,具有“教育一人,影响一家,带动一村”的功效,是扶贫开发的重要任务,也是阻断贫困代际传递的重要途径。教育扶贫有很多特点,如覆盖广、效果深、周期长、见效慢、投入大等,但最大的特点,是可以从五个层级来阻断贫困的代际传递,即教育可通过提升贫困学生的神经认知水平、心理认知水平、语言认知水平、思维认知水平和文化认知水平来阻断贫困的代际传递。[2]
研究显示,教育对多维贫困的贡献率高达47.27%。[3]正是认识到教育在脱贫中的基础性、先导性和关键性作用,早在2013年,国务院就下发了专项通知,正式启动教育扶贫工程。2015年,习近平总书记在全面深化改革领导小组会议上明确指出,要大力发展乡村教育,有效阻止贫困在代际之间的传递,定向施策,精准发力;同年审议通过的《中共中央国务院关于打赢脱贫攻坚战的决定》,更是明确将“发展教育脱贫一批”作为“五个一批”脱贫的重要举措,坚决阻止贫困现象代际传递。2021年中央再次强调,虽然“十四五”期间是举全党全社会之力助推乡村振兴,但对摆脱贫困的县从脱贫之日起设立5年过渡期,过渡期内要保持主要帮扶政策总体稳定,教育扶贫力度仍将加大。在此背景下,2013年出台的《关于实施教育扶贫工程的意见》、2016年出台的《教育脱贫攻坚“十三五”规划》和2018年出台的《深度贫困地区教育脱贫攻坚实施方案(2018—2020年)》成为教育扶贫领域最重要的三大纲领性文件。[2]这说明党中央、国务院高度重视教育扶贫工作,有针对贫困户就业能力和自我发展能力专项培训的扶贫举措,有在义务教育阶段改善学生营养、学校硬件设施、提升教师能力的专项举措,也有关于精准招生、精准资助和精准就业的职业教育举措。[4] 当然,教育扶贫如果要实现“精准”二字,就涉及到观念、技术、手段、工具等的系统性变革,需要进行教育工作流程再造,因此,虽然我国在精准化教育扶贫方面取得了较大的成效,但并未完全打破扶贫主体单一、扶贫方式粗放、扶贫过程封闭和扶贫监管滞后等桎梏。[5]为解决这些问题,亟需使用新的手段与技术。
大数据就是这样的手段与技术。大数据拥有强大的分布式存储能力,能够实现传统常规软件无法处理的海量数据的统计、处理、挖掘和分析,可以迅速、高效而稳定地采集、处理、共享海量的数据信息,具有数据量大、类型多、处理速度快、价值密度低等特点。近年来,大数据在教育部门得到了广泛应用。从国外的经验来看,大型教育数据集的分析可以通过两种方法来完成,即教育数据挖掘(educattional data mining, EDM)和学习分析(learning analytics, LA)。教育数据挖掘和学习分析通常用于研究向学习者提供不同教学支持的效果[6],教育数据挖掘还可用于支持学习者的反思并向学习者提供积极的反馈。[7]一如巴拉德瓦伊(B. K. Baradwaj) 和帕尔(S. Pal) 所认为的,这两种方法都可以用来发现信息,帮助教师识别学生中的早期辍学者,并确定在学习中哪些问题学生的行为需要特别关注。[8]为达成这些目的,需要运用大数据对教育行为进行预测与评估。例如,可运用教育数据挖掘和学习分析方法来预测学生在学习活动中的成绩和收益,以反映学生在特定课程中的表现和留存;[9]可运用教育数据挖掘和学习分析手段,评估学生行为和他们的学习效果,并对发现的不良习惯进行深度剖析。[10]按此逻辑,如将大数据技术运用于教育扶贫领域,也可对学生成绩和教师教学水平进行精确评估,进而推动教育扶贫的精细化与科学化。[11]
可以说,大数据技术的蓬勃发展,让教育信息化由1.0时代进入2.0时代,也让教育扶贫从1.0版本转变为2.0版本。之所以这样判断,一是我们参照了“狩猎社会是1.0,农业社会是2.0,工业社会是3.0,信息社会是4.0,超智能社会是5.0”的提法;[12]二是因为与传统的扶贫方式相比,大数据能够实现教育扶贫对象识别精准、资金发放精准、培养过程精准、就业辅助精准、脱贫成效精准,加速助力贫困学生无后顾之忧地完成学业。[13]在与其他技术相配合的情况下,大数据教育扶贫平台的优势更明显。例如,与区块链技术的深度融合,可以提升大数据平台的安全性;与云计算技术相结合,可以提升大数据平台的运行效率;与人工智能技术相结合,可以大幅度提升大数据技术的生产力。[14]因此,借助大数据开展教育扶贫,能够建立“用数据说话、用数据决策、用数据管理、用数据创新”的长效扶贫机制[13],实现精准识别、精细管理、精确监控和科学评估,可以为贫困地区被帮扶教师、学生提供更具针对化、个性化、差异化、智能化的帮助和服务。由此,本文将大数据驱动的教育扶贫称为教育扶贫的2.0版本,即教育精准扶贫阶段。
事实上,各地纷纷开展实践探索,将大数据应用于教育扶贫领域,先后开发了大数据学生资助系统、大数据教师帮扶系统、大数据学生营养餐系统、大数据学生心理服务系统、大数据教学督导系统等十多个与教育扶贫有关的系统。不过,虽然已有研究表明,大数据在促进教育扶贫走向精准化、透明化和科学化的过程中起着关键的作用。但是,这种作用的特点是什么?存在哪些困境?该如何优化?对于这些问题,还缺乏建立在大规模实证调研上的科学判断,也缺乏多案例的对比分析,这为本文的研究提供了契机。
二、案例对比:大数据时代教育扶贫的特点
为系统了解大数据驱动教育精准扶贫的情况,深入提炼有效经验,深度剖析经典案例,自2016年以来,课题组在贵州、云南、宁夏、青海、内蒙古、重庆、四川、广西等10多个省(区、市)开展了大规模实证调查,调查方式主要是问卷调查、案例追踪、集体座谈和深度访谈,其中的典型案例是贵州省的教育扶贫。
贵州省是西部多民族省份,少数民族人口比例为42.8%,2013-2019年,贫困人口从923万人下降到30.83万人,贫困发生率从26.8%下降到0.85%,减贫人数与减贫幅度位居全国前列,脱贫成效显著。[15]同时,贵州省还是全国的大数据中心。贵州省之所以减贫效果较好,与该省的教育扶贫举措有关,更是大数据应用于精准扶贫的直接表现。课题组在贵州省的调研时间为2018年1月-2020年12月。此次调研共分为三个阶段:第一阶段为2018年1月-12月,课题组以教育扶贫咨询专家组的名义,带领10多人持续跟踪该省“Y市帮扶S县的智慧教育扶贫项目”“Y市大数据+教师专业支持发展系统项目”“Y市一中帮扶Z县民族中学项目”三个案例;第二阶段为2019年1月-6月,课题组先后组织50多人到贵州省12个县的教育局、17个乡镇(街道)、42个村庄(社区)开展关于“大数据教育扶贫”的调研,调研范围涉及到宏观、中观和微观三个层面,主要聚焦“大数据教育扶贫的顶层设计与政策体系”“大数据教育扶贫实施状况与经验分析”“大数据教育扶贫的困境与原因”“大数据教育扶贫典型案例与路径探讨”等,调研的方法主要是集体座谈、深度访谈和参与式观察。调研期间,共进行了10余场次的座谈会,参与式观察10余场次大数据教育扶贫的做法,深度访谈了40多名相关人员。其中,政策制定者、教育局工作人员、校长、一线教师、家长和学生是访谈的核心对象和主体人群。调研对象给课题组提供的总结材料、图片视频和文字资料也是本文重要的数据来源。第三阶段为2019年7月-2020年12月,课题组通过参加贵州省教育厅开展的教育扶贫工作总结会、交流会、研讨会与协调会,发放调研问卷1800份,回收有效问卷1624份,问卷回收率为90.2%。调研发现,贵州省教育扶贫具有三个特点:坚持扶贫与扶智、扶志相结合;充分运用了大数据技术;开展系统的组团式教育帮扶模式。由于本文探讨的是大数据在教育扶贫中的应用,所以主要就该省大数据教育扶贫案例进行分析。从座谈的情况来看,教师和学生是教育扶贫的核心主体;从问卷调查的情况来看,71.86%的受访者认为,教育扶贫的最大受益者是学生,63.3%的人认为教育扶贫的最大成效是“促进了学生的进步”。但由于学生的进步与教师有莫大的关系,所以36.58%的受访者认为,教育扶贫首先应该留住优秀的老师,其次是转变教育教学理念,最后是改善硬件条件。基于此,本文拟选择大数据应用于教育精准扶贫中教师帮扶和学生帮扶的两个典型案例来进行分析,这两个案例分别是:第一,贵州省Y市自2017年9月以来就开展的“大数据+教师支持发展系统”,该系统主要运用大数据手段与互联网技术对贫困地区的教师进行帮扶,精准提高了教师的教学能力与教学水平;第二,贵州省T县自2015年以来实施的“大数据+学生资助系统”,该系统主要将大数据应用于学生资助领域,真正做到了精准识别贫困学生,精准发放资助资金,精确监管发放过程和精确评估发放成效。下面以实证调研的素材为依据,以这两个案例为典型,对大数据驱动教育精准扶贫的逻辑与特点进行分析。
案例1:Y市“大数据+教师发展支持系统”
2017年9月,经过多次调研和周密策划,贵州省的Y市教育局联合JSCT智慧教育产业股份有限公司,在S县MZ中学和GX中学建立了智慧教育扶贫项目。该项目涵盖教师、学生、家长三大群体,其中教师使用“大数据+教师发展支持系统”,学生使用“大数据+学生学业成就提升系统”,家长使用“大数据+家校融合亲子系统”。考虑到运行成本和精力投入,项目初始,Y市重点运行了“大数据+教师发展支持系统”,具体做法是以互联网为技术依托,采取点对点的帮扶模式,让被帮扶教师通过云录播平台进行课堂直播。录播后,专家采取“听课—评课—反馈—指导—跟踪”的方式,及时、全面、系统地对被帮扶教师的教学方法、教学技能和教学知识进行针对性、差异化点评和指导;然后,被帮扶教师则通过“讲课—反思—提问—改进—提升”的过程,获取个性化、及时性的帮助。云录播平台是“大数据+教师发展支持系统”的核心平台,是将被帮扶教师的教学视频与教学反思、专家打分及专家评价、学生信息及学生评价等信息实时保存所形成的大数据平台,这些数据共同构成教师帮扶过程的数据轨迹和成长记录。[16]根据云录播平台中的教师帮扶档案,帮扶专家对教师教学水平的提升过程进行扩展性和包容性理解,这样可以帮助专家更好地了解帮扶成效的影响因素,有针对性地建构帮扶者的知识素养,进而采取个性化方式将知识技能与被帮扶教师进行精准匹配。[17]
该系统运行两年多来,成效显著,具体表现在:一是大数据增强了帮扶的针对性,教师教学能力不断提升。经过两年多的专家指导和帮助,受帮扶教师的教学理念、教学方法、教学设计等教学能力得到明显提升,其典型表现是课标解读和教材驾驭能力提高,教学设计和课堂把控能力增强,信息技术在教学中的应用越来越多。访谈时,M老师告诉我们:“以前讲课是想到哪里讲到哪里,看着很热闹,但重点不突出,教学目标不明确,没有紧跟大纲的要求,现在经专家指导后,让我们多看课标,多看教学大纲,上课的效果更好了。”二是大数据增强了帮扶的有效性,教师综合素质不断增强。帮扶后,受帮扶老师在知识积累、能力提升和精神培育三方面有明显的进步。帮扶前,教师的学科素养较低,学科知识不够扎实,课堂完成质量不高。帮扶后,专家指出教师在知识积累的不足,并通过在平台上分享优秀课件、交流互动、心理知识培训等方式提高教师的知识积累,助力当地教师自身的发展。[18]三是大数据增强了问题识别的精准性,学生成绩不断提高。帮扶前,由于学生数量多,教师不能关注每个学生的课堂表现,因此难以精准发现学生的问题,而运用了大数据平台后,专家通过观看录播课发现问题,并及时提醒教师和学生,学生的不良习惯逐渐得到纠正。不仅如此,数据还显示,录播课班级学生成绩提升幅度远远大于非录播班级。[16]
“大数据+教师发展支持系统”的特点在于:一方面,可以对帮扶过程进行精细化管理和精准化指导,对帮扶结果进行科学、客观的评价,让帮扶成效更具可持续性;另一方面,通过“造血式”的帮扶方式从根源上提升教师的专业能力,加强青年教师对学生的教导作用,给予贫困人口更强的内生动力。当然,该系统的运行也存在一些问题,包括对大数据的收集与挖掘不够,项目管理的精细化、科学化不够,项目运行的保障机制不健全等,因此,尚需进一步优化。
案例2:T县“大数据+学生资助系统”
教育公平是社会公平的重要基础,对家庭经济困难学生进行资助是扶贫工作的重要组成部分,但传统的学生资助方式存在着较大缺陷,影响着教育公平。因为传统方式对贫困生的认定过程往往是先由学生举证,然后教师甄别,最后由学生民主评议进行确认,这一过程比较粗糙且耗时较长。再加上学生民主评议虽然过程公开透明,有利于学生、教师的监督,但同时也会伤害贫困学生的自尊,个别贫困学生宁愿挨饿也不接受学校的资助。此外,传统学生资助还存在贫困证明虚假发放、学生虚假贫困、贫困学生资格认定间隔时间长、资助滞后、缺乏人文关怀等问题,有时也会出现补助金错发漏发的情况,不公平现象时有发生。为克服传统学生资助方式的弊端,自2015年起,T县引进了“大数据+学生资助系统”,对学生的资助情况进行精准管理和监督。
T县的“大数据+学生资助系统”也称作“学生资助大数据系统”,是一套涵盖从幼儿园到大学教育的全面资助体系。该系统与省内、市内的贫困生资助系统相连通,实现学生资助数据的共享,这大大提高了资助信息的透明度与精准度。同时,该系统与县内银行、公安、民政等多个民生部门相连,实现贫困学生家庭收入、消费、住址、房产、疾病等相关信息的实时更新。此外,该系统与学生的校园卡、图书借阅等信息相连,管理人员可通过后台数据实时了解学生情况。该系统将大数据思维应用于学生资助管理,对学生个人情况进行全方位、多角度、综合性的分析与评价,有利于精准识别困难学生,还能及时发现返贫或脱贫学生,具有重要的价值。同时,为保证贫困生的资金按时发放到位,教育局将学生的资助信息上传至该县的民生监察大数据平台,以便学生和家长实时查询,保证资助经费不被挪用,从而确保教育扶贫过程的公平性。
该系统有两个特点:一是能够实现资助对象的精准识别,确保资助资金及时发放。通过构建客观、科学、高效、易操作的家庭经济困难学生认定指标体系,“大数据+学生资助系统”对海量数据信息进行挖掘、提炼与识别,实现了对贫困学生贫困等级的精准认定,从而根据学生的个人差异、地域差异进行有针对性、个性化、差异化的资助,克服了传统人为认定方式所存在的随意性、盲目性、“一刀切”等弊端。二是对受资助学生进行动态追踪,提高了资助工作的时效性。通过与县内各平台的互联互通,“大数据+学生资助系统”能够实时提取受资助学生的基本信息,对受资助学生及其家庭情况进行实时动态监管,使资助工作更具操作性、高效性、准确性、时效性与科学性。以上两个案例的共同特点是:均开发了专门的大数据系统,均将某一领域的教育扶贫信息录入系统变成了教育扶贫大数据,均使用了大数据技术对教育扶贫工作进行管理、监控与评估,均实现了教育扶贫对象识别的精准化、管理的精细化、监控的精确化和评估的科学化,其做法均具有一定的典型性及借鉴意义。
大数据之所以能够驱动教育扶贫,其逻辑在于:首先,大数据技术的智能、准确、高效特征能够推动教育扶贫整体过程的精确化。有学者指出,大数据技术与教育扶贫的联姻在很大程度上加强了教育扶贫的精准性和靶向性,大数据教育扶贫体现了社会是一个相互联系、相互制约的有机体,承认了贫困的多维性与致贫因素的多元性与复杂性。[19]这说明,大数据技术的特征属性与教育扶贫要求之间可以实现较高的匹配度,从而可以提高教育扶贫的效率。同时,大数据技术背后的资源共享逻辑对教育扶贫而言尤为重要。大数据技术的运用突破了教育扶贫中优质教育资源缺乏的阻碍,贫困地区教师可获取专业指导与教学资源共享,转变教学理念,提升教学技能;学生可获取多元化的学习途径,并清晰地了解自身的学习问题。再次,大数据技术驱动教育扶贫也体现了权力转移逻辑,大数据为决策者和被帮扶者提供了一个平等对话的平台,弱化了二者之间的权力地位差异,推动治理结构的扁平化,提高教育帮扶过程的管理效率。尽管如此,两个案例都反映出目前大数据应用于教育精准扶贫领域的困境,即操作人员数据素养不够、操作系统数据兼容性不强,数据分析和数据利用不足,大数据特征并未有效显现。不同的是,因受益对象单一且文化水平较高,Y市“大数据+教师发展支持系统”的大数据利用特征更明显,发挥的效用也更加突出。而另一个案例因涉及主体复杂,包括政府、学校、教师、学生、家长、企业和社会组织,需要协调的关系和内容较多,使用大数据技术的影响因素和不确定因素较多,故使用的效果相对较差。这说明,要实现大数据在教育扶贫中的精准功能,应考虑数据集成的规模、操作人员的素养、利益主体的数量和系统服务的对象。
三、问题探讨:大数据时代教育扶贫的窘境
美国著名数据学家约翰·马西(John R. Masey)曾指出:“数据在未来将会越发地影响人们的日常生活、教育、经济、政治等诸多领域,学会适应数据、利用数据必然成为一种不可逆转的趋势”。[20]邬贺铨也对数据的隐含价值作出评价:“利用大数据进行分析,对我们深刻领会世情和国情,把握规律,实现科学发展,作出科学决策具有重要意义,我们必须重新认识数据的重要价值。” [21]借助大数据技术对教育教学行为数据进行采集、架构与深入挖掘,评估教师和学生的行为,能够探索教育发展的内在逻辑与规律,推动教育管理由主观性较强的经验判断向科学化的数据驱动转变,引导教师和学生行为规范,增强教育的科学性和系统性。因此,大数据在教育扶贫中的作用比较明显。根据课题组2019年7月-2020年12月在贵州省9个地州市调查获取的1624份问卷得知,在评价大数据技术对教育扶贫的重要性时,受访者“精准识别贫困户、有效匹配扶贫资源、动态监管扶贫过程”放在了前三位,分别占66.97%、58.22%和55.51%,均超过半数;接近一半的选项是“科学考核扶贫结果”,占47.51%。可见,受访者基本的共识是:大数据在教育扶贫对象识别、过程监管、资源匹配和考核评估中具有重要的作用。但是,大数据在使用中也存在一些风险与问题,如:数据修改更新困难,数据填报多头管理,分别占34.17%和32.51%;数据结构不统一、数据体量不够大、数据分析利用不够,分别占29.56%、29.5%和29.43%;另有23.65%的人选择“数据系统相互冲突”,19.77%的人选择“数据孤岛现象”。这说明,数据集成、数据挖掘、数据平台、数据共享和数据设施,是目前大数据应用于教育扶贫存在的主要问题。
1.数据量较小,并未形成真正意义上的教育扶贫大数据库
大数据,顾名思义必然具有海量的信息和数据资源,是基于对海量数据集成进行深层次的分析,来发现庞大繁杂数据背后所反映的社会现象和内在价值,从而得出更精确的社会评估。为了给社会问题提供个性化、具体化的方法,采用大数据技术的一个重要前提是要收集海量的数据。然而,目前在教育扶贫领域,大数据是一种新引入的技术,各类数字化平台建立的时间较短,且目前硬件设备不够成熟,在数据收集方面还存在一些困难,因此可收集的数据量十分有限,只形成了简单的数据集合,尚未真正构建大型数据库,更没有形成完整的数据链条,数据轨迹追踪监测困难,这极大限制了大数据价值功能的发挥。在访谈时,Z县工信局工作人员H指出,“严格来说,基层政府没有大数据,(因为)他们的数据体量都不够大。你想,一个县、一个乡的教育数据有多大?只有全省88个县市区汇聚在一起,那才是大数据。”黄璐等也指出,教育行业数据储备严重不足, 数据类型单一, 数据规模有限, 大大制约了人工智能教育的发展。[22]这说明,在目前的教育精准扶贫中,大数据在数据体量层面上的“大”字还未有效体现。
2.数据挖掘利用较少,大数据在教育扶贫中的价值未有效发挥
大数据涉及到的关键技术主要包括大数据采集技术、大数据预处理技术、大数据存储与管理技术、大数据安全技术和大数据挖掘技术。大数据的主要目的是通过数据挖掘技术,对应用对象进行预测、估计与管理。[23]但调研发现,目前大数据技术在教育扶贫中更多地停留在对数据的收集与存储上,没有建构立体化的分析模型对数据进行深入挖掘。这说明目前大数据的技术运用还停留在表面,一些职能部门的工作人员没有认识到大数据的真正价值,当这项技术落到实处时,只是被基层部门的工作人员看作是一项纪录数字的常规工作,经由大数据分析的结果并没有被真正反馈到决策与管理层面,大数据助力教育扶贫对象精准识别、资源精确匹配、过程精细监管的重要作用未得到有效发挥。当然,这一现象并不是大数据教育扶贫领域特有的现象,其他领域也存在。例如,章昌平和林涛指出,精准扶贫的数据采集与分析、大数据管理中存在着“应用烟囱”和“数据孤立”现象,跨学科研究和综合集成数据分析方法应用不足。[24]也就是说,目前大数据技术在教育扶贫领域的运用仍处于初级阶段,技术运用方式单一,大多表现为数据的采集和存储技术条件不够成熟,缺乏将大数据多样化、高效地渗入于教育扶贫各个环节的技术保障系统。例如,访谈时Z县教育局扶贫专员P告诉我们:“我们县教育精准扶贫有一个系统,但这个系统是2018年才建立的,极不稳定,之前的信息材料补充起来工作量很大,再加上这个系统牵扯的数据比较大、面也比较广,所以这一块现在还没有完全精准,体量较小。另外,由于贫困户流动性比较大,有很多极端情况,对于人口精准识别这一块,只要这个基础没做好,我们的教育精准扶贫就不好做,会漏掉一些学生。”这说明,建立时间短会导致大数据系统的功能还不够全面,实际操作难度大,而在信息方面存在数据断层的危险,且数据的准确性待核查,这意味着当前已有的数据尚不足以支撑教育扶贫对象的精准识别,因此要实现大数据对教育扶贫的精准化驱动,应该进一步挖掘利用大数据技术的功能。当然,教育扶贫中的大数据价值不能有效发挥和挖掘,与工作人员对大数据系统操作不熟悉也有关系。目前,鲜有系统操作员是计算机、大数据等专业人员,部分系统操作员数据素养不够、意识不强,因此对大数据系统的操作比较生疏,一旦出现问题,不能及时解决。受此影响,系统的大数据功能也不能有效发挥。
3.平台数量繁多,增加了教育扶贫工作人员的负担
大数据技术能够发挥作用的基础前提是有数据量大、系统完善、信息共享的平台作为载体,然而调研发现,大数据技术在教育扶贫领域中的运用面临着平台分割、系统繁杂、数据孤岛等问题。各类数据平台条块分割化状态明显,具体表现为:纵向上,不同时期的数据平台结构不一、类型各异,无法有效整合;横向上,不同功能的数据平台由不同部门或科室管理,不能相互兼容,由此带来的结果是数据系统各自独立,处于“孤岛”状态。事实上,目前确实还没有统一的数据平台可以使教和学、教和管之间的多源异构数据实现有效整合, 不能实现互动中数据的实时处理和信息反馈, 这使各类数据都处于孤立状态,无法形成大规模的应用。[25]例如,全国普通扶贫系统和教育扶贫系统之间不是完全兼容的,这就导致两边的数据重复录入、相互交叉。平台分割的另一个结果是平台数量的成倍增长,就教育扶贫领域而言,目前就有学籍管理系统、学生资助系统、学生营养餐系统、民生监督平台、精准扶贫系统等数字化平台,这些平台在不仅在横向上分裂,还在纵向层级上延伸,给教育部门的工作带来极大的负担。例如,T县教育局工作人员L指出:“仅资助这一项,我们就要同时录入国家、省、市、县四个系统,将来还要填入民生监督系统,并且还要分项录入,要分幼儿阶段的、义务教育阶段的、中职的、高中的……”。他说,“我们现在太多平台了,我们都自己都数不清楚。”随着教育扶贫工作的深入推进,今后还会开发出更多具有其它功能的系统,若不能打破系统间分割孤立的状态,大数据技术将难以在教育扶贫领域发挥应有的作用。
由于平台数量较多,一些工作人员需同时负责管理录入多个平台系统,负担陡然增加。T县教育局工作人员F指出:“我们教育局系统需要填报的数据太多了,比如我们现在的计财科,他们一个人现在就要填两三个系统,太多了,这无疑增加了基层教育扶贫工作部门的工作量。”同时,因为不同系统间的填报指标不一致,填报标准不断变动,导致在输入几十万条数据过程中容易造成失误,数据的准确性、有效性无法得到较高保障。另外,平台繁杂的数据和相对独立的操作也对管理者的工作带来了巨大的挑战,F进一步指出:“现在太多平台了,我们都自己都数不清楚了,只好专门拿一个文档来记录账号和密码。你看,记录得密密麻麻的,如果不标注,都分不清楚。”这说明,先进的大数据技术并没有让管理先进化,却陷入比原来更混乱的状态,这给教育扶贫工作带来了许多额外的负担。
4.数据共享不够,背离了教育扶贫大数据使用的初衷
大数据最核心的要素是通过先进的互联网技术和高速的计算能力,打破数据间的交流障碍和信息壁垒,实现数据从一个端口到另一个端口的共享与切换。然而,在平台分割的情况下,数据只是存储于电脑上的字符而不是具有流动共享价值的信息资源,其结果是扶贫信息的错位化、孤立化和壁垒化。所以,在一些学者看来,教育领域的数据治理面临信息孤岛化、模式碎片化、组织机构功能裂解化等现实困境。[26]调研也显示,Z县的教育资助发放问题,因高校与县扶贫办之间属于不同系统和不同的管辖部门,无法实现信息共享,因此县扶贫办的资助部门无法获取省外高校的学生资助名单,不能核实已获资助的学生,导致县外省内学生资助对象难以识别精准、明确管理。关于这一点,县教育局扶贫专员P是这么告诉我们的:“省外就读的学生系统我们是共享的,比较乱的一块就是在省内县外高校就读的同学,我们县教科局没有这个数据,我们只知道每年我们这里被录取了多少学生,但这些学生去读了没有,我们不清楚,因为没有高校的数据。我们之所以要核查这部分的数据,是因为如果这群学生在就读的学校没有获得补助,我们就要给他相应的补助。”但是,由于缺乏这一块数据,基层部门就只能通过人工摸排的方式来明确已在高校获得资助的学生名单,P进一步指出:“先由各乡镇的帮扶干部下去摸排,但是摸排也会出现一些问题,因为摸排是用嘴问,看不到学生在学校的一些证明材料,所以摸排时就靠学生或家长自己说是否得到资助。但我们教育局发钱是要靠证明材料的,也就是要见到他有学校盖章、老师签字证明的未得资助的材料,然后拿家里面的证明如户口本、身份证还有当地办的存折,我们才给予发放。但是,因为很多学生是外省的,要么找不到他的联系方式得不到他的材料,要么是对方故意不提供材料,所以我们往往不能获得或者及时获得他的证明材料,数据库里的数据录入就不能按时完成,资金发放也不能及时到位,后来我们怎么做的呢?让教育局的工作人员集中跑了几个地方去要那些学生是否被资助的证明,但这工程量太大,耗费的成本太高,不可持续。” 从P的表述中我们得知,因为数据不能共享,大数据应用于教育扶贫的优势难以彰显,并且浪费了大量人力物力,不仅增加了扶贫工作的负担,还背离了大数据助力教育扶贫的初衷,应引起高度的重视。
四、路径展望:大数据时代教育扶贫的图景
大数据凭借其快速、大量、多样的特点,可以推动教育扶贫过程精准化、科学化与高效化,并且有助于为未来开发出创新型的帮扶模式,但是大数据驱动教育精准扶贫也面临着许多挑战。要进一步推广该模式,就国外的经验来看,首先要在政策层面给予支持,营造数据驱动教育决策的氛围。[27]不仅如此,还需要消除各级机构之间对使用相关数据的怀疑。[28]当然,不可忽视的是,大数据驱动教育扶贫的研究大多限于相关分析和预测分析。换句话说,虽然通过使用数据挖掘技术,研究人员可以搜索大量的数据,但只能回答大数据驱动的教育精准扶贫“是什么”而不是“为什么”的问题。[29]为此,应从以下路径进行优化。
1.建立教育扶贫数据生态圈,扩充数据容量
大数据为公共管理者提供了价值依赖与工具依赖。价值依赖要求大数据的使用者重塑思维方式与行动路径,重视并利用大数据,形成数据决策与数据管理的思维模式;工具依赖指运用大数据技术构建开放平台,实现政府流程再造,促进公共管理的智能化、精准化与标准化。正是由于有如此大的功效,国务院在2016年印发的《“十三五”脱贫攻坚规划》中再次强调,要“加强精准扶贫大数据管理的应用”,推动优质教育资源在贫困地区的共享应用。显然,Y市具备了大数据引领教育精准扶贫的实施条件和环境,因此能够因势利导、积极探索,利用大数据容量大、变化快、多样性、高价值等特点,构建一个“提智、提质”的大数据驱动教育教育扶贫模式,让优质教育资源实现精准覆盖、精准推送、精准支持,持续形成教育扶贫生态环境。
为了让“大数据+教育”扶贫项目的运行更加精准、科学,就需要收集更多数据,扩大数据的规模,形成真正的大数据库。因此,建议按教育扶贫的需求,对扶贫过程中产生的大量分散数据,有计划、有组织、有目的地进行多角度、全方位、系统化地采集,具体收集途径是:一是将以往记录的有价值的纸质信息录入系统,进行数据化保存,利于分析和利用。二是从共享数据库中获取数据。传统方式采集的数据中,静态数据较多,可通过开放接口对共享数据进行收集,实现数据的动态变化、实时更新。三是引入数据挖掘技术,通过算法搜索,将隐藏于信息中的价值数据挖掘出来。四是增加数据的使用范围和运行时间,提高数据使用的延展性。
2.有效整合教育扶贫数据平台,实现教育扶贫数据共享
联合国教科文组织2019年报告《教育中的人工智能:可持续发展的挑战和机遇》(Artificial Intelligence in Education: Challenges and Opportunities for Sustainable Development)指出,构建开放、高质量和包容性强的教育数据系统是人工智能教育可持续发展的重要前提。[30]大数据是人工智能的前提和基础,但由于各教育扶贫系统数据割裂、数据孤岛的现象严重,增加了数据处理的成本和困难,因此有必要整合平台数量,建立一个统一的大数据平台,实现数据共享。数据共享能够让更多的人充分利用已有数据资源,减少资料收集、数据采集等重复劳动和相应费用,是实现教育扶贫精准化管理的重要途径,同时也是提升政府数据资源再利用水平的关键。那么,该如何实现数据共享呢?由于各教育扶贫数据系统的格式不一、内容不同、结构相异,因此要实现数据共享,就应首先建立一套统一的、法定的数据交换标准,规范数据格式,使用户尽可能依据规定的数据标准来进行数据收集。建立数据标准后,要对教育扶贫数据的流向进行精细管理。数据的流向分为水平流向和垂直流向,在水平流向上,各个系统的数据依照数据字典转换成相同格式,在后台形成统一的数据库,数据库将剔除重复的数据。将这一理念映射到教育扶贫数据中,构建统一平台之后,学生和教师只用注册一次,就可以使用一个账号来查看所有的扶贫事项;在垂直方向上,中央、省、市、县四级的数据信息系统应当有相应的接口,实现数据的逐级审核,不符合要求的数据不予录入,合乎要求的数据可以互通和交换,在全省乃至全国范围内实现教育扶贫数据共享,使各级系统呈现扁平化管理的趋势。当然,为了更好地实现教育扶贫的数据共享,需要明确共享过程中的保障要素,这些要素包括:提高教育部门领导的数据共享意识,加强教育扶贫管理人员的信息素质,建立教育扶贫数据使用和管理办法,制定教育扶贫相关措施,鼓励教育扶贫数据共享行为等等。以贵州省的“大数据+学生营养餐系统”为例,如果建立一个以省或市为单位的数据平台,打通各学校和食材配送公司之间的数据壁垒,就可以更好地统筹规划各地食材的购买、运输和使用,均衡资源配置。
3.深入挖掘数据价值,培养大数据应用于教育扶贫的思维方式
教育数据只有通过深入挖掘分析,才能将其转换为信息资源,有效发挥出以数据驱动管理的功能。正因为如此,对教育扶贫大数据进行过程挖掘,不仅有助于分析教育扶贫过程的历史数据,更有助于教育主管部门、教师改进教学决策,为学生提供教学支持。[25]在平台分割化、信息独立化的背景下,大数据技术在教育扶贫领域中发挥的作用有限。因为受主客观条件及管理偏好的影响,大数据技术应用于教育扶贫的成效与预期目标间存在一定的偏差。虽然大数据让教育精准扶贫的对象识别、资助发放、营养餐配送、信息化手段和师资培训等方面发生了较大的变化,但从严格意义上来说,并没有真正实现大数据技术下的精准化管理。之所以呈现如此的状况,与教育扶贫数据主体的思维方式有关。
大数据对政府治理提出了更高的要求,倒逼政府主动变革创新思维,不断提升公共治理水平。正如有学者所指出,大数据治理必须具有服务性思维、时效性思维和开放性思维,才能满足社会公众日益增长的期望。[31]在教育扶贫中,操作主体主要是基层教务部门的公务员。虽然普遍认为基层公务员的工作主要是执行上级的决定和国家的政策,但“事实上他们正是建构政府所提供的服务的实际行动者。除此之外,若是把这些公共服务工作者的个别决策积累起来,甚至可以成为或者是等同于政策”。[32]事实上,基层公务员所做出的决策,大多与重新分配以及资源配置有关,这一角色建立在与他们职位相互关联的两个层面:较高程度的自由裁量权,以及在组织权威之下所拥有的相对自主权。[31]对于基层教育工作者而言,资源有限、目标模糊和绩效评估难以量化的现实困境决定了其思维方式具有一定的局限性,因而对大数据的价值和认识容易停留在比较浅显的阶段,转变基层教育工作者的思维方式十分重要。为实现大数据决策优化,就要改变基层教育工作者的传统思维惯性,培养他们的大数据思维,这就要求做到:第一,积极配合上级政府工作,组织基层公务员参加大数据业务培训,使他们提高认识、开拓视野,主动配合大数据工作,提升自身能动性,提高用大数据优化决策的主观意愿;第二,加大对数据平台操作人员的业务素质培训,大力引进人才,形成稳定的大数据操作队伍。只有这样,基层教育工作者的大数据思维才能有效形成。
五、余论
大数据驱动教育扶贫领域的内在机理在于以大数据思维与技术驱动教育扶贫的精准化、智能化与差异化。教育扶贫中大数据的“大”不只是停留在表层的数据体量大小,更体现于数据背后所蕴含价值之“大”和思维之“大”,通过挖掘教师教学与学生扶贫中的数据信息,发现教育扶贫过程中的重要问题、隐藏关系,预测未来发展趋势。就此而言,本文探讨的“大数据”也许体量不够大,但其揭示的驱动教育扶贫的逻辑机理还是具有一定的参考价值。
另外,值得关注的是,大数据在教育扶贫领域的适用性问题也需引起思考。教育扶贫的内在逻辑是通过教育来提升贫困人口的自身能力,从而阻断贫困的代际传递。然而,虽然大数据和互联网技术在改善贫困人口的文化环境方面有一定的作用,但并没有明确的证据表明,这些技术可以直接或间接地提升贫困户群体的发展能力和内生动力。因为大数据技术的运算分析多是以客观的数字为基础,而教育并不完全依赖数据。相反,教育是一个多方主体参与的复杂过程,某些主观因素对于学生的终身教育和成长更具深刻影响,因此在教育扶贫领域中,一些主体作用不能简单地由大数据和互联网技术进行替代。鉴于教育扶贫领域的数据更新较快、变化较大、范围较广,目前在教育扶贫领域更多采用的是一种大数据思维,而不是真正的运用了大数据技术。展望未来,如果教育扶贫领域真正用到了大数据技术,必将带来贫困地区师生教育理念、教育方式和教育实践的转变,真正阻断贫困的代际传递。
参考文献:略
广州大学乡村振兴研究院
扫
码
关
注
微信公众号
广州大学乡村振兴研究院
相关超链接乡村研究||王洁获立2020年度粤港澳大湾区教育发展专项课题
乡村研究||东西部协作教育组团帮扶的模式转向与本土建构
乡村研究||乡村综合整治中的数字监管:以D村经验为例乡村研究||农户是如何组织起来的———基于贵州省安顺市塘约村的分析乡村研究||谁更愿意争当贫困户?——基于机器学习模型的预测与思考乡村研究||幼有所育:新时代我国儿童政策体制的转型乡村研究||建党100年的技术变迁与贫困治理乡村研究||王洁获征文活动一等奖乡村研究||研究院获立2项国家社科基金项目
乡村研究||谢治菊:运动式搬迁下的常规化治理——易地扶贫搬迁社区治理困境的解释框架
乡村研究||谢治菊开展社工介入易地扶贫搬迁治理专题讲座乡村研究||政策工具与乡村振兴——基于建党100年以来扶贫政策变迁的文本分析乡村研究||脱贫攻坚精神:时代内涵、生成机理与治理价值
乡村研究||王乐童乡村振兴项目获批校级立项
乡村研究||谢治菊 彭智邦:东西部协作政策扩散的维度、逻辑与启示
乡村研究||梁琴:权威引导、市场重塑与社会动员:消费扶贫的长效机制
乡村研究||江星玲,谢治菊:协同学视域下东西部教育扶贫协作研究
乡村研究||谢治菊:以协同治理推进东西部教育扶贫协作
乡村研究||谢治菊 陆珍旭:社会学与口述史互构的逻辑、旨趣与取向
乡村研究||谢治菊 范飞:新技术对口述史研究的影响
乡村研究||李利文:执法堕距:政策执行在基层缘何容易走样?——基于D村违法建设综合整治案例的研究
乡村研究||乡村环境研究团队在国际知名期刊上连续发文
乡村研究||谢治菊 彭铭刚 梅梦玲:基层公务员的职业倦怠与离职倾向
乡村研究||回顾2021:让乡村研究走进田野
乡村研究||郭明:虚拟型熟人社会:一个新乡村社会形态
乡村研究||谢治菊 卢荷英:动员式治理与嵌入式交往:驻村干部工作艺术与乡村振兴
乡村研究||《走向共生共在:贫困村庄社会治理共同体建设》出版乡村研究||谢治菊 范嘉雯:驻村干部考核:要素、功能与优化乡村研究||谢治菊 陆珍旭:三线建设时期的备战动员与备战意识乡村研究||谢治菊,李恺茵:我国脱贫攻坚政策变迁及其与乡村振兴战略的衔接
乡村研究||谢治菊教授获批广州市党建学会2022年度调研课题
乡村研究||谢治菊 刘 颖 袁 喆:少数民族高考加分政策受益者的政府信任与公共参与
乡村研究||邱泽奇 张樹沁:乡村电商何以成功?
乡村研究||谢炜:对口支援:“项目制”运作的梯度适配逻辑乡村研究||王禹澔:中国特色对口支援机制:成就、经验与价值乡村研究||谢治菊 李小勇:您在他乡还好吗?——易地扶贫搬迁农户五层级社会适应研究
乡村研究||李强:早年不幸的健康代际传递对健康中国的启示
乡村研究||尹成杰:巩固拓展脱贫攻坚成果同乡村振兴有效衔接的长效机制与政策研究
乡村研究||东西部扶贫协作中的协同模式研究——以广州市N区帮扶贵州省L县为例
乡村研究||蒋红军 张艳红 廖依倩:技术重塑身份,智慧矫正何以有效乡村研究||尹铎 朱竑:云南典型山地乡村农业扶贫的机制与效应研究——以特色经济作物种植为例乡村研究||刘皇 周灵灵:农村劳动力结构变化与农业技术进步路径乡村研究||谢治菊、刘颖、袁喆论文被《教育文摘周报》转载乡村研究||刘燕 李加斌:农村电商的发展态势及其膨响因素研究分析乡村研究||刘志强:论全面脱贫与人权治理乡村研究||丁波:数字赋能还是数字负担:数字乡村治理的实践逻辑及治理反思
乡村研究||郭明 高璇 刘良艺:道德积分制:国家政权对乡土社会的“柔性整合”
编辑|黄燕洪排版|劳丽璇编审|郭 明
监制|蒋红军