赵佳丽、罗生全等:教育大数据研究范式的内涵、特征及应用限度
作者简介:赵佳丽,博士研究生,西南大学西南民族教育与心理研究中心,西南大学教育学部(重庆 400715);罗生全,教授,博士生导师,西南大学西南民族教育与心理研究中心,西南大学教育学部(重庆 400715);孙菊,助理研究员,燕山大学期刊社(河北秦皇岛 066004)。
基金项目:中央高校基本科研业务费专项资金资助项目“基于核心素养的学校课程结构重建研究”(SWU1909578);北京师范大学中国基础教育质量监测协同创新中心自主课题“全国义务教育质量监测报告中公布课程达标率的影响研究”(BJZK-2018A2-18037)。
引用:赵佳丽,罗生全,孙菊(2020).教育大数据研究范式的内涵、特征及应用限度[J].现代远程教育研究,32(4):57-64,85.
摘要:教育研究范式是教育研究体系的重要组成部分,是教育学术共同体对教育研究活动所持有的共同的基本理论、观点和研究规范。在全新的社会历史境遇下,数据和算法共同驱动的教育大数据范式已然生成。教育大数据研究范式作为一种全新的教育基本理念、行动规范或研究工具,它在认识论层面彰显为面向教育科学主义的教育研究实质,方法论层面强调了教育循证的数理解释逻辑,实践论层面则凸显了知识发现的数据挖掘技术,构建出完整的教育大数据理念体系。当下为促进教育大数据研究范式的不断发展与完善,相关教育研究人员应结合教育发展水平,构建具有本土特色的教育研究话语体系,关注众多跨学科视角的教育研究议题,为各级各类教育教学部门提供定制化的教育决策服务。当然,教育大数据研究是有其应用限度的,研究需警惕数据主义或技术主义,重视数据话语权分配,加强教育数据安全管理,从而提升教育大数据研究效能。
关键词:大数据范式;教育研究;核心特征;应用限度
互联网和信息技术在政治、经济、文化、社会等领域的广泛应用,产生海量数据,人类社会步入“大数据时代”。当前大数据已在各个领域产生深远影响,彻底改变了人们的生产与生活方式。教育领域,大数据深刻作用于教育研究与实践,推动教育研究从“假设驱动”走向“数据驱动”,教育实证研究愈发受到学界重视。新的分析工具与技术,如社会网络分析、数据可视化、聚类分析等的普遍应用,加深了人们对教育大数据的理解与应用;教育建模、学习分析和教育大数据治理等相关研究主题的大量出现,彰显了大数据教育应用推广的价值。当前大数据驱动的教育研究已呈多元发展态势,形成了教育研究新模态,教育大数据范式也应运而生。作为一种教育研究新范式,教育大数据范式摆脱了过去经验科学、理论科学的禁锢,尝试从计算科学、学习科学和大数据科学等视角探求教育事实;它激化了教育领域的数字化资源竞争,人们开始通过提高教育数据资源占有量来掌握教育话语权;其研究过程不再过多关注方法选择和测量工具开发,更倾向基于计算机的智能化处理。大数据无疑改变了传统教育研究环境、研究理念、研究模式与方法,加速了新旧教育研究范式的更迭,推动了教育研究领域的转型发展。
教育大数据研究范式是在长期范式变革过程中产生的,它是教育科学化发展的重要产物,也是新时代教育研究转型的结果。当下明确教育大数据研究范式产生过程及内涵,能为大数据范式的教育应用与推广奠定基础。
1.科学研究范式的演进路向
“范式”一词出现不到百年,却在各个学科领域形成不同价值形态和内涵理解,其中尤以莫顿(R. K. Merton)和托马斯·库恩(Thomas Kuhn)的“范式”理解为代表,标志两类范式内涵的形成。“莫顿范式”关照理论向度,认为范式是“将某一特定领域或某种分析方法的一组相关假定、概念、专门术语、主张和意义等加以分析整理,从而形成一个理论系统”(于泽元,2009)。“莫顿范式”作为一个系统整合成果或一种后设社会学建构,其实质表征为一种研究命题和理论观点。“库恩范式”关照实践向度,认为范式是学科共同体成员共享的一种符号通则、模型、价值和范例,且“以共同范式为基础进行研究的人,都承诺同样的规则和标准从事科学实践”(托马斯·库恩,2012),由此“库恩范式”表征为一种共有的世界观和行为方式。事实上,“莫顿范式”的提出早于“库恩范式”,但“莫顿范式”过分专注社会学分析的元特质使其未被广泛认可,库恩则从科学哲学视角出发指明了范式的具体构成要素,对“莫顿范式”进行了完善与补充。之后学界构建的范式概念,主要倾向一种理论与实践的混合理解,认为范式是某一学科研究共同体需遵守的一种基本理念、行动规范或实践工具。
图灵奖获得者、数据库专家吉姆·格雷(Jim Gray)认为,人类科学研究经历了实验科学、理论科学、计算科学和数据密集型科学四个阶段,在不同阶段形成了不同研究范式。20世纪前,研究“一类是以模仿自然科学为主,强调适合于用数学工具来分析经验的、可定量化的观察;另一类是从人文学科中推衍而来,注重整体和定性的信息及说明的方法”(瞿葆奎,1988)。人们就此形成不同的科学认识和理解,如伽利略、牛顿等建立近代机械主义科学观,形成了量化、逻辑、实验等为主的实证研究范式;夸美纽斯等人主张类推、经验、归纳等为主的哲学思辨范式;狄尔泰则通过辨别人文学科“解释”和自然学科“理解”的差异,构建了唯心主义研究范式;立意批判分析的法兰克福学派则试图调和自然科学与社会科学的矛盾,形成了人本主义研究范式等。这些多样的研究范式实质指向“实证—定量”和“理解—定性”两大类型。20世纪后,学界尝试以新的认知图式重构人类发展图谱,产生了科学研究的“第三范式”,如本质主义、体系主义、实用主义、批判主义的研究范式(王兆璟,2002),逻辑演绎、自然类比、实证分析、人文理解的研究范式(张武升等,2005),类推—演绎、经验—分析、诠释—理解、社会—批判的研究范式(冯建军,1998),政治教育范式、绩效主义范式、文化学范式 (张应强,2010)等,整体促进了科学研究领域的繁荣。
2.教育大数据研究范式的产生
范式最初发轫于自然科学领域,如今它却在社会科学领域备受推崇,特别是在教育科学研究中。这主要源于范式对理论与实践的共同关照更符合教育研究的旨趣。虽然学界多元的研究范式丰富了教育研究的路径,但“没有一种研究范式可以解决所有教育研究上的问题,每种范式都有其存在价值和局限性,其合理性总是相对的”(冯建军,1998)。如宗教神学统治时期,哲学思辨成为教育研究的主流范式,人们偏重对教育理论或实践经验的归纳演绎,缺乏对教育现实的考量,造成教育理论与实践的分离。而今出现的人工智能范式(即AI范式)主张技术赋能研究,以感知、数据、脑科学、认知等为中心(程显毅等,2017),却过度偏重技术分析与数据形态,难以有效兼顾教育理论指导和实践验证要求。此外,不同时期的教育研究都有其主流范式,新范式最终会取代旧范式,但这并不意味对已有范式的全盘否定,各研究范式间是相辅相成、取长补短的关系。这是教育发展的必然逻辑,因为基于不同教育主题和研究目的,人们会选择最优研究方法或模式;针对同一研究主题或内容,人们也会采用多种研究手段和分析方法,从而挖掘教育现象背后的本质问题。面对当下复杂的教育生态和数字化教育场景,教育研究范式作为“教育学学术共同体对教育研究活动所持有的共有信念、共同的前提假设,以及共同的基本理论、观点和研究规范”(张应强,2010),它已冲破逻辑经验主义主导下科学哲学之间的不可通约,研究问题聚焦“什么知识最有价值”“谁的知识最有价值”以及“如何挖掘知识多元价值”等,主张运用混合研究方法,不断促进“教育研究体系”(雷鸣强,1995)更新。
教育科学研究的内在突破为大数据范式产生奠定了基础,人工智能和“数据密集型科学发现的第四范式”则加速了教育大数据范式的确立。教育现代化、信息化的持续推进,实现了教育与技术的深度融合,“第四范式”成为教育研究主流,这主要源于表征新技术、新方法、新理念的大数据更新了教育研究体系。其一,大数据引领了教育研究思维方式变革,从过去对经验或理论的关照转向数据关照,强调研究中的教育数据思维,包括数据量化思维、数据关联思维、数据驱动思维和数据反馈思维(李新等,2019),力求通过数据洞见教育发展趋势或规律,丰富了教育研究视角。其二,大数据拓展了教育研究内容。以往受研究方法或研究工具限制,人们聚焦已有教育理论或规律验证,如今利用大数据技术则能发现更多“意外”的教育结果或问题,开辟出教育研究新领域。其三,大数据创新了教育研究方法或路径。以实验科学、理论科学或计算科学主导的教育研究遵循单一研究进路,多以文献法、调查法、访谈法、实验法等为主。大数据研究则整合不同研究方法于同一研究主题,弱化教育研究过程的方法依赖或工具依赖,转向研究内容的多元分析。总体上,大数据在带来教育研究思维、内容和方法变革同时,重塑了教育研究认识论与方法论,确保了教育大数据研究范式的合理性。
3.教育大数据研究范式的内涵
教育大数据范式是指教育共同体成员需共同遵守的一种教育研究基本理论、行为规范或实践工具,它主要在“证据为本”、数据思维的教育科学研究理念指导下,综合运用各种新兴教育分析技术或手段,聚焦教育教学现实问题解决与教育规律的探究。具体而言,教育大数据范式循着教育研究的科学化进路,糅合大数据理论、教育原理和信息网络技术等于教育科学研究过程中,以人工智能的符号主义、连接主义和行为主义等为研究基础,将现实教育情境中的教育现象或活动作为研究对象。区别于传统教育研究,教育大数据研究将表征各种教育现象或事实的图片、文字、音视频等转化为数据形态,通过挖掘不同教育主体的过程性行为数据和结果性表征数据来探寻教育规律。虽然这可能产生数据主义的认识倾向,但并不代表教育大数据范式的“唯数据”“唯技术”。微观层面,教育大数据范式是一种具体的教育研究模式。宏观意义上,教育大数据范式体现为一种教育研究理念,主张尊重教育事实或规律,强调教育研究过程的科学化、规范化。
大数据范式的产生为教育研究提供了一种全新的研究视角,一种认知方式,一种实践规范,转换了传统教育研究的单一进路,尝试在认识论、方法论及工具论(或技术)层面实现科学主义与实证主义的和合,形成数据理性支持的教育科学研究理念或逻辑。
1.彰显科学发展本质的教育研究认识论
长期以来,学界对自然科学和社会科学两大领域的划分廓清了教育研究范畴,促成不同学科理论和实践规范的建立,为人们认识教育演变规律或发展机制提供了支持。早期由于社会生产力的落后,人们常以自然摹仿或经验积累来获取知识。这种对客观事实的过度描摹或叙事往往难以帮助人们认清背后隐藏的复杂关系,无法领会其中蕴藏的精神实质。数学、心理学方法的引进规范了教育研究过程和方法,人们开始运用小样本数据外推教育规律,强调教育研究结果的客观性、准确性,研究目的指向科学知识发现和知识积累。不过随着社会生产力水平的提高和人类认知体系的完善,教育领域形成了庞大的“数据池”、流变的数据和错综复杂的社会网络关系。仅依靠统计科学或数学方法只能窥见研究对象的冰山一角,如何利用大数据去发现未知教育领域和弥补认识“盲点”成为研究关注的重心。因而研究目的“不再是学科知识积累或学科体系的完善,也不是建立新学科,而是为增进、更新、深化和拓展对特定问题的认识”(张斌贤,1997),教育研究也从经验主义走向自然主义转向客观主义,从定性研究到定量研究走向混合研究,人们对研究对象的认识也从感性阶段上升到理性范畴,教育研究的科学化程度明显加深。任何学科都是以科学作为理论基础的,大数据研究范式作为教育科学发展到一定阶段的产物,根本上具有科学主义的精神实质,它是教育研究者当前共有的一种科学信念、理论或假设。
大数据范式产生的合历史性、合规律性奠定了其在教育研究中的地位,也逐渐形成特定的研究目的、研究问题或研究域。德国教育理论家布雷岑卡基于认识论哲学将教育研究命题划分为三类,即“描述性命题体系—教育科学、规范性命题体系—教育哲学以及规范性/描述性命题体系—实践教育学”(黄向阳,1993)。大数据范式主要聚焦中观层次的教育科学问题,任务是“获得关于教育行为方面的科学认识”(W·布雷岑卡,1995)。一方面,区别于以教育根本问题为研究对象的教育哲学,如教育本质、教育目的、教育价值、课程论、教学论等,教育大数据并非基于哲学立场论及教育本质,也不将研究提升至哲学思辨的高度,而是以一般教育问题为研究对象,以海量数据占有为前提,关注现实教育问题的发现和解决,通过对全样本数据的描述来阐释教育现象或规律。另一方面,大数据研究区别于“没有科学目的,而只有实践目的”(W·布雷岑卡,1995)且遵循现实逻辑的教育实践,它注重对教育研究对象的去情境化处理,即将每一个体视为一个“信息源”,通过数据降噪或环境“脱敏”等解决研究中的不确定性问题,避免多元文化背景或个性差异对教育真相的掩盖。其研究还以去价值、纳差异的数据还原教育事实,帮助人们揭示教育现象背后存在的各种可能性。因此大数据范式驱动的教育研究是一种自成目的的活动,既拒斥形而上的教育本体论、目的论、价值论或道德论的宏观研究,也不对微观的教育实践进行行动分析或个案讨论,而是在对教育现象或教育活动的整全描述基础上,探究教育发展方向及影响因素,从而构建出一种历经实践检验的教育科学理论,对具体教育教学活动进行针对性指导。
2.强调数理解释逻辑的教育循证方法论
教育研究必然通过教育学科科学层的映射,对教育现实和内在规律进行解释分析,形成基于一定方法论指导的教育研究范式。结合大数据研究范式所秉持的教育理念、研究程序和研究方法,可建立包含哲学方法论、科学方法论和具体方法三层向度的方法论体系。
其一,大数据研究范式注重数据本位的教育科学理论建构。哲学方法论是关于人们认识世界和改造世界的一般方法的理论,亦即关于世界本质是什么的看法。大数据研究范式最初是以毕达哥拉斯的“万物皆数”为认识基础,不过人们现已超越这种对数的夸大理解,认为数据已成为和自然、社会等同的一个新领域。教育大数据研究不再将自然现象或社会现象作为研究对象,而是研究表征教育对象的全体数据,这种“数本化”认识在根本上与马克思主义关于世界本源是物质的认识具有相似性,由此将大数据哲学方法论统一到了唯物辩证法范畴。具体来看,以数据为核心的大数据范式属于数据驱动的教育科学研究,完全颠覆了以往个体经验或理论假设驱动的研究。这些教育研究数据主要源于线上教学活动的动态高频采集,多类型、多维度、多形态的数据集合可将教育全过程进行实时的全样本数据化记录,拓展了研究素材的时程性和教育学研究的问题域(González-Bailón, S,2013),宏观覆盖政治、经济、文化、社会等领域,微观涉及个体认知、行为、情感等方面。多样的研究数据反映出一种全样本、全过程、全发展的数据采集思路,保证了研究对象的真实性和客观性。此外,教育大数据处理和分析过程的机器模拟避免了研究主体过多的价值涉入,为人们全面、客观、发展性地看待问题奠定了基础,确保了教育研究过程的科学性、客观性和可靠性。
其二,大数据研究范式突出了整体论导向的教育实证研究过程。大数据研究范式聚焦教育学领域的问题解决,遵守实证研究的基本规范,以此统整教育研究过程,发挥了科学方法论层面的指导与规范作用。具体表现在:一方面,教育大数据范式遵循整体论的研究思维。传统教育研究以系统论、控制论、信息论、耗散结构论等提供的系统科学视角看问题,从抽样数据推断样本总体,这种从有限数据或个体经验获得的教育认识在“小数据”时代是可靠的,但在复杂多变的“大数据”时代却无法令人信服。不过随着数据采集、分析、处理、转化等技术难题的攻克,教育大数据研究突破了“目的—手段”的既定研究思维,将“系统方法作为一种综合方法,强调整体性、综合性观点,注重从整体上研究事物的结构、层次、过程、关系和信息反馈等”(裴娣娜,1988),形成基于全样本数据探究教育事实或规律的研究框架,传递出一种整体论导向的研究思路。另一方面,教育大数据研究范式遵循实证科学的分析逻辑。马克思早先就指出“一种科学只有成功地运用数学时,才算达到了真正完善的地步”(保尔·拉法格等,1973)。大数据研究对象的数字形态和大体量、高速度、多种类、真实性、可变化等5V显著特征(Herschel et al.,2017)需要对其进行量化处理,唯有通过数的统计和量的分析才能得出客观结论,这就使大数据走向了实证主义方向。正是大数据对实证研究的偏向加速了教育研究科学化进程,人们开始关注复杂网络系统中的教育活动特征,并以复杂科学或交叉学科思维解读研究对象,形成了一种大教育观下的大数据研究。
其三,大数据研究范式强调“模型化”的教育研究方法生成。无论是“数本位”的教育研究基础,还是整体论指导的研究过程,教育大数据研究效能的发挥最终取决于研究方法和分析手段的选用,以此确保研究程序的规范性、操作性和可重复性。当下教育技术的日臻成熟,大数据的智能化模拟和实验仿真技术实现了数据处理、过程分析的“自动化”或“半自动化”,研究更关注统计学基础上的算法选择和运用,模糊了传统实证研究中的主体参与和技术制约,人们更尊重元数据所呈现的教育概貌。研究者通过对各个教育数据集以及与子数据集之间关系的探究获得整体性认识,在具体方法层面形成了一种自下而上的“归纳—演绎”研究逻辑,以及一种主要运用模型或聚类手段达到特定研究目的的方法,即“模型化方法”。而教育模型是以中介形式沟通数学对象与教育研究对象关系的。较之传统教育研究自上而下的理论演绎或实践验证逻辑,教育大数据研究的“模型化方法”强化了分析过程的程式化选择和操作,使研究过程更加科学严谨,突出了教育研究的自我叙事力,为建立更多本土化教育理论或实践理论奠定了基础。
事实上,教育研究各方法论间并非独立存在,而是相辅相成、互为印证的。其中,哲学方法论对教育科学方法论和具体方法进行方向引领,科学方法论对具体研究方法进行规制,具体研究方法则是对哲学方法论和科学方法论的实地践行,这就使教育研究有了系统方法论的指导,人们从经验依赖转向技术关注,特别关注研究数据的数值特性和研究者的数据解释力,强调教育大数据研究的数据理性思维。以数据为代表的原始材料成为教育解释的重要证据,而数据采集和分析即为教育循证过程,循证过程的科学性将直接决定研究有效性,由此大数据研究过程的核心旨要就在于寻求研究主体智慧与证据的最佳融合。此外,基于大数据“水平式建模”的研究思路,教育大数据研究直接使用教育数据挖掘与分析方法去归纳数据中的关系模式(Anderson,2008),并构建了一种基于相关关系的解释性框架。区别于传统教育研究基于因果关系构建的理解性框架,解释性框架是在大数据方法论指导下,通过对教育事实的剖解而建立的一个科学认知体系,其研究思路更具理性特质和循证意味,从而助力教育科学理论的产出。
3.突出数据挖掘技术的知识发现模式
大数据作为一种新兴研究范式在教育领域得以推广应用,在某种层面上也是统计学中“大数定律”(又称“伯努利大数定律”)科学性的反映,即在随机事件的大量重复中事物会呈现出必然规律,由此通过分析足够多的随机数据来探寻教育规律成为教育大数据研究的基本原理。大数据研究的核心技术是数据挖掘(Data Mining)或数据库知识发现(Knowledge Discovery in Database)。人们通过机器学习、学习分析、聚类分析、社会网络分析等能挖掘出教育关键特质,发现现象背后隐藏的教育规律,从而达到知识发现的目的。较之以文本分析、内容分析、问卷调查、访谈和行动研究等探寻知识机理的传统教育研究,数据挖掘是大数据时代获取知识的重要手段。一方面,大数据能为教育研究提供众多工具支持。如可用Google Sheets、EDM Workbench等清理、组织和创建数据;用Rapid Miner、SPSS等对数据集进行分析建模和模型验证;用Tableau、D3.js等进行可视化的社会网络分析(斯特凡·斯莱特等,2018)。另一方面,大数据提供了多样的数据挖掘技术。丰富的数据挖掘工具实现了大数据分析技术、处理技术、分布式计算技术和可视化技术的融合,但数据挖掘“并不过分依赖于严格的逻辑推理,而是大量采用‘黑箱’方法和本质上是探索性的方法”(马江洪等,2002),如数据分析中常用的遗传算法、神经网络、判别分析、回归分析、决策树方法、模糊集方法等,使人们能基于趋势、时间、频率、偶发、周期和系统变量等进行数据分析,而这些是无法通过传统线性数据分析得出的(La Red Martinez et al.,2016),这就为探清隐藏数据背后的知识系统提供了支持。
大数据时代,多样的数据挖掘工具和分析技术使教育研究走向智能化,数据成为一种基础性、可利用的再生资源。研究者能反复利用这些教育数据并进行再开发,用数据弥合教育大数据研究中理论假设的不足;同时人们利用数据挖掘技术还能将现实世界转化为数字化的镜像世界,并用多种算法提取镜像世界特征,从而达到知识发现和知识管理目的。由此可见,教育大数据研究范式表征了一种数据和算法共同驱动的知识发现模式。较之以理论假设驱动、知识验真为主的传统教育研究,教育大数据研究“利用统计学、机器学习等方法从掌握的数据中提取隐含在数据背后、人们事先不知道,但存在潜在效用、能被人理解的信息和知识”(刘涛雄等,2017),不断发现新知识或探究新的知识结构,形成了“理解问题领域—理解数据—数据准备—数据挖掘—评估新知识—使用新知识”(舒晓灵等,2017)的知识发现流程,挑战了传统教育研究中“选择问题—提出假设—验证假设—得出结论”的知识验真流程,这在一定程度上撼动了波普尔提出的证伪科学理论,创新了教育知识生成路径。因而,实践论层面的大数据研究范式表征了一种“自下而上”的知识发现模式,更关注知识的动态生成和相关教育理论模型的确立,具有扎根理论的研究特性,凸显了大数据分析技术在宏大教育叙事和泛在知识环境中的核心作用。
在教育科学和实证科学的共同影响下,教育大数据研究已走出纯粹的经验主义,从对他学科、他领域、他范式的依赖转向自我研究体系的生成,旨在探求本土教育理论与实践规范的特色创新,在学科层、研究层和应用层中构建出各异的发展图式。换言之,大数据范式只有真正运演于科学发展和社会现实境遇,才能彰显自身存在价值。
1.加速教育研究的本土话语体系构建
信息技术与国力民生、政府规划、教育改革等的融合,加速了智能化、网络化和创新型社会的建成,使数据成为促进国家发展的一种重要战略资源。2018年,我国数字经济水平跃居全球第二;截至2020年3月,我国网民规模达9.04亿,其中学生网民占比26.9%;在线教育用户规模达4.2亿,较2018年底增长2.26亿(中国互联网络信息中心,2020)。我国已从“数字中国”的基础建设阶段迈入“数字强国”阶段,但也还有很多亟待解决的问题。一直以来,我国对本土教育问题的解决多借鉴国外研究经验,常以哲学、心理学、社会学等概念系统为解释框架,缺乏自我问题解决机制和教育理论的内在探索,研究者也惯于移植他学科研究方法,照搬或仿照他学科研究逻辑和话语表达方式。虽然学界短期内产出大量教育研究成果,教育研究体系也得以完善,但本土教育研究者却一度丧失话语主动权,甚而陷入“失语”(高伟,2020)境地,难以促进教育理论系统、研究系统和实践系统的发展,未能形成具有中国特色的教育研究话语机制。
当前大数据范式的出现冲击了传统教育研究范式,为研究者构建本土教育研究话语体系奠定了基础。一方面,教育研究者能以本土数据为研究样本,扎根中国教育现实反映本土教育问题,致力形成自组织的问题发现和问题解决机制,为广大教育教学人员提供一套针对本土教育的解释框架。另一方面,研究者可立足教育科学范畴,遵循“科学—实证”的研究进路,在数据和算法的双重驱动下“‘价值中立’地呈现教育事实,并通过实证的方式揭示教育规律、或提出教育理论假说、或建构教育理论模型”(吴元发,2015),为本土教育问题解决提供方法论指导。因而学界应继续促进教育大数据范式的推广应用,促进教育科学理论和实践规范的产出,完善和巩固中国特色教育研究话语体系。
2.促进跨学科研究领域的兴起与不断涌现
大数据范式开辟了教育研究的数据立场或算法视角,打破了传统定量研究与定性研究的边界限制,为研究者提供了一种数据核心的公共概念或“语言”,打通了不同学科领域间联系,并推动教育研究的跨学科发展,滋生出大量新兴研究主题或内容。
一是有关教育理论模型或实践模型的研究,特别是学习模型的开发。未来人工智能境遇下的教育将不再以知识复现或技能掌握为目标,而是以学生核心素养或关键能力发展为主,不断突出学本化、生本化的教育理念,对学生主体性、学习机制的探究将成为教育研究的重点或热点。大数据研究可以通过构建学生学习模型,帮助教育教学人员了解、掌握和管理学生行为或活动痕迹,进而把握学生学习规律和教育发展水平,并能参照模型结构开发出具体的教育教学评价标准,促进教育领域的标准化建设,密切教育学与文化学、生态学等的联系。
二是有关教育价值形态的研究。当下海量数据的涌现,以及社交软件对用户生活的全方窥视,给信息文化安全、师生隐私保护、教育舆情监测、教育治理等带来巨大挑战。为深化社会主义核心价值观、思政课程、教育伦理、优秀传统文化等价值类、社会类教育研究主题,稳定教育研究秩序,研究有必要沟通教育学与政治学、社会学等的联系。
三是有关教育智慧的研究。当前大数据综合使用统计学、计算机科学、学习科学、情报学和管理学中的关键技术或操作原理,对研究者的媒介素养、实践能力等提出了较高的要求。面对复杂的教育网络系统和流变的数字环境,教育研究效能将取决于“人—机”互动效果,这就拓展出一系列新兴研究命题,如大数据、人工智能、智慧教学、学习空间等。不过丰富的研究内容实质上仍聚焦教育与人、教育与社会、教育与自然等关系的探讨,如何发挥教育主体研究智慧才是关键。因此大数据驱动的教育研究,应始终关注教育内涵的深层理解和教育研究活力的激发,将不同学科研究者组织成一个教育研究共同体,助力教育学科体系、研究体系和话语体系的一体化建设。
3.提供教育科学决策的定制化服务
截至2020年3月,我国在线政务服务用户规模达6.94亿,占网民整体的76.8%(中国互联网络信息中心,2020)。这种“互联网+政务服务”的大数据运用模式强化了相关行政决策或管理部门的服务职能。“教育研究作为一种有计划的、有意图的干预”(瞿葆奎,1988),应突出大数据的教育决策服务功能。教育大数据研究以教育学为基础,“将淡化、沟通甚至彻底消除学科边界,将局部还原论下的专业性社会认知和建构升级为广域的社会整体系统认知和建构过程”(米加宁等,2018)。它整合了政治学、经济学、人类学、社会学等领域,为教育决策者或管理者提供了一个全新的认识框架,还为教育决策的精准服务奠定了基础。具体表现在:
其一,开放共享的数据库为各级教育部门提供了决策服务。数据库是一个由数据集成的信息存储仓,高性能、高兼容、可伸缩的存储性能增强了服务器或云端的数据载荷力,库中丰富的历史数据和即时数据提供了大量有价值信息,能为各级各类教育部门或机构提供数据咨询服务,并为相关教育计划、方案或政策制度的编写提供证据支持。
其二,大数据驱动的数字化监管模式提供了教育预警服务。依托大数据平台和技术,人们实现了电子化的远程实时监测,能即时反馈不同教育教学人员的活动信息和变化区间,减轻了教育部门的管理负担或运行压力。同时大数据监测系统还能提供在线教育分析报告,帮助教育管理者客观把握教育发展水平,并找出其中存在的问题,进而建立相关预警机制确保决策安全。
其三,实时动态的大数据跟踪和反馈为教育舆情分析提供了服务。通过对最新教育事件或热点领域的峰值截取和跟踪,教育管理者能迅速找出其中的强相关因素,制定出应急方案针对性地解决问题,最终将舆情事件置于可控范围。
虽然大数据使教育决策更加科学化、高效化、多样化,但非结构化数据产生的杂质信息也加大了教育决策难度,如今纯粹的数据决策式参考是难以实现教育精准服务的,未来还需更多教育主体或利益相关者参与其中发挥集体智慧,构建出科学合理的教育决策机制。
四、教育大数据研究范式的应用限度
大数据范式作为一种新的教育研究理论、行为规范或实践工具,改变了已有的教育研究生态系统,其在教育实践改进、教育决策科学化、教育研究效能提升等方面具有重要意义。不过较之政治、经济、社会等领域,教育具有其独特性、人文性和复杂性,大数据研究范式在教育领域的推广应用势必遭遇更多困难与挑战。为发挥教育研究的最大价值效能,有必要关注大数据研究的教育应用限度。
第一,警惕数据主义认知“囚笼”,提升研究者数据素养。大数据研究一般是以海量教育数据的占有为前提,之后通过对全样本数据的整全描述分析来揭示教育问题,研究过程需要计算机、算法或统计分析软件的深度参与,这就使研究者极易产生“数据主义”“技术主义”的认知偏向,将教育大数据研究等同实证研究、技术研究。事实上海量数据中仍存在不少杂质信息或冗余数据,如何利用信息技术甄选、辨别和提取出有价值的教育数据,如何解释数据和理解数据才是教育大数据研究的关键。教育大数据本身并无对错,其价值是在人们的教育实践中根据个人期待和目的所赋予的(冯锐等,2020)。因而研究者应提升个人数据素养,包括数据意识、数据分析与处理能力、数据解释能力、数据反思力等,在学会理解和运用数据中,使数据真正服务于教育教学研究。
第二,重视数据话语权分配,提升教育大数据研究的公共功能。大数据如今已成为国家基础性战略资源,教育大数据是其中一种宝贵资产。教育数据资源的占有量意味谁能掌握教育主动权和话语权,因而引发了人们对教育大数据资源的竞争。这容易导致忽视教育数据质量、出现教育数据垄断、话语霸权等现象,也可能使研究偏离服务教育教学发展的根本目的,主体间的教育研究矛盾或利益冲突加剧,产生教育研究的功利化、形式化等问题。因此,有必要发挥大数据在教育智库建设方面的作用,将不同教育数据或主体诉求统一于智库系统,形成基于证据的教育决策、教育管理和教育实践,使教育大数据或大数据研究结果更好地服务于教育建设与发展。
第三,加强教育数据的安全管理,避免引发教育大数据研究的伦理危机。如今信息网络技术实现了数据的开放共享,研究者能快速获取各种教育数据或资源,但在教育数据采集、分析、转化、处理与存储过程中,教育数据的开放共享会带来数据滥用、数据失信、数据失真、用户隐私外泄、安全威胁等问题,引发人—机矛盾、权责失衡、道德沦丧、情感危机等,这些问题有些是人为造成的,有些是技术异化所致。较之传统教育研究,大数据时代的教育研究应重点破解伦理命题,形成关怀主义的研究倾向;依托大数据法律法规,加紧研制教育数据安全管理规范,对教育大数据进行伦理审查;在教育数据库管理中,分层分级确定不同人员的教育数据访问权限、等级和数据使用限度,并将社交网络匿名保护技术、数据水印技术、风险自适应访问控制(冯登国等,2014)等安全技术应用于教育数据发布与管理过程,确保教育大数据安全及用户隐私得到保护。
封面图片来自互联网