理论探索 | 冯文全 马星光 张倩:论我国教育研究范式的转变——基于大数据的视角
大数据时代的到来不仅改变了人们的生活、工作和思维方式,而且将引发科学研究范式的转变。在大数据时代,科学研究更加注重全体而非抽样,更加注重发现而非实证,更加注重研究效率而非精确度,更加注重相关研究而非因果研究。与此同时,我国教育研究范式也存在着诸如重文献研究,研究方法单一,缺乏理论基础与分析框架等问题。因此,教育研究范式的转变势在必行。我国教育研究范式不仅要重视公共教育数据资源的深度挖掘,全方位、多方法的数据收集,理论基础与分析框架的清晰确立,而且还应重视知识理论的原创性贡献。
大数据;教育研究范式
随着科技的发展,互联网和信息技术的广泛应用,大数据悄然兴起,改变着人们的生活、工作和思维方式,也影响着经济、教育、科技、文化等社会生活的各个领域。有学者将挖掘与应用大数据的意义提到与20世纪90年代初倡导的“信息高速公路”相并列的高度——认为美国政府于2012年3月发布的《大数据研究与发展倡议》是继其1993年宣布“信息高速公路”以来又一次重大科技部署,[1]大数据给教育乃至整个社会带来了一场变革。就科学研究而言,大数据引发了科学研究范式的转变。
何为“范式”?“范式”(paradigm)是由美国著名科学哲学家托马斯·库恩(Thomas S. Kuhn)于1962年在其《科学革命的结构》(The Structure of Scientific Revolutions)一书中提出的,他在此书中系统地阐述了关于“范式”的概念与理论。库恩认为:“范式有两种意义不同的使用方式。一方面,它代表着一个特定共同体成员所共有的信念、价值、技术等构成的整体。另一方面,它指为着那个整体的一种元素,即具体的谜题解答,把它们当作模型和范例,可以取代明确的规则以作为常规科学中其他谜题解答的基础。”[2]同时,库恩也认为,在科学研究中存在着不同的范式,这些范式不是一成不变的,它在科学研究的进程中完善、发展,最终可能退出。随着科学研究的发展,新的信念、规则和技术会取代原有的信念、规则和技术,新范式会出现,并完善、扩充或者代替旧的范式,这就是科学发展进程中的科学革命。
什么是大数据?国际数据中心(IDC)在2011年的报告中定义了“大数据”:“大数据技术描述了一个技术和体系的新时代,被设计为从大规模、多样化的数据中通过高速捕获、发现和分析技术提取数据的价值。”[3]这个定义刻画出大数据的四个显著特点:(1)大容量(volume):数据的总体容量大,数据可以产生于网络、机器、人的行为等。(2)多样性(variety):大数据类型多样,包括结构化的数据、半结构化的数据和非结构化的数据。(3)高速度(velocity):数据产生的快速性,每一天都有大量的数据产生;数据需要及时处理,否则其价值会大大降低。(4)价值性(value):海量的数据意味着潜在的巨大价值,通过数据分析,能使价值得以实现。
大数据时代的到来使科学研究的范式发生了变革。2007年,图灵奖获得者吉姆·格雷(Jim Gray)在其演讲中描绘了科学研究的第四范式即数据密集型科研(Data-intensive Science Discovery)。格雷认为,从进行科学研究方法的角度看,从古至今的科学研究方法包括:(1)实验科学(experimentation),它出现于一千年前,是对自然现象进行描述论证及系统归类的研究方法。(2)理论推演(theoretical),它出现在几百年前,主要利用模型和归纳开展研究,由特殊到一般进行推演。(3)计算机仿真(computational),它开始于几十年前,主要运用计算机模拟复杂现象,科学数据可以用模拟的方式获得,不再依赖于单一的实验。(4)数据密集型科学(data-intensive science),它是在前三种方法的基础上,采用计算机分析、处理、储存、统计大数据,从中获取知识。
大数据技术带来了新时代科学方法的新形式,而基于大数据技术的密集型科学的发现为科研的发现提供了新范式。大数据是相对以往小型、局部性数据而言的,在利用大数据进行分析和工作时,科学研究也呈现出区别于其他类型科学研究的新特征。
以往的科学研究数据源于样本,抽样的标准、方法以及抽样的数据和代表性关系到科学研究的进程以及科学研究结果的质量。而在大数据时代,“随着储存和软硬件的经济性和工具的先进,海量数据的处理能力得到提升,数据挖掘算法不断改进与丰富,特别是统计分析和机器学习的神经网络建模技术发展,抽样并非是必要的手段和方法论”[4]。因此,在大数据时代背景下,科学研究可以在不受样本影响的情况下处理与某个现象相关的数据,并发现数据背后的规律,从而建构科学研究的意义。
传统的实证研究强调在理论的前提下建立假设,然后通过随机抽样的定量研究法获取数据,验证假设,证伪理论的适用性,这是一种自上而下的决策和思维过程。而在大数据时代,科学研究更加注重知识的发现及预知,探索未知的知识领域,在没有理论假设的前提下,去挖掘信息,再对其进行分析、处理,从而预知事物的趋势与规律,这种预见性是一种自上而下的知识发现过程。因此,在大数据时代背景下,科学研究将更加注重发现,预知事物的发展趋势及内在规律。
在传统的科学研究中,每条数据都包含该研究所需的信息,然后对信息进行归纳、抽象等处理,这使得研究的精确度得以确保。而在大数据时代,海量的数据意味着巨大的价值,通过数据的挖掘、分析、处理等,数据的价值得以实现。但是,海量的数据也意味着数据价值密度低,科学研究也存在误差及不确定性。正如有学者指出:“如今,我们已经生活在信息时代。我们掌握的数据库越来越全面,它不再只包括我们手头现象的一点点可怜的数据,而是包括了与这些现象相关的大量甚至全部数据。我们不再需要那么担心某个数据点对整套分析的不利影响。我们要做的就是接受这些纷繁的数据并从中受益,而不是以高昂的代价消除所有的不确定性。”[5]因此,在大数据时代,科学研究将更加注重研究的效率,允许研究的误差及不确定性。
传统的科学研究主要通过推理来揭示变量之间的因果关系,而在大数据时代,科学研究不再仅仅只关注事物之间的因果关系,而是转向关注事物之间的相关关系,问“什么”而不问“为什么”,从而找出事物发展中的规律。“大数据的研究不同于传统逻辑推理研究,而是对数量巨大的数据做统计性的搜索、比较、聚类、分类等分析归纳”[6],从而精确地找出事物之间的相关关系,进而为研究者提供新的研究视角。因此,在大数据时代,“我们需要改变我们的操作方式,使我们能收集到所有的数据,而不仅仅是使用样本。我们不能再把精确性当成重心,我们需要接受混乱和错误的存在。我们应该侧重分析相关关系,而不再寻求每个预测背后的原因”[7]。
改革开放以来,“范式”概念的引入为我国教育研究注入了新鲜血液,有力地推动了我国教育理论的研究与发展。而大数据时代的到来,带来了科学研究新范式的发展,传统的教育研究范式面临着挑战,因此,反思我国教育研究范式存在的问题是必要的。
文献研究法主要是通过搜集、整理和分析文献,从而形成对研究对象的科学认识,文献研究法具有适应性较强、方便易行、省时省钱、效率高等特点。长期以来,因我国教育研究受经费、研究者自身条件等因素的限制,文献研究法被教育研究者广泛应用。不得不承认,在改革开放之初,在我国急需了解与借鉴国外教育理论、政策、经验,同时教育研究经费不足、条件有限的情况下,文献研究法为我国教育研究及理论的发展作出了重大贡献。但是,文献研究法是一种比较被动的研究方法,因为有些文献资料很难获得,现有的文献难以系统地、全面地反映研究对象的总体特征,有些文献的价值难以确保甚至与事实脱节。因此,在大数据时代,文献研究法已不能满足教育研究的需要,采用多种研究方法,使研究方法多样化已成为教育研究必须要解决的问题。
按照托马斯·库恩的观点,区分科学与非科学的标准是看有无范式,是否在范式的指导下开展研究活动。库恩认为,在常规的科学时期,“范式既是科学家观察自然的导向,也是他们从事研究的依据。范式是一个成熟科学共同体在某一段时间内所接纳的研究方法、问题领域和解题标准的源头活水”[8],换句话说,范式赋予了某科学共同体内科学研究者相同的科学信念,也为其提供了相同的观察视角、分析思路及技术方法来审视研究对象。范式规范着科学研究者的研究活动,范式的不同会导致研究思路及方法的不同,最终导致研究结论的差异。一个科学研究者如果在范式的框架下从事研究活动,那么他的研究活动就是科学的,反之,则不科学。在过去很长一段时间内,我国的教育研究重文献研究,研究方法单一,缺乏理论基础与分析框架,这往往给人一种“不科学”的感觉,虽然近年来我国学者已将社会学、生态学、经济学等学科理论与框架应用于教育研究之中,但由于主要是借鉴外国的研究理论与分析框架,因此我国教育研究仍缺乏明确的理论基础与分析框架,所以,在大数据时代背景下,理论基础与分析框架的确立刻不容缓。
我国教育研究的重要目的之一即借鉴国外先进的教育制度、理论和经验,改善本国的教育实践。长期以来,由于受西方强势文化的影响以及我国研究者原创思维的缺乏和浮躁的心态,实质性的中国教育理论并未真正形成,取而代之的是借鉴、吸收和模仿。[9]不得不承认,我国教育研究者把国外先进的教育理念、制度及经验介绍到我国,为我国教育制度的建设、教育理论的发展及教育改革等作出了重大贡献。但是,照搬国外的教育理论惯性成了所谓的“研究”,而真正本土化的理论范式及创新可谓是凤毛麟角,甚至销声匿迹。[10]有学者指出:“问题及解决是理论生成的出发点及归宿,问题意味着智慧,人们发现了问题,往往意味着人们有了新的思维方式和研究视角,才会有破旧立新之举和原创性的成果。”[11]但是,照搬国外教育理论、与我国具体的教育实践相脱离的非本土化教育研究谈何发现问题?谈何产生新思维、新视角?谈何理论的创新?因此,在大数据时代背景下,教育理论的创新迫在眉睫。
在我国,教育研究主要从宏观上对世界各地的教育理论、制度等进行描述性的研究,基于证据的研究缺乏,尤其是基于大规模调查研究和大数据库的研究很少。什么是基于证据的研究?戴维斯·菲利普(Davies Philip)指出:“基于证据的教育研究有两个操作层面:一是利用世界范围内研究已得出的结论和教育及相关文献证据,二是在现有的证据匮乏或已有的证据存在疑问、具有不确定性及薄弱性的地方建立好证据。”[12]换句话说,基于证据的教育研究应建立在客观事实基础之上,这种客观事实是通过观察、整理、分析已有的证据或用其他研究方法建立好证据去证实了的。基于证据的研究“最大限度地消除研究者基于个人主观偏见、价值立场和政治倾向等的自我诠释,回归到以量化和数据分析为主要方式的客观性解释”[13]。在大数据时代,教育研究应把“数据”作为研究的基础,强调全样本性,通过整理、分析、处理海量数据中的相关性寻找事物间存在的规律。描述性的研究往往是不够的,基于证据的教育研究是急需的。
面对以上问题,我国的教育研究范式转变势在必行。我国教育研究范式转变首先要适应大数据时代的要求,其次要建立科学的研究范式。因此,我国教育研究范式的转变也有多方面的要求。
美国麻省理工学院在其《科技评论》(Technology Review)杂志上提出,在未来5年对人类产生重要影响的十大新兴技术中“数据挖掘”居于第三的位置。数据挖掘被称为未来信息处理的骨干技术之一,是因为它正以一种全新的概念改变着人类利用数据的方式。在大数据时代,“数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下”[14],因此教育研究者应深度挖掘数据。所谓的数据挖掘是指综合运用统计、机器学习、人工智能、高性能计算、数据可视化等技术和方法,对大数据进行分析、处理,再通过数据建模,发现研究对象的相关关系,从而预测研究对象的发展趋势及规律。在大数据时代,教育研究者不用亲自去获取研究数据,可以充分利用现有的数据库,挖掘公共教育数据资源,探求数据背后的复杂关系及教育规律,并发现解决问题的方法,这便是教育研究的一个创新点。如今,国际组织、世界各国及地区等都建立了相应的数据库、网站等,如OECD(世界经济合作与发展组织)建立的PISA项目数据库(针对基础教育阶段学生学习成绩的国际学生评估项目数据库)和AHELO项目数据库(针对大学生学习质量的国际高等教育学习成果测试项目数据库),联合国教科文组织关于教育中性别方面、全民教育方面等的数据库,世界各国教育部建立的官方网站等。
随着研究条件的不断改善和大数据时代的到来,研究方法的多样化以及研究方法的转型、创新已经成为时代及科学研究的客观要求。研究方法是决定研究质量的关键因素,是研究者们进行研究时所采取的步骤、手段及方法的总称。由于社会及科学技术的发展,不同的时代都有其时代所特有的科学研究方法,从借鉴时代的经验描述到因素时代的历史研究、因素分析法,到社会科学时代的科学量化法、问题解决法等,我国教育研究不断地汲取其他社会科学的研究方法,同时也将自然科学的研究方法应用于教育研究之中,不断地丰富、拓展着我国的教育研究方法。在大数据时代,我国教育研究应该突破传统的文献研究法、历史研究法等,多去尝试其他社会科学和自然科学的研究方法,多层次、多方面、多指标、全方位地收集有关研究对象的数据资料,并对这些数据资料作出科学的分析、处理,从而建构意义,促进我国教育理论、研究方法的创新与发展。
大数据时代的教育研究,首先要运用多种途径和方法深度挖掘数据,使教育研究建立在证据基础之上,即基于证据的教育研究。其次要运用理论基础与分析框架对获取的数据进行科学的分析,使研究结论言之有物、令人信服。那么,如何确立清晰的理论基础与分析框架?在大数据时代,社会的发展与技术的进步,既为教育研究带来了新的视角,也为教育研究提供了新的研究工具与研究手段。教育研究者可以从不同的视角,运用其他社会科学和自然科学的理论分析框架去解释数据,使教育研究的范式多样化。同时,现代信息技术、测量和统计手段、脑成像技术等为教育研究提供了更好的研究工具与手段,因此,从外显行为到大脑内部、从个体到群体的全方位研究已成为可能,研究者可以使用新科技来建构新的教育理论与分析框架。在大数据时代背景下,我国的教育研究者应敢于打破传统的教育研究范式,敢于用新的视角与新的科学技术,提出新的教育理论与分析框架,打造出适合中国国情和思维方式的研究范式。
所谓的“原创性研究是最初解释特定研究对象构成要素和运行与发展规律的研究,或最早提出特定的解决问题的思路或模型与方式的研究”[15]。自改革开放以来,我国教育研究主要是借鉴国外的教育理论、制度、研究方法等,“惟洋是瞻,跟风国内,风起潮涌,到处可见重复研究和模仿之作;研究中没有自己的原始性素材,没有自己的话语和表述方式;研究成果缺乏中国文化的意蕴,缺乏中国教育实际的根基,缺乏独特理论创造的底气”[16],原创性是研究的生命,是研究必须遵循的基本准则,也是学术评判的最高准则,因此,要高度重视研究的原创性。在大数据时代,教育研究者更应“追求教育研究的独立性、自主性和应有尊严”[17],少借鉴外国的教育理论与分析框架、制度经验等,而应多运用现代化的技术手段获取第一手数据资料,然后进行独立而独特的教育研究,得出具有创造性的研究成果,并产生引导性的影响,从而“改变教育研究领域对外界的依附性地位”[18],为中国教育科学及理论的发展作出原创性的贡献。
注释
[1] 王小波.破解教育难题的战略选择——挖掘大数据的教育金矿[J].中小学信息技术教育,2013,(10).
[2][8] 托马斯·库恩.科学革命的结构(第四版)[M].金吾伦,胡新和,译.北京:北京大学出版社,2012:147、158.
[3] Gantz,J.,& Reinsel,D. Extracting value from chaos[R]. IDC iView,2011:1-12.
[4] 沈洁,黄晓兰.大数据助力科学研究:挑战与创新[J].现代传媒(中国传媒大学学报),2013,(8).
[5][7][14] 维克托·迈尔-舍恩伯格肯,尼思·库克耶.大数据时代:生活、工作与思维大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013: 56、921、34.
[6] 李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学学院院刊,2012,(6).
[9][10] 柳海民,林丹.困境与突破:论中国教育学的范式[J].东北师范大学学报(哲学社会科学版),2007,(3).
[11] 柳海民,李伟言.教育理论创新原则:缺失归因与解决策略[J].教育研究,2003,(9).
[12] Davies,P. What is evidence-based education?[J].British Journal of Educational Studies,1999,47(2):108-121.
[13] 阎光才.对英美等国家基于证据的教育研究取向之评析[J].教育研究,2014,(2).
[15] 傅维利.教育研究原创性探析[J].教育研究,2003,(7).
[16] 李如密.教育研究中的原创性问题[J].太原师范大学学报(社会科学版),2003,(9).
[17][18] 吴黛舒.教育理论原创的应有之义[J].教育研究,2002,(7).
(责任编辑:刘宏博)
论文来源于《教育科学研究》2016年第8期