查看原文
其他

【独家】用数据揭示中国大学生学习过程的黑箱(视频+图文实录)

2017-05-09 数据派THU

[导读]本内容选自清华大学教育研究院教授、常务副院长史静寰,在2017年4月28日“清华大学数据之上的教育研究——清华大学教育大数据论坛”上的发言。

史静寰老师的主要研究方向为高等教育学、教育史、国际与比较教育、大学生学习与发展研究等。她曾任北京师范大学教育系副系主任,中国教育学会中青年理论工作者研究会理事长、日本北海道大学高等教育研究与开发中心特聘教授等职。现任清华大学教育研究院常务副院长,中国高教学会院校研究分会副理事长,英国曼彻斯特大学教育学院客座教授,澳大利亚大学质量评价机构海外评估专家。并主持过“中国大学生学习与发展追踪调查”(CCSS)等多项重大课题,多项研究成果获全国教育研究优秀成果等奖项。(注:因研究尚未发表,应CCSS课题组要求,部分PPT中隐去具体数值,如需引用研究发现请与清华大学CCSS课题组联系。此篇文章不提供PPT下载,欢迎转载和收藏)



以下为课程视频,建议在wifi条件下观看。暂时看不了视频的朋友,可观看下面的图文实录哦!


https://v.qq.com/txp/iframe/player.html?vid=t0399q2i705&width=500&height=375&auto=0


以下为演讲原文:



感谢各位来参加今天的活动,我非常感谢清华-青岛数据科学研究院和教育研究院合作举办此次活动。我也特别开心清华大学全球学校与学生发展评价研究中心正式成立。我们在考虑这次会议的主题和演讲嘉宾时,也充分考虑了大数据、数据这样一些概念在不同的学科与不同领域里中所具有的一些不同的含义。最终,我们选择了“数据之上的教育研究”


信息时代的发展,出现了“大数据驱动教育变革”,“大数据时代教育面临的挑战”等各种说法。可见,信息科学的发展、信息技术的进步等对于教育变革的影响已经被越来越多的人们所意识到。但是否同样地影响到了教育研究呢?教育研究作为一个独立的学科领域,在目前所谓大数据的冲击下,它的情景怎么样?刚才师大的黄荣怀教授,是我们教育技术领域里非常知名的学者,他不但在技术层面,而且在教育研究领域中也有着非常深入的研究。北大的丁小浩教授是做定量研究出身的学者。但是我们在说到大数据对教育研究影响的时候,都会比较谨慎,这是因为我们还没有能够真正看到,在教育研究过程当中,数据真正能改变教育研究什么?因为人太复杂,现在的证据还不足以去支撑数据能够揭示教育研究,改变教育研究的范式,但是我们已经意识到了这是必须要面对的现实。


今天我选择了一个很小的题目,也是教育研究经典的题目,即人是怎么学习的,人在学习过程当中,真正影响他的一些因素都有哪些。我们也不敢说有大数据,因为人的学习过程太复杂了。



“大数据的时代已经降临”或“大数据引起了一场革命”的说法,在社会生活中大家或多或少已经感受到了,特别是在我们生活层面。但正如乔布斯所说,“计算机引起了那么多的变化,但好像在教育领域里似乎影响并不像人们期待的那样。”我们国家政府层面已经充分意识到了大数据对变革教育方式,促进教育公平,提升教育质量支撑等的作用,并号召发挥教育大数据在教育管理平台建设和学习空间应用等方面的重要价值。


那么,接下来的问题就是如何发挥教育数据在教育研究中的作用,特别是如何利用数据来揭示教育研究经典性的问题——人是如何学习的,或者聚焦到我们的课题研究,即大学生学习的复杂性问题。



我们知道,人从出生,作为一个生命的存在,学习就开始了。但真正进入到学校教育过程的时候,我们会发现人们为学生学习创造了一个专门的机构却被人们所不能控制甚至不能理解的很多因素的影响。


人进了学校,变成了学生,学生的主要任务是学习。但为什么同样的老师教同样的课程,花同样的精力,但学生的学习结果非常不同,甚至学习体验也不同。在这个过程当中,当我们抱怨学校教育生产的“产品”参差不齐,或者社会对这种教育产品并不满意的时候,我们会归因于教育本身。那么,到底在教育过程中发生了什么,会使得有些学生成为优秀的毕业生而有些学生被社会上认为是存在问题的学生。这中间的过程就被称为学习过程的黑箱,因为在这个过程当中,存在着太多复杂的因素,比如人的主观认知能力、学习动机;教学的组织、教学的方式,教师自身的水平,教师对职业的看法,以及学校的条件,甚至社会的支持,还有其他学生的影响等等。所有这些因素都是在这个黑箱中我们试图去揭示的,但是却难以捕捉到。



过去传统教育研究是在经验层面或是基于我们的思辨基础上,去揭示教育中我们认为重要的原理。在这个范畴中,教育成为了门槛最低的一种研究。我们常说:人人都认为自己懂教育,除了搞教育研究的人之外。而且越搞教育研究,越觉得你自己不懂教育,因为人太神圣,人的学习过程太神秘,人的学习经历是我们现在远远没有揭示的一种智慧性活动。



大数据的出现在一定程度上使得黑箱子中所具有的复杂因素成为了较为稳定的证据,把它采集、收集起来,便构成我们对教育过程黑箱的一种了解。因此,我们认为,大数据会帮助教育科学的发展,而且是教育研究走向科学的一个重要基础。    



教育是人类所特有的一种非生物遗传的现象,学习是人脑最复杂的制式行为,大规模的实证数据则可以帮助我们更好地去揭示教育和学习的奥秘。我们坚信这一点,也希望接下去我们中心和在座的各位用各种不同的方式来共同完成这一任务。大学既是数据的生产者,也是数据的使用者。那么如何利用数据去来解答我们的困惑。



我想用“中国大学生学习与发展追踪研究”项目来解释这一问题。虽然,这是一项传统的结构化定量研究。还谈不上大数据,但已做了近十年,积累了近60万大学生学习过程的数据,因此一定程度上为我们理解黑箱中的事情提供了帮助。目前我们团队对大学生调查开发了一系列工具,比如应用型院校、普通本科院校、毕业生、精英型大学等各类问卷。从这几个工具上,我希望大家能意识到大学生学习研究的复杂性。因为不同的院校、不同的人才培养的定位、学生的学习行为与经历有可能大不相同。



作为结构化的定量调查,我们的工具有着非常清晰的结构。之所以不是用大数据,是因为它不是一个对相关数据随机的采集,而是一个精心设计的问卷。在问卷里包含以下几类指标,以帮助我们更好地认识学生的学习:


  1. 综合诊断指标。这是一个从国际上引进并已经稳定使用二十多年成熟的工具;

  2. 教育过程诊断指标,既有课堂教学行为层面,也有隐含的动机以及向学/厌学层面,还包含教学方式层面,主要帮助学校,特别是课堂教学的老师更好了解学生的学习情况;

  3. 学习诊断指标是针对学生的学习行为,特别是高阶认知、学习策略、多元学习等等。


这一个工具的开发是应对现代高等学校改进教育教学的需要,其最重要的一个功能是诊断,即通过对学生学习情况的调查,反映出来老师和学校教学过程当中的问题,进行诊断后给予改进。



传统定量研究必须要以数据可靠性作为保证,这与我们随机获取的数据不太一样。经过多年实践应用, 我们在保证工具的有效性,样本的代表性、数据的可信性上有了非常严格的控制和判断。


通过利用这60万左右的数据,我们针对不同问题会发现不同数据量,如下所示:



教育机会是如何?根据2011-2016年近40多万大学生调查样本的数据发现。家庭第一代大学生(教育研究当中表现教育公平很重要的群体)的比例稳定在70%左右。因此可知,高等教育的大众化使得原本少有机会获得高等教育的第一代家庭接受到了高等教育。


从学校类型来看,各类型高校第一代大学生占比中,学院本科最高,大学本科其次,近80%。除了学校的分布,也可以看到学生大致的分布情况。



有了入学机会后,学生在学校教育体验如何?客观成绩测是与斯坦福大学共同进行中美俄关于工科学生非常严格学生成绩的测查,包含数学、物理、批判性思维、量化素养四个科目。前两科是知识型的,后两科是综合能力型的。在这样四个科目的学习当中,学生测查的成绩,第一代与非第一代大学生学习结果基本上没有明显差异。


第一代大学生和非一代大学生差距主要表现在课外活动上,最明显的是对物质资源、对家庭经济资本要求比较高的拓展性学习活动以及研究相关类活动,在社会实践类上基本没有差异。而语言学习,海外学习,第二学位等等具有一定经济成本方面,对第一代大学生来讲,明显低于非第一代大学生。这使我们关注到大学生进入大学之后的学习经历和学习过程仍然有资源依赖这一鲜明特点。



数据所揭示的教育结果,通过与中俄数据相比发现:四科成绩,大一的学生无论是在哪一科上,中国学生的成绩都远高于俄罗斯同类大学。到大三学生的成绩测查,所反映出来结果,中国仍然高于俄罗斯,但优势比已经在下降。



需要思考的问题是:虽然中国的学生成绩已全面优于俄罗斯同类大学的学生,是否就表明中国高等教育质量更高呢?如果从教育增值的视角来看,发现中国学生成绩大一到大三增值的情况是低于俄罗斯的。但另一个发现又让我们不得不重新考虑大学的增值效果,两国的精英大学,我们挑最好的研究型大学,结果学生的成绩变化均为负。从这个意义上来看,并没有坚实的证据表明大学对学生成绩的提高做出了很大贡献。



再来看数据所揭示的教育过程,这是我们最关注的问题。因为过程决定了结果,要获得好的结果,要从改进过程做起。从影响因素上,我们综合考虑了学生自我汇报的教育收获和GPA, 并控制了性别、年级一些可能造成自选择偏误的因素。结果发现,学习投入综合指标、学习态度、学习策略均与学习结果显著相关,过程性指标总体的校标效度较好。另外,还发现学生的GPA和自我汇报的教育收获的影响因素略有不同。学生自我汇报的教育收获更多受学习态度、教育经验丰富度和校园环境支持度的影响,而GPA更多受学习态度和学习方式的影响。


由此,选择什么样的指标去评价学生非常重要。自我汇报的教育收获和GPA都反映了不同的学习结果。所以不应该仅强调客观,学生自我汇报的教育收获反应的一种体验性成长。



我们试图去探索到底是什么影响学生的学习?又是如何影响的?加入学生学习态度和行为后,为什么教学指标不再显著。因素有很多,我们现在的数据还难以解释,只能进行推测:可能是教与学中间有交互作用,也可能是学生的学习态度、行为在其中起了中介的作用。什么因素是如何影响到学生学习结果的,其实是一个非常复杂的问题。



教学对学生成绩的影响机制是复杂的,量化数据分析对几种假设路径都提供了支持,如何进行更深入的分析?现有的数据不充足,仅有数据也不充分。所以在这样的情况下,数据一定程度上引导了我们去思考更深刻的、更复杂的人的学习问题。



最后还想补充的是,使用学生自我报告的问卷,就要保证自我报告数据的真实性。那么,对于如何控制它的真实性我们也采用了很多技术手段:


  1. 对测谎题的设计;

  2. 对学生答题行为的监控,特别是针对网上答问卷。

  3. 自陈式数据的复杂性——社会称许性反应的控制。


其中第三个是非常重要的,学校是个育人的机构,学生潜移默化地接受了社会所期待他应该具备的那些特点,因此学生情不自禁地用他认为的学校和社会所期待的行为来表现自己内在。从而,学生是按照被赞许的方式而非真实情况填答问卷的。我们发现,越是被认为是比较地方的院校,社会称许性越高。控制因素后,会发现5%、10%的因素是在社会称许性上的差异。越高年级的学生,社会称许性越高。我们用这样一些数据来告知项目院校如何善用数据、如何正确使用数据。



现在数据正以飞快的速度积累与增长,数据云端的形成将大大地加速数据的采集、存储、应用和分析。大数据时代还有着大量非结构性的行为数据。结构性数据不能回答很多问题,我们有可能通过非结构性数据的采集和加入,为教育研究带来新的突破。数据驱动教育革命,同样驱动教育研究的变革。作为教育研究者,我们应该拥抱大数据带来的机遇


大数据时代的教育研究不再是一个仅靠理念和经验传承的学问,将变成一门实实在在的实证科学。实证研究何以成为教育研究这一问题,与和大数据的出现密切相关。它不仅要求未来的研究者具有深厚的教育情怀和理论修养,还要求具有扎实的数据分析技术和能力。


谢谢各位!

 

整理:张蕾

校对:胡蝶

编辑:刘文清


转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

公众号底部菜单有惊喜哦!

企业,个人加入组织请查看“联合会”

往期精彩内容请查看“号内搜”

加入志愿者或联系我们请查看“关于我们”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存