其他
新教育实验的阅读报告——改变,从阅读开始
新教育实验的学生阅读素养研究报告
——改变,从阅读开始
原文标题:《新教育实验的学生阅读素养报告》。作者,李东琴,苏州大学教育学院博士研究生,新评价研究所执行所长。
《中国教育学刊〉编者按:新教育实验从2000年开始,历经15年的发展,已经拥有60个实验区和近3000所实验学校,成为国内外广泛关注的民间教育改革样本。为了让大家更加全面系统地了解新教育实验的理论与实践,我们邀请新教育实验发起人朱永新教授和他的团队撰写了这组专题文章。其中,朱永新教授的文章介绍了新教育实验的缘起、发展与愿景,许新海博士的文章讲述了新教育实验对于区域教育发展的影响,李东琴博士的文章用实证研究的方法分析了新教育实验学校的学生在阅读能力方面的成长,余国志博士的文章则从新教育实验的传播力角度对新教育实验进行了评价。我们希望新教育实验沉淀下来的宝贵经验可以为素质教育的进一步发展提供借鉴和启迪,同时也为推动中国本土教育的发展贡献一份力量。
新教育实验以营造书香校园、师生共写随笔等十大行动为途径,以帮助新教育共同体成员“过一种幸福完整的教育生活”为目的。新教育实验的第一大行动——营造书香校园,旨在以“阅读”为核心,在校园中开展各种活动,培养师生的阅读兴趣和阅读习惯。在新教育实验学校中,晨诵、午读、暮省已成为许多学生的习惯。这样的坚持对学生阅读素养的提升是否真的有效?
在朱永新教授的倡导下,在新教育研究院的支持下,2015年4月新教育实证研究组成立。在美国休斯敦独立学区资深研究员叶仁敏博士的指导下,采取方便取样的原则,在全国选择了7个城市进行测试。所有学生在2015年10月的最后一周进行40分钟左右的测试。测试共有两个部分,第一部分是学习状况的调查问卷,第二部分是阅读水平测试。调查问卷参考美国“国际阅读素养进展研究”项目(Progress in International Reading Literacy Study,PIRLS),并根据中国学生的实际情况进行了改编,主要包括学校环境、阅读动机、阅读种类和习惯、阅读课、阅读兴趣、阅读能力和自信、数学学习和科学学习等8个方面的内容。阅读水平测试的试题是根据国家2011年的新课程标准进行编制的,从对阅读知识的掌握、阅读技能的训练和阅读能力(即阅读素养)的养成三大方面进行评价,对有关阅读问题的形成原因进行诊断,并提出改进建议。本报告的主要内容是对第二部分阅读水平测试的结果进行的分析。
一、评价工具和抽样方法
(一)评价工具的说明
本次学生阅读水平测试使用的测试工具是专业人员编制的测试试卷,采用中国教育学会中小学教育质量综合评价改革实验区办公室的学业素质能力评价系统(Ability and Competence Test System,ACTS)作为测量、数据处理、分析、评价工具。试卷的编制遵照以下流程进行:
①依据本次测试目的确定测量结构;
②根据2011年新课程标准对本学年学生在该学科上应达到的要求确定测量结构的范围(见表1);
③准备试卷双向细目表;
④根据试卷双向细目表编题;
⑤题目审查;
⑥试卷定稿,编写试卷使用说明。
从上述检验结果可以看出,总成绩的信度最优(信度系数超过0.9),考查能力的信度优于考查知识、技能的信度。总成绩的信度系数达到0.987,表明本次使用的学业测试工具的可靠性较高。考查能力的信度系数高于考查知识和考查技能的系数,表明测试工具在考查学生能力方面较知识和技能的可靠性更高。这完全符合2013年《教育部关于推进中小学教育质量综合评价改革的意见》文件中关于学业水平评价的要求:“主要考查学生对各学科课程标准所要求内容的掌握情况。通过对知识技能、学科思想方法、实践能力、创新意识等关键性指标进行评价,促进学生打好终身学习和发展的基础。”这也完全符合本次测试的目的——对学生阅读素养的量化研究。
(二)抽样情况说明
为保证样本具有全国性的特征,根据地理分布情况共选择了7个地区进行测试:华东、华北、华中、西北、西南、东北和华南。在前5个地区中新教育实验学校和非新教育实验学校各选3所,同时也是按地理位置进行选择的——市区、城乡结合地区和乡村学校,且配对学校(新教育实验学校和非新教育实验学校)的规模、地域和人口结构也相对一致。每所学校都是从4年级选2个中等水平的班级,人数在80名到100名之间。在实际操作中有些乡村小学的4年级总共只有两个班,全额参加。另外,在东北和华南新教育尚未设实验点,因此只是分别选择了3所学校作为非新教育的全国行政区数据样本。
二、评价结果分析与解释
本报告主要是从总成绩和分项成绩两大方面对新教育实验学校的学生(以下简称新教育)和非新教育实验的学生(以下简称非新教育)进行数据对比。
(一)总成绩
以下将从总成绩的独立样本T检验结果、各水平比率的方差检验结果和男女生差异T检验结果等三个方面进行分析。
第一,用SPSS 22.0软件对新教育和非新教育的阅读总成绩、知识分项、技能分项、能力分项进行独立样本T检验(见表3)。
从表3的数据中可以很明显地看出,新教育学生的阅读素养成绩远远高于非新教育的学生。4个T检验的差异都达到了极其显著的水平,小于千分之一(P<.001)。“素养”(能力)不是知识,也不是技能,而是个人获取或应用知识和技能的能力,以及兴趣、动机、学习策略等。知识的掌握、技能的训练与素养的养成是相辅相成的,如果知识学习的内容不合适、技能训练的方法不恰当,素养的提升也很难,而且素养(能力)的欠缺对知识的学习和技能训练也有制约作用。从表3中可以看出,新教育和非新教育的知识分项、技能分项和能力分项的分数排列都是一致的:技能分项成绩最高,能力次之,而知识最低。这说明学生的阅读技能获得的训练较充分,但与素养(能力)的养成和知识的掌握有一定的距离,说明有些技能的训练与知识和能力不匹配。知识较技能和能力稍低,但与能力相差不大,说明知识的掌握和素养(能力)的养成较匹配,且能力更强。
表4中,所有的P都小于0.001,方差分析中的差异值极大(当df=2,χ2>5.99达显著差异;χ2>13.82即为误差率小于.001水平的极其显著差异;而表4中的四个χ2>65.00),进一步说明新教育学生的阅读素养成绩远远高于非新教育的学生,且新教育总成绩的优秀率高于非新教育2.80个百分点,达标率要高出11.84个百分点,而不及格率要低14.63个百分点。
从整体比较看,新教育的优秀率和达标率远优于非新教育。从χ2的数据量和优秀率、达标率、不及格率的比较看,知识分项两组的差距是略小(χ2=66.42)的,技能和能力分项差距很大(χ2>125.00)。说明在学习同样的知识时,新教育的活动和措施获得了更高的效率,学生在技能训练和能力培养方面取得了更大的成绩。
第三,用SPSS 22.0软件对新教育和非新教育男女生的阅读总分、知识总分、技能总分、能力总分进行独立样本T检验(见表5)。
表5的所有P都小于0.001,说明新教育和非新教育的男女生差异极其显著。分析具体数据,可以得到以下信息。首先,新教育的男女生均比非新教育的男女生阅读素养得分显著的高。新教育的男女生都在技能训练上特显与非新教育的差别(在三个分项中,技能分项的标准差显示最大)。其次,仔细比较男女生之间的得分发现,无论新教育还是非新教育,女生的阅读素养得分均略高于男生,但新教育内部男女生的差异量(标准差的值)要小于非新教育内部男女生的差距,表明新教育学生的成绩相对比较稳定。因此,可以得出这样的结论:新教育学生整体的阅读素养是高于非新教育学生的。
(二)分项测评点的成绩
以下将用SPSS 22.0对知识分项(6评点)、技能分项(7评点)和能力分项(4评点)进行独立样本T检验。同时对每一评点的平均得分率(本项的平均得分占本项总分的比率——比率越高说明成绩越好)和分化度(本项的最高得分和最低得分的差距——数值越大说明差异越大)进行分析。
1.知识分项(见表6)
在知识分项中,字词评点考查字词意义的正确理解及恰当使用;句子评点考查句子的结构、语法及意义的正确理解及应用;语意评点考查文章片段、短文本的意义正确理解;语篇评点考查文本局部语句关系、段落关系、逻辑结构的正确理解;主题评点考查整体主观理解作者意图和创作动机(情感、目的);修辞评点考查修辞手法识辨的准确性,使用的合理性、丰富性和创造性。
通过表6的数据可以发现,新教育各知识分项的成绩除修辞评点外都高于非新教育。说明新教育的学生在知识的掌握方面(六细评点中的五评点)都非常显著地高于非新教育,且整体呈现优势。修辞的T值和P值都显示新教育与非新教育没有显著差异。另外,新教育和非新教育的语篇平均得分率同比最高,说明不论新教育还是非新教育的学生对语篇的掌握都是最好的。修辞的得分率最低,且分化度最高,对修辞测题的编制与探讨有待今后深入研究。
2.技能分项(见表7)
在技能分项中,认知评点考查信息的再现、再认及从长时记忆中提取相关知识的技能;理解评点考查从文本和图像等交流形式的信息中建构意义的技能;应用评点考查在给定的情境中执行或使用程序或概念的技能;推理评点考查根据已知条件进行预测、判断的技能;分析评点考查将材料分解为它的组成部分,确定部分之间的相互关系,以及各部分与总体结构或总目的之间的关系的技能;评价评点考查基于某种标准或准则面向对象进行判断及综合分析的技能;信息提取评点考查从给定材料中定向抽取相关信息的技能。
在表7的数据中,只有应用评点无显著差异,其他六评点得分比较P值都小于0.001,有极显著差异。可以看出,新教育各技能分项的成绩除应用与非新教育相同外,其他都高于非新教育,说明新教育的学生在技能的训练方面都非常显著地高于非新教育,且整体呈现优势。但新教育与非新教育的技能分项的最高得分率都是认知评点,说明新教育和非新教育的学生都偏重对认知技能的训练。然而,新教育和非新教育在应用评点上得分率都很低,说明学生对应用评点这方面的技能训练还不足,且分析评点这个技能掌握的情况不均衡、不稳定。非新教育的技能分项中分析评点得分率很低(得分<16%),且分化度相当高,说明非新教育的学生对分析技能的训练不充分,且掌握程度不均衡。
3.能力(素养)分项(见表8)
在能力(素养)分项中,词汇辨析评点考查对字、词的一般意思和特定意义的理解,以及对字词的归类、匹配及应用能力;语言理解评点考查对字词、语句、文本的一般意思和特定意义的理解,对概念和观点的理解,对语句隐含信息的合理推断,对各种形式的文字材料的理解能力,对语言深层内涵的理解能力;逻辑分析评点考查借助于语言,运用概念、推理、分析等方式对材料进行逻辑思考,简化或概括反映事物的本质和规律性的能力;自我认知评点考查对自己的洞察和理解,包括自我观察和自我评价,并据此进行自我控制与调整的能力,及能够认识自己的长处与短处,意识到自己的内在爱好、情绪、意向、脾气和自尊,喜欢独立思考的能力。
本次能力分项测试主要是对词汇辨析、语言理解、逻辑分析和自我认知等四个评点的评定。表8的数据显示,新教育的4评点的得分都极其显著地高于非新教育,而且分化程度都低于非新教育,说明新教育的学生阅读素养均高于非新教育,且整体呈现非常稳定的优势。
能力分项四评点中,新教育逻辑分析评点的得分率最高,而自我认知评点最低;从分化度上看,语言理解评点最低,词汇辨析评点最高。这表明新教育的阅读能力分项中,学生的逻辑分析最好,而自我认知较弱,语言理解的整体程度最好,词汇辨析的程度参差不齐,相差最大。非新教育的四项素养中,得分率最高的是词汇辨析评点,最低的也是自我认知评点;从分化度上看,最低的也是语言理解评点,最高的是词汇辨析评点。这表明非新教育的阅读素养中,学生的词汇辨析最好,而自我认知最弱,语言理解的整体程度最好,而词汇辨析的程度参差不齐,相差最大。
三、总结与发现
根据以上评价结果可以得出这样的结论:新教育学生在阅读素养测试中的成绩极其显著地高于非新教育的学生,这充分表明在小学阶段,新教育的活动和措施在学生的阅读素养的教学和发展方面取得了非常有效的成果。这一点从阅读的总分(表3和表4)以及三个分项(表6、表7和表8)上都已得到充分的证明。表5的比较进一步地表明,新教育男女生的阅读素养总体和三个分项成绩都得到了极其显著的提高。
在分项的十七个评点的比较中,十五评点都有非常显著的差异,唯有应用评点和修辞评点未见显著差异,测试得分率低、分化大,这或许与测试学龄和评点发展关键期有关。另外,十七个评点中,在所有评点的分化度方面,新教育都低于非新教育,除一个评点(应用)的得分率新教育低于非新教育0.61%外,其他十六个的得分率新教育都高于非新教育,其中一个评点(信息提取)新教育要高出非新教育10.8%。这说明新教育的教师阅读方面的职业化程度和专业化程度都高于非新教育教师,新教育的学生在阅读素养的提升方面得到的教师关注也是多于非新教育的。
总之,新教育的实践在阅读素养的培养提高上取得了非常可喜的成绩,需要进行更多更深入的总结、研究、发扬和推广。该报告只是对第二部分阅读水平的测试进行了关注,对第一部分调查问卷中的学校环境、阅读兴趣、动机等因素尚未作相关性讨论,这也是下一步要进行分析的。另外,部分试题对学生来说偏难,因为测试时间为秋季十月,学校刚开学不久,实际估计学生学龄为四年级初的阶段,因此四年级的标准化测题的难度显得过大。新教育和非新教育的应用评点和修辞评点(得分率<20%)过低,此两个评点掌握习得是否主要在四年级阶段教学提高,有待日后进一步探讨。再有,实际取样较难全然按随机原则操作,有其局限性。
本文来源于《中国教育学刊》2016年第五期,著作权归原作者所有。
新教育实验的阅读宣言——与人类崇高的精神对话
新教育推荐的九大书目——全民阅读造就中国人
新教育实验的书香校园——没有书香充溢的校园,就没有真正意义上的学校
朱永新:乡村教育发展的出路在哪里?——乡村教育的出路在课程、在阅读,需要热爱乡村教育的人
朱永新、罗晶:“学习贫困”的核心指标:阅读水平——教育助力乡村振兴:世界银行消除“学习贫困”项目及对中国的启示
阅读如太阳和明月——专访朱永新|中国的「阅读传教士」
朱永新:阅读立校,营造书香校园
......
守望新教育:聆听大师的教育智慧,分享高人的教育心得,汇聚田野的教育创造,助力有缘的教育梦想。守望新教育:呈人之美,成人之美。守望新教育:帮助新教育共同体成员过一种幸福完整的教育生活。
新教育实验,是一个以教师专业发展为起点,以通过“营造书香校园、师生共写随笔、聆听窗外声音、培养卓越口才、构建理想课堂、建设数码社区、推进每月一事、缔造完美教室、研发卓越课程、家校合作共建”十大行动为途径,以帮助新教育共同体成员过一种幸福完整的教育生活为目的的教育实验。
新教育新在何处?对于我来说,当一些理念渐被遗忘,复又提起时候,它是新的;当一些理念只被人说,今被人做的时候,它是新的;当一些理念由模糊走向清晰,由贫乏走向丰富的时候,它就是新的;当一些理念由旧时的背景运用到现在的背景去续承,去发扬,去创新的时候,它就是新的。