查看原文
其他

综合素质评价改革的“三个转向”

The following article is from 中国教育学刊 Author 柳夕浪



学生综合素质评价作为全面实施素质教育的关键举措,从20世纪80年代开始酝酿,到2000年初与基础教育课程改革同步实施,改革的初衷是什么?需要解决的核心问题是什么?


就是破除“唯分数论”。这里的“分数”主要指纸笔测验成绩。1977年恢复高考,建立了以考试制度为核心、以学习能力为标准的公平竞争制度环境,消除了因家庭出身对人的影响,通过分数面前人人平等,初步实现了全体人民平等教育权利,但也由此引发了全社会对考试分数的盲目推崇。


一切用考试分数说话:一个分数决定了学生入学、就业机会乃至整个人生;一个班级平均分排名决定了教师职称评定和资源分配;一个学校总成绩所处地位决定了学校获得政府资金投入的多少;一个城市状元数量影响着城市教育的声誉,分数成了考核学生、教师、学校、地区的唯一指标,它的背后是活生生的人的严重缺席。


至于说人的政治信仰、思想品德、创新精神等,能否完全可以通过考试尤其是纸笔测验来衡量,一个活生生的人特别是他的精神世界能否被精确量化,这一直是个悬念。如果考试、测量可以解决一切问题,那就没有教育评价的发生,更不需要什么综合素质评价了。


深化学生综合素质评价改革就是回到改革初衷,从只看冷冰冰的分走向关注活生生的人。


综合素质评价改革如何真正关注活生生的人呢?



回到人本立场

转向以人的生成、完善为基本出发点


评价的最初含义是“评论货物的价格”,它原本指向货物。评价行为从商品交换扩展到更为广阔的领域,自然带有“货物论价”的印记。如为了实现某种交易而展开,功利色彩浓,在学生评价活动中“一分值千金”的现象时常发生。


今天,在不少人的心目中,综合素质也是一个可以精确量化的概念,我们不难看出其中的“人学空场”,不难看出人文精神的缺失和对人的尊严的践踏。


教育回到育人原点,不能停留在课程设计、教材编写、教学改革环节,还要进一步落实到考试评价上,让评价真正回到人的立场上。而回到人本立场,必须将关于人的评价与货物论价区别开来。


  • 人的评价要求统一内外两个尺度,促进需要与可能对接


马克思在《1844年政治经济学哲学手稿》中指出:“动物只是按照它所属的那个种的尺度和需要来建造,而人懂得按照任何一个种的尺度来进行生产,并且懂得处处都把内在的尺度运用于对象;因此,人也是按照美的规律来构造。”


对人的活动来说,“任何一个种的尺度”包括了两个方面:客体的外在尺度和人自身的内在尺度。


评价离不开认知活动,又不同于一般认知活动,它不能停留在评价对象的客观描述或精确测量上,还要求从实际活动着的人(主体)出发,对评价对象之于人(主体)的意义价值(有无价值、有什么价值、有多大价值)作出判断,以引导人(主体)去反思、改造现存的世界,变革、建设、创造一个“人为的”和“为人的”的理想世界,一个更加美好、更加合乎人的目的、全面而自由发展的世界。


科学认知以“对象、客体的外在尺度”为根据,反映客体的本性、规律性,获得超越主体的、不以人的意志为转移的客观性,让人懂得世界“有什么”或“没有什么”,“是什么”或“不是什么”,“可能怎样”或“不可能怎样”,为实践提供必要客观基础。


而评价还要依据“主体的内在尺度”,具体指主体的本性、结构、目的、需要、利益、能力等内在规定性,对什么是有意义或没有意义、什么是值得的或不值得的、什么是必要的或不必要的作出判断,从而以主观的形式提供实践的必要性、方向以及行动的热情和动力,给人必要的价值引领。


它必须同时遵循外在、内在两个尺度,促进需求与可能、自由与必然、理想与现实的连接,特别是它始终关注着价值,包括功利、认知、道德、审美等不同层次价值的实现,最终创造出一个属于人(主体)的活生生的世界。


任何评价活动必须自觉调节、使用好两个尺度,使之相互补充,忽视哪一个方面都是错误的:忽视了客体外在尺度,缺乏对可能性、现实性的把握,必然事与愿违;忽视主体内在尺度,把评价等同于一般科学认知,把人当成货物对待,会从根本上取消了价值判断和引导,取消了关于人的评价。


  • 建立评价双方主体际关系,提升自我评价的意识和能力


进一步地讲,关于人的评价不同货物论价还在于:货物论价是人对货物单向度的考量活动,关于人的评价则是评价双方的互动过程。


被尊为教育评价之父的泰勒于20世纪30年代,对盛极一时的“测量运动”加以批判,提出“教育评价”这一概念。他在“目标—学习经验及其组织—评价”的内在关联中界定教育评价的内涵,把它归结为“检验教育思想和计划的过程”,关注“是否实现了这些目标、如何判断”,建立了基于目标的评价模式。


评价要有目标导向,但对学生来讲,目标不能只是统一的、自上而下的,还有一个学生自身识别、选择、内化的生成过程。如同烹饪活动中,厨师根据自己想要的味道,在做的过程中品尝和调味;而客人的口味与厨师可能会有所不同,一般会根据自己的需要来评价汤的味道,他的需要必须得到尊重,否则他不再光顾。


综合素质评价不同于一般产品的鉴定活动,不仅评价主体是人,而且它所面对的也不是既定的“物”,而是指向人,指向成长中的人。它首要的是维护人的尊严,对生命内在固有秩序、对人的成长过程复杂性保持应有的敬畏态度。


评价双方所结成的关系不是人与物的关系,而是人与人的关系、“主体关系”。它要求我们从实体思维走向关系思维、从单方面评定走向双向理解,基于对话式评价活动,促进评价双方的自我反思,健全关于人的发展的观察、反馈与改进机制。


评价者始终应该意识到自己所面对的不是单一的意见行为,而是一个充斥着不同观点的社会世界;不只是观察别人,将别人当作自己的对象,还要有清醒的反省态度。这与把人当成物,伤害人的自尊、贱害人的基本尊严的名目繁多的单方面“考评活动”有着本质区别。


有一所中学尝试建立新课程背景下师生的“321评价模式”:


“3”代表“班级三十最”,每班评选出30名某方面最优秀的学生(如学习最刻苦、公益最踊跃、主持最大方、助人最热心、举止最端庄等);


“2”代表“年级二十佳”,这20名学生从各班评选的“三十最”中产生;


“1”代表校园十佳。


“最”的内容由学校提出,也可以由学生自己提出来。评选活动包括学校提出评价项目名称库、学生自荐、家长推荐、学校评审等程序。整个评选活动项目、标准、程序等都是动态生成的,注重学生的积极参与。


评价过程中师生双方的积极互动有助于培养学生自我评价的意识和能力,同时也强化了教师的自我反省意识。




回到现实生活

转向活生生的具体个人


  • 基于“抽象的人”的评价模式不适合用来评价具体个人


流行的学生综合素质评价是这样安排的:行政部门将学生综合素质划分为思想品德、学习能力、审美与表现、运动与健康等若干方面;再对每个方面进行分解,如将道德品质分解为是非观念、集体观念、诚实守信等;接着列举出若干观察点,如是非观念的主要观察点有崇尚科学,不参加迷信活动,反对邪教等。


学校根据三级指标体系组织学生自己、同学、教师、家长等根据主要观察点逐一对照检查,再汇总,形成统一评价表,最终作出等级评定。整个评价活动是从普遍适用的“好学生”形象出发设计的,权威部门“有形的手”借助“好学生”这只“无形的手”,即“抽象的人”,指挥着整个评价活动的组织开展。


它把人视为一种超越具体情境的总体存在,关注从一个个体中抽象出来的类别属性,注重对人进行分类或分等;把对人的“类”属性作为评价的出发点,以类的总体要求为依据制定评价标准。


它把人的存在抽象化,把人的生存看作抽象的社会力量或某种符号,由此衍生出来的标准被认定为是普遍适用的,例外通常被视为不正常。人类社会对抽象人格范型的追求由来已久。


上述抽象、完美的人格范型在指向群体、区域的评价活动中是有积极意义的。依据种种人格范型及标准,我们可以观测、分析、把握不同群体(不同人群)某些属性的分布情况、基本特征、发展态势,对群体发展进行指导甚至干预,使之回归常态。


我们所知晓的有影响的、大规模的评价项目,如PISA测试、中国义务教育质量监测等,都是面向群体进行测评的,它们在教育教学过程中发挥着诊断、反馈作用,成为区域教育教学改革的重要推进机制。但如果将它的思路、技术、工具等直接搬过来,对学生个体的综合素质进行评价,其结果有可能是荒谬的。


第一,基于抽样检测形成的关于群体学生发展情况的结论不一定适用于每个个体


我们可以有把握地说某区域内小学生近视率高于全国平均数,但不能肯定讲区域内某个小学生就一定近视;可以说某区域内初中生社会责任感好于全国平均水平,但不能断定区域内某个初中生社会责任感就一定很强。统计概念是整体,而非个体,这其实是个常识。


第二,从众多学生个体中抽象出来的理想发展标准不一定完全适用于每个个体。


因为所谓抽象是一个去情境化的过程,它通常会抓住那些被认为是一定学生群体中主流、重要的东西,同时舍弃那些被认为是次要的、非主流的东西。由此形成的评价标准对大部分学生来说可能是适合的或比较适合的,而对少部分学生不一定适合,甚至完全不适合,因为这些被舍弃的方面对这部分学生来说可能是重要的(尽管他们可能是少数,通常处于正态分布的两端)。


如一套体育锻炼的标准总会让有些孩子在测评中处于不利地位,因为他们无论怎样努力都达不到那个所谓“合格标准”。各学科学业质量标准也是这样的,这是我们强调“多把尺子衡量人”的缘由所在。


第三,基于“抽象的人”预设所开展的评价不足以解释、预测具体情境中的个人。


抽象过程中被逐步简化的东西正是学生具体而丰富多样的家庭背景、社区环境、学习经历、社会阅历、健康档案等,是一个个活生生的人的真实、具体、生动的表现,仅靠一个与群体均分的比较,或者仅凭一个抽象的等级,我们无法理解它的意义,无法解释某个具体的学生为什么会这样而没有出现那样的情形。


有研究人员对6-13岁的84个孩子进行了超过14000小时的观察记录,发现“每个孩子在不同情况下都展现出了不同的个性”。如一个女孩在食堂里表现得很外向,但在操场上却很内向;一个男孩子在操场上表现外向,但在数学课上表现却很内向。“很多环境心理学家能够预测在某种情况下大多数人的表现,但是无法预测任何特定的个人将有何表现。”


学生综合素质评价不同于“中小学教育质量综合评价”,不是以群体、区域、机构、单位为评价对象,而是以个体为评价对象,直接关涉个人多方面的权益,涉及学生个人及家长、所在学校教师等众多个体“利益相关者”,两者有着本质差别(对象、标准、方法、手段均不同),不应将它们混为一谈。


  • 综合素质评价基于“具体的人”,关注与情境互动中的个人


在现实生活中,“人”不是由符号、图像、逻辑所构成的抽象、笼统的存在。他既不是有着固定不变共同本质的“类存在物”,也不是离群索居的“鲁滨逊”。人是在劳动和交往中获得生存和发展的:他生产什么,怎样生产;他在生产劳动中、在其他活动中与他人结成怎样的关系,他就是怎样的人。


综合素质评价活动也是这样,必须从揭示、描述群体特征,走向真正面向每一个个体,面向每一位学生。基于具体个人假设的评价要求转向存在于情境、关系、过程、互动中的个人,将具体个人放在“事的世界”之中去观察,放在历史之中去理解,在与情境的互动中寻觅具体个人的踪迹,通过对关系形态与互动过程的描述与体悟,来阐释对具体个人的理解。


首先,是尊重具体个人的独特存在价值。


我们所说的个人独特存在价值所强调的是个人生活的丰富多样,个人尊严的不可践踏,个人选择的不可替代,个体责任的不可推卸。现实中的每一个人都是有血有肉、活生生的,有着自己的认知方式、情感世界,他始终是他自己的主人,他的生命就是其生命意义的追寻、确认和坚守过程。


其次,关注个人与情境的互动关系。


个人理性作为一种思维和行动的方式方法,它的结果几乎总是非理性的,贪婪可以用来解释人类的很多悲剧。每个人在拥有个人世界的同时,不考虑他人的世界,会导致人类世界的深刻分裂。


每个人自主选择一种行动就是选择一种关系,选择一种关系就是选择一种共在方式。我们不能只是笼统地根据个体种族、性别、地位、身份、籍贯等,而要让在场的实践、在场的行动去定义具体个人。


这里的“在场”即处在一定场域、场景、情境之中。“此处此时”是事的世界永远无法回避的。事的世界是活生生的、具体的,总是与具体的时空联系着。场域也好,情境也罢,一方面给我们以事的启示,这种启示通常不是来自个别事物,而是来自万物之间不断展开的关系,来自我与他人不断展开的共在关系。


我们要把握时机,因“势”而谋,顺“势”而发。另一方面给我们以深刻的制约。社会心理学有大量的资料佐证,在许多情况下,情境的力量是强大的,“情境指行为的背景,通过它的报酬及规范功能,情境有力量针对行为者的角色和地位给予意义与认同。


与情境相联系的是系统,由个人及机构施为者组成,施为者的意识形态、价值和力量创造出情境,也规定了行动者的角色及行为期许,要求在影响范围内的人扮演它规定的角色,做出被允许的行为。




回到“整体的人”上来

转向基于各方面情况分析的综合判断


  • 将单方面的素质测评整合起来是综合素质评价的难点


关于“综合素质评价”,有这样两种不同的理解:


一是把“综合素质”作为一个专有名词(类似的说法如“提高综合素质”),综合素质评价即关于人的综合素质的评价,不同于关于知识、能力、体质、态度、性格等单方面的考察,它指向“整体的人”,是对个性风貌的整体分析判断。


二是把“综合”视为评价的修饰语,综合素质评价即综合性质的素质评价或关于人的素质的综合评价,即把各个方面属性整合在一起来看这个人,对他是个什么样的人作出判断。


它把“综合”主要看作一种思维方式,强调尽可能全面地而不是从单个视角看待人。高校招生中的“综合评价录取”,指的就是后一种理解。两者理解可以并行不悖,不同语境下可能有所侧重。


学校中对学生单方面素质的测评比较常见,有的也比较成熟。如通过身高、体重、体重指数等方面观测,评价学生的身体形态;从视力、肺活量等方面考察学生的身体机能;从力量、速度、耐力等方面,测评学生的体能等。有关测试指标含义明确,工具比较成熟,结果也比较可靠,一般没有大的争议。


在很多情况下,我们可以根据大家认可的标准,对测试结果进行排序。综合素质评价所面临的主要问题是,如何把各方面观察、测评的结果汇聚在一起,对测评对象的整体情况、对他是一个什么样的人作出综合判断。


目前,一些地区和学校把来自学生本人、同学、教师、家长等各方面的评议结果,按一定比例折合成等级或汇总成分数,这一做法缺乏科学依据,因为不同维度的等级之间既无相等单位,也无绝对零点;不同班级、学校各自比较的对象不同,所评定的等级之间缺乏可比性。


还有些学校用雷达图的方式呈现,看起来很直观,但它是以每个维度的科学量化为基础的,上文说过,有些极为重要的素质能否量化,一直是个悬念。将单方面的素质测评整合起来看待一个人,这是综合素质评价的要义,也是难点所在。也许不少以为不成问题,其实这恰恰成了问题。


  • 评价观念转变是综合考察一个人的关键


如何综合性地考察一个人呢?最重要的是思想观念的转变。


首先,人的多方面发展彼此间具有一定的相对独立性,不一定具有内在必然联系。


如同不能根据身高推测一个人的体重一样,我们也不能根据智力去推测人的品行,不能根据语文成绩去推测他的数学成绩,不能根据纸笔测验成绩推测他的动手实践能力。


正因为这样,我们强调全面地看待一个人,不只是识别才能,还要考察人品,看其德才兼备情况;不只是测评身体机能,还要考察精神境界,看其身心和谐情况;不只是考察认知,还要考察行动,看其知行合一情况;不只是考察文科学习,还要考察理科学习,看其文理协调情况,等等,克服评价中重智轻德、重知轻行等片面性,特别是关注有关学生发展底线要求的达成情况。


其次,注重分析把握一个人的个性潜能。人的智慧在于有效把握、应对未来不确定性情境。


评价与其说是一种已有历史的判断,不如说是一种价值创造过程。它不只是面向过去,对已有的经历贴上标签,更重要的是基于历史的把握,对需要通过行动创造出来的新价值、“可能世界”作出判断、预测,它本质上是面向未来的。


每个人的未来充满着多样的可能性,对其分析评判是个极富有挑战性的难题。每个人的发展有一个从潜在到显现的过程,一个各方面素质的孕育、显露、走向成熟的过程。可能某些方面的天赋较早地显露出来,而另一些方面的素养形成却是一个漫长的、不断改进的过程,甚至贯穿在人的一生之中。


“认识你自己”,是每个人一生的重大课题,对成长中的孩子显得尤为重要,也更加困难。评价不是对孩子的过去给出一个鉴定、贴上一个什么标签,通常给孩子下什么结论都为时过早,它的要义在于帮助学生的自我观察与自我分析,让他们知道自己的潜质之所在、成长空间之所在,并提供适当的舞台使其潜质能够显露出来,充分发挥出来,并由此而得到进一步的提升。


为了人的发展的评价是以对人的发展的科学认识和准确把握为前提条件的,因为有了发展的可能性,才有了教育的空间,才有了对教育过程和结果评价的必要性。而评价不是别的,正是对发展潜力、发展方向的预测和引导,是对发展内在动力的激发(给人的成长装上发动机),是基于对可能性的科学把握,对发展路径、方式进行有效指导的过程。


最后,注意发展代价的评估分析。


有人说“一切皆有可能”,这种乐观主义能给人信心、力量和希望,但是,如果盲目地把它作为所有行动的信条和指南,那就有可能走向荒谬,不断上演着“拔苗助长”之类的剧目,因为它忽视了发育成长内在规律的制约,忽视了发展的自然限度和社会文化限度。


发展代价不只是负面清单的伴随,还包括其他发展机会、有利发展时机的丧失。在“不能输在起跑线上”之类口号的鼓动下,不少孩童时间、精力耗费在早期潜能开发项目(如提前读写算、最强大脑等)训练上,可能会带来相应的冒尖或超常,但同时也造成了另外一些发展机会(如情感生活需求、社会性发展需要被忽略)的丧失,埋下了危机的种子,这些危机将或早或晚爆发出来,甚至遗憾终生。


面对越来越激烈的生存竞争,每个人都想成为某一领域的顶尖高手。如何成为这样的高手呢?有人给出了标准答案:练习一万小时。它告诉我们天才是练出来的,但是光知道练习一万小时是没有意义的,因为很多领域要求训练的时间远超过一万小时,如对音乐家而言,需要训练15~25年才能达到世界级水平,而某些领域内,如果一个人很有天赋而且训练得当,他也能在非常短的时间内成为顶尖高手。


一项2014年的最新研究发现,对音乐来说,天赋比练习时间重要得多。一对基因相同的同卵双胞胎的练习时间相差两万多小时,但他们的音乐水平居然是一样的。也许一个人最好的成就不是练习加天赋,而是练习乘以天赋,其中的一项为零,最终结果就是零。


成长过程在我们是怎样的(实然)和我们应该是怎样的(应然)两者之间建立必要的关联,面临着教育、旅行和工作中的各种选择:选择什么样的学校、班级和老师,到什么地方去旅行,应聘到什么公司或者创办什么公司等。而对代价的评估便是理性选择的必要基础,缺乏对代价的评估,我们的选择很难说是理性的、明智的。


综上所述,深化学生综合素质评价改革,必须确立人本立场,关注现实生活中的具体个人,坚持全面综合地看待一个人,对人的个性潜能作出综合判断,为他的学业、职业乃至整个人生规划提供有价值的参考信息,这是综合素质评价改革的使命和担当。



作者 | 柳夕浪,山东师范大学教育学部教授来源 | 中国教育学刊(ID:zgjyxk),文章有删减责编 | 沧月
2594889720@qq.com

 中小学校“破五唯”,《义务教育质量评价指南》解决了什么问题? 

• 从评价改起来:这一套完整体系的先行探索,如何引导区域学校良性竞合?

 张丰:以“结构型质量”评价,促进区域教育优质均衡发展


▼ 点击阅读原文,一键订阅
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存