查看原文
其他

王新凤 等:高考综合改革评估的实践与思考——以浙江省为例

王新凤 等 中国考试 2022-04-25

作者:

王新凤,北京师范大学教育学部、中国教育政策研究院;
余丹茜,浙江省教育考试院;
边新灿,浙江省教育考试院。


原文刊载于《中国考试》2020年第5期第1—7页。



摘要:我国新一轮高考综合改革已经由点及面梯次推开。探索多主体合作的高考改革评估是深化高考改革、引导理性社会舆论、丰富教育评价与考试理论的需要,有助于构建中国特色高校招生考试制度。在讨论高考改革评估的理论基础上,以浙江的实践为例,阐述高考改革评估的主体、内容和方法。认为高考改革评估应采用改革实施主体自我总结评估与第三方评估相结合的多元主体合作模式,评估的内容应包括对改革目标、具体举措和实施效果的评估,评估应秉承客观、公正、全面的原则,借助多种评估方法对改革全过程进行动态的、多维度的综合评估。基于高考改革评估的复杂性,在评估中要处理好若干对立统一的关系。



关键词:高考;高考综合改革;高校招生;教育评估


  2014年,浙江省贯彻落实《国务院关于深化考试招生制度改革的实施意见》(以下简称《实施意见》),颁布《浙江省深化高校考试招生制度综合改革试点方案》(以下简称《试点方案》),启动高考综合改革试点。在改革过程中,浙江省坚持目标导向、问题导向,同步实施改革试点跟踪调研和评估工作,先后进行2次自我评估,并委托北京大学、北京师范大学研究团队进行第三方评估与跟踪研究。2017年,在自我评估和北京大学第三方评估基础上,出台《浙江省人民政府关于进一步深化高考综合改革试点的若干意见》(以下简称《若干意见》),高考评估结果成为深化高考改革的重要参考。2019年,北京师范大学研究团队受委托再次对浙江高考综合改革试点进行调研评估和深度分析。本文依据浙江高考综合改革跟踪评估的实践,分析总结高考改革评估中的经验与问题,以期为深化高考改革评估研究提供借鉴。

 1

高考改革评估的必要性

  2014年启动的高考综合改革由上海、浙江先行试点。在浙江委托北京大学、北京师范大学进行第三方评估的同时,上海也委托华东师范大学进行第三方评估。在高考改革的历史上,这是首次由试点省份委托第三方机构评估其改革成效,对于完善本轮高考改革的各项措施具有非常重要的作用。对正在进行的高考综合改革进行评估,其必要性体现在以下4个方面。


1.1 先行试点省份深化与完善改革的需要
  高考改革是一项系统性的工程,涉及国家经济社会发展所需人才的质量、中学教育的导向、数以百万计青年学子的人生道路,涉及千家万户的切身利益,可谓“牵一发而动全身”,因此,改革决策必须建立在广泛调研和充分论证的基础上。新一轮高考综合改革被认为是1977年恢复高考以来力度最大、涉及链条最长、影响范围最广的一次改革[1],其改革举措是否适应经济社会发展需要、担当得起时代使命、得到主流民意的认同,都需要跟踪评估研究;同时,浙江、上海作为先行试点省份,改革过程遇到新情况新问题,通过调研评估总结经验、研究问题,对完善和深化改革方案非常必要。


1.2 服务国家决策、扩大试点范围的需要
  高考综合改革是国家由点及面、分批推进的系统工程。2014年浙江、上海先行试点,2017年北京、天津、山东、海南4省份加入试点,2018年广东等8省份梯次跟进,接下来将向全国扩展。通过对先行试点省份的改革实践进行调研评估,及时总结前期改革经验,分析新情况新问题,可以为后续改革省份制定改革方案提供参考借鉴。


1.3 统一认识、引导理性社会舆论的需要
  高考改革是一项高利害的改革,社会十分关注,改革的相关群体对改革带来的变化是一个由不适应到适应的过程。不同的利益相关者对同一改革举措会有不同的感受与评价。面对社会的不同声音,通过专业与独立的第三方评估,借助问卷调查、数据分析、调研座谈等方法,作出客观的评价,有利于发挥对社会舆论的引导作用,保障改革实施进程与社会稳定。


1.4 丰富教育评价与考试招生理论的需要
  高考是一项极具中国特色的高校招生制度,植根于中国几千年的政治制度、文化传统与教育生态。我们既应该重视高考改革的时代性,又应该重视其地域性。运用多种评估方法与手段,深入改革实践,提炼高考改革的经验与模式,可以深化相关领域的研究,对国内其他地区提供经验与模式的借鉴,也是对我国教育评价与考试招生研究的丰富,有助于完善中国特色高校招生制度理论,从而更好地指导教育教学实践。

 2

高考改革评估的理论基础

  政策评估是指依据一定的标准和程序,对政策执行后的效益、效率及价值进行判断,获得相关信息并作为决定政策变化、改进和制定新政策的依据。自1951年哈罗德·拉斯韦尔(Harold Lasswell)开政策研究之先河,提出“政策科学”的概念,至20世纪60年代政策评估的恢弘,各种政策评估理论竞相登场亮相[2],政策评估在国家治理中的作用日益凸显,有关的理论与方法在实践中不断深化,形成理性主义与建构主义的不同研究范式。尤其是美国的古贝(Egon G. Guba)和林肯(Yvonna S. Lincoln)在批判以“测量”“描述”“判断”为标志的前三代评估理论的基础上,提出了以“回应”和“协商”为标志的第四代评估理论。第四代评估理论是一种建构主义评估范式,以问题解决为导向,强调持续改进并最终达到问题的解决;此外,第四代评估强调辩证循环的过程,聚焦利益相关者的主张、焦虑与争议,并对这些争议进行协商以及反馈。高考改革涉及国家、学校(高校和中学)、学生及家长等多方利益群体,需要充分听取和反映各利益相关者的意见。高考改革评估就是在高考改革方案执行过程中呈现争议、协商争议以及解决的过程,因此,第四代评估理论可以为高考改革评估提供理论与方法的支撑。
  教育政策评估作为公共政策评估的分支领域,也较多地借用公共政策评估的研究成果。国内学者运用公共政策理论对异地高考、高考加分政策、专项计划、高考综合改革方案等进行分析,关注高考政策评估主体、评估内容和评估标准等。陈何南采用政策用户和利益相关人的政策评估模式,从政策方案、政策执行、政策绩效3个方面对少数民族高考录取优惠政策进行评估研究[3];朱勇进等从政策评估的视角分析异地高考政策的执行情况、对目标群体的影响、政策的溢出效应和未来发展方向[4];余澄等从政策制定、执行、落实、监控、反馈、终结等方面构建多维度的高考试点方案评估方法体系[5];赵俊芳等从权力监督与公共政策价值分析的视角,对高考政策进行价值分析,提出高考改革社会风险评估与规避机制[6]。国内学者对我国高考制度、高考改革方案、高考改革效果进行评估,是运用公共政策视角进行高考评估的初步尝试,但是总体来说,现有高考政策评估以规范性研究为主,实证研究以数据分析、案例研究和量化研究为主。
  本文基于政策评估的概念框架,重点从利益相关者的视角,以浙江高考综合改革评估为案例,探讨我国高考改革评估的经验与问题。

 3

浙江高考综合改革评估的实践

  政策评估的核心要素包括评估主体、评估内容、评估方法,解决“谁来评”“评什么”“怎么评”的问题,浙江高考综合改革评估的实践也围绕这3个方面展开。


3.1 高考改革评估的主体
  政策评估主体以内部机构为主还是以独立的第三方为主,在理论和实践上都存在单一主体不可克服的矛盾,促进多元主体合作是政策评估的必然选择[7]。高考改革评估需要自我评估与第三方评估相结合,既可以发挥教育行政部门和教育考试机构的责任主体作用,也可以借助高校、科研机构、评估机构等第三方评估力量的外部评估,增加评估结果的客观性和可信度。
  由于高考改革的复杂性、高利害性和高风险性,对高考改革的评估多数情况下仍需决策或实施部门自我总结评估。自我总结评估是政策制定者和执行者自我内省的过程。由于评估者同时也是政策的制定者或执行者,在一定程度上较为熟悉政策,也更有途径到基层开展调研。自我总结评估的缺点在于较容易将评估成效看得比较重,对于问题,尤其是解决方式上偏于保守,视野比较窄,不容易跳出自己所在的范围来看问题。
  评估主体的多元化是当前政策评估发展的主要趋势之一,国内学界已充分论证了公民参与以及第三方评估机构的作用[8]。第三方独立评估是政策制定与执行部门之外的专业群体开展的评估。第三方独立评估的优点是在立场上更为独立、公正地看待高考改革,评估对象面对第三方也更容易或者敢于表达真实的想法;缺点在于进入研究情境的时间较长,需要有熟悉、深入的过程,如果在研究情境中停留时间较短,对评估内容的了解容易流于片面。

  因此,高考改革评估应将上述2种评估类型结合起来实施:自我评估要加强问题导向,第三方评估机构要加强评估人员的培训、专家成员的遴选,提升第三方评估的专业性。对评估中产生的问题以及相应的解决办法,要向公众或者评估对象公布。评估结果适时对外公开,让评估本身接受社会、舆论的监督,是保障以政府为主体的政策评估有效性的重要方法。


3.2 高考改革评估的内容
  高考改革评估将高考改革的政策目标、改革举措以及实施效果作为主要内容,尤其关注利益相关者对改革目标、改革举措、实施效果的评价,呈现不同利益相关者的共识与争议,寻求解决问题的方案,并致力于政策的调整与改进。


3.2.1 对高考改革目标体系的评估
  高考改革从哪里来,到哪里去,为何要改?高考改革的初心和目标是什么?这既是改革的出发点和落脚点,也是对高考改革进行评估的终极依据和标准。
  根据《实施意见》的阐述,高考改革把促进学生健康成长成才、培养德智体美全面发展的社会主义建设者和接班人作为改革的出发点和落脚点,作为终极目标,把科学选拔各类人才和维护社会公平作为高校招生的工作目标。与此相对,把“唯分数论”“一考定终身”等作为改革要克服的弊端。这无疑构成了高考综合改革的初心和使命,构成了高考综合改革的目标体系。对高考改革试点进行总结评估,首先必须对改革试点是否体现了改革目标,是否朝着改革目标在努力进行分析评估。
  正是基于这样的考虑,浙江第三方评估把高考改革试点是否有利于促进学生健康发展、是否有利于科学选拔各类人才、是否有利于维护社会公平作为最重要的3个问题进行调研评估,同时把改革试点是否有利于缓解“唯分数论”、是否有利于克服“一考定终身”等作为重要评估内容。
  浙江改革试点方案的设计充分体现了以学生为本、以促进学生健康发展为核心的理念。无论是设置“3+3”的考试科目,还是外语和选考科目均提供2次机会,抑或是设置分类考试、多元选拔路径,目的都是扩大学生的选择权;无论是“三位一体”综合评价还是职业技能考试,都是为了学生综合素质的提升。改革对传统高考“一考定终身”“唯分数论”的弊端突破和克服功能,也已初现端倪。
  总体来说,学生群体对改革目标的达成度评价高于其他群体,在一定程度上体现了以学生为中心的改革导向。


3.2.2 对高考改革具体措施的评估
  对高考改革具体举措的评估应体现在:改革举措本身的合理性,改革目标的达成度,改革举措之间的协调,改革举措产生的积极效果,实施过程中遇到哪些新情况新问题,改革举措存在哪些需要改进和完善的内容。
  对改革措施的评估是一个循环往复的过程。浙江的高考综合改革,政策评估对改革措施的调整起到了重要的作用。针对自我总结评估和第三方评估中发现的新情况新问题,2018年浙江省政府颁布《若干意见》,对试点方案进行完善,包括:考试时间调整;实施物理科目选考保障机制;修订《在浙招生普通高校选考科目要求》,引导高校合理设置选考科目等。2019年,第三方评估在高中教师、高中学生、高中学生家长、高校教师、高校学生5类群体中对改革举措进行有针对性的评价,评估结果提交浙江省有关部门作为进一步调整完善改革措施的依据。
  对高考改革具体措施的评估体现为问题导向特征,评估的目的是发现问题、反馈问题,并进而解决问题。浙江高考评估发现问题并作出的政策调整包括:考试日期与次数的调整,与此相关的考试规律和教学规律的关系;物理等选考科目保障机制的设立,与此相关的赋分方式的完善;高校学科专业录取要求与考生知识基础之间匹配度的提升,高校按专业确定的2门以上选考科目之间“或”与“和”关系调整及利弊分析,与此相关的国家利益、高校专业需求和学生自主选择权的统筹兼顾等。


3.2.3 对高考改革实施效果的评估
  有专家指出,高考改革方案结果评估包括目标实现标准、效益标准、效率指标、公平标准以及反响回应标准,前4个指标是客观标准,难以反映考生的需求和诉求,因此需要通过利益相关群体的主观认知来评价[5]。浙江高考评估主要关注利益相关者视角对高考改革实施效果的评价,包括不同利益相关群体的满意度,高考改革对学生发展的影响,对高中课程教学与改革的影响,对高校招生与人才培养的影响等。
  浙江在2019年所作第三方评估,从高中教师、高中学生、高中学生家长、高校教师、高校学生的视角评价高考改革实施的成效,包括高考改革的总体成效、高考改革对学生的影响、高考改革对高中学校的影响、高考改革对高校的影响等。总体来讲,从各利益相关群体的角度来看,高考综合改革平稳落地,在满足学生兴趣与选择、促进学生全面发展、高中学校特色发展以及高校科学选才方面,各方获得感较强。与此同时,高考综合改革中也存在诸如学生学习负担、“功利化”选科倾向等有争议的问题,多元化的生源结构对高校人才培养的挑战尚待时间检验[9]。鉴于对高考改革实施效果进行评价的主观性以及教育改革成效的长期性,高考改革评估也关注新高考生源进入高校后的发展情况,从学生的学业表现、专业认同、综合素质等方面评价高考改革的实施效果,从高校人才培养以及学生成长的全过程评价高考改革成效。
  总之,对高考改革实施效果的评估,目前主要是从改革目标群体的视角评价改革实施的效果。下一步将把目标群体的主观感受、主观评价与改革所带来的实际变化的量化数据分析结合起来,以得出更全面客观的结论。


3.3 高考改革评估的方法
  高考改革是一个系统工程,涉及方案的制定完善、执行、落实、反馈等多个环节,对高考改革试点的评估亦是一项综合评估,只有全过程、动态跟踪,多维度评价高考改革,才能科学、全面地考察高考改革的成效。


3.3.1 评估的原则与标准
  评估原则是有效实施评估工作的指导思想和基本手段,高考改革评估秉承客观、公正、全面的基本原则,用发展的眼光来看待高考改革。客观的原则是指,高考改革评估过程中客观呈现事实与争议,为科学决策提供参考;公正的原则是指,高考改革评估过程中评估者尽量悬置“价值预设”,保持价值中立,客观呈现多元利益群体的诉求;全面的原则是指,高考改革评估过程中统筹考虑教学、考试、招生不同环节,学生、家长、教师与社会等不同群体,中学、高校、考试机构等不同部门,正面与负面改革影响;发展的眼光是指,尊重教育规律的长期性、改革的动态发展性,不以当前的改革成效评价改革的成功与否,而是从人才成长周期的角度来评价。
  高考改革评估标准是事实判断与价值判断、客观标准与主观标准的统一。价值判断可以从政策依据入手,将党和政府的教育方针政策、启动改革的目的作为评价高考改革成效的标准;事实判断可以运用调查问卷、数据分析等方式呈现客观的数据作为评价标准。主观标准是指通过利益相关者的认知、感受来评价高考改革的成效,比如高考改革效果的满意度指标;客观标准是指一些事实与客观性的指标,比如可以通过年级比较、省际比较、不同招生模式的比较,评价新高考生源的学业表现、专业认同、综合素质等,将其作为高考改革实施效果评价的客观标准。


3.3.2 评估的类型
  高考改革评估是一项复杂的系统工程,因此,需要将多种评估方法结合起来,尽可能全面地呈现高考改革目标、举措与成效,从而作出相对科学的决策。一是对标评估与纵向比较评估相结合。高考综合改革由国家顶层设计,对其评估要按照教育方针和改革目标,考核评价改革目标的实现程度;同时对本地区改革前后各方利益群体变化进行比较分析,比如高考生源质量的年度变化。二是政策评估与技术评估相结合。政策分析聚焦于改革目标体系的文本分析,技术分析探讨省级政府及教育行政部门在高考改革过程中选择的政策工具,以及政策工具对目标的达成、对改革成效的影响。三是诊断评估与成效评估相结合,即将过程评估和阶段性总结评估相结合。高考改革涉及千家万户切身利益,发现偏差应即时调整,因此必须建立全程跟踪、及时诊断、迅速反馈机制。四是本体评估和影响评估相结合。既从考试招生本身的成效进行评估,又从对中学和高校的课程改革、教学改革和人才培养模式改革的推进上进行扩展评估。


3.3.3 评估的手段
  高考改革评估要通过不同技术手段、不同资料收集途径、不同利益相关者的视角对评估结果进行三角验证,以增加评估结果的信效度。一是量化研究与质性研究相结合。高考改革评估应将量化研究与质性研究相结合,既借助问卷调查、数据统计等传统的量化技术手段,又借助访谈等质性研究方法进行跟踪评价。高考改革评估借助问卷调查的量化研究方式,可以获得不同利益群体对某类问题的看法;同时借助访谈法,在不同利益群体观点的争锋中获得更加全面的认知。比如在浙江高考评估中,针对高中教师和学生对“一年两考增加学生负担”观点的差异,通过对2类群体观点的互证发现:高中教师大部分要求取消“一年两考”,源于教师认为“一年两考”改变了原教学生态,增加了教学工作负担;高中学生普遍支持“一年两考”,源于“一年两考”降低了心理压力,减少了偶然因素的影响。二是案例研究与整体数据分析相结合。浙江自我评估关注了案例学校高考改革的实施效果。案例研究可以对利益相关者所处的环境以及高考改革的资源配套情况有更加切实的感受,在评估者与被评估者的互动中共同建构评估结果。但同时,高考改革是一项系统性改革,需要关注全局性影响,比如案例研究中发现部分专业通过综合评价录取的学生的学业表现、专业认同都高于统招学生;但是否具有普遍性则需对全部试点高校的数据进行整体分析。

 4

高考改革评估的思考

  高考改革是系统性的综合改革,因为评估主体、评估内容、评估方法的多元和丰富性,高考改革评估的过程也很复杂。如何评价高考改革实践中出现的问题与矛盾,如何弥合理论与现实之间的距离,是高考改革评估需要思考的问题。


4.1 高考改革评估的复杂性
  高考改革评估是复杂的评估活动,其复杂性体现在:一是评估对象的复杂性。高考改革不仅涉及考试内容、考试方式,还涉及招生计划分配、招生录取方式;不仅涉及高校招生,更涉及高中课程、教学方式改革等,是一项推动教考联动、中等高等教育衔接的系统性改革。同时,高考改革是动态与静态的统一体,评估活动需要在政策的动态调整中进行,增加了评估难度。二是评估标准的多样性。高考具有促进学生健康发展、促进高校科学选才、促进社会公平等多重功能,使高考改革评估的标准难以简单量化与衡量。三是评估主体的多元性。高考改革涉及多元利益群体,不同利益群体对高考改革的诉求呈现出矛盾的、甚至相悖的价值导向,使得高考改革评估争取价值共识非常困难。因此,需要正视高考改革评估的复杂性,探索科学的方法和手段完善评估方式。


4.2 需要处理好的关系和矛盾
  高考的制度设计和改革试点的推进过程都反映了复杂的两难矛盾,高考改革评估对此也要有充分的认识。一是公平性与科学性的关系。高考改革方案的制定、实施、评价都需要平衡两者的关系,偏向哪一方都会影响改革进展。如综合评价招生确实为高校选拔了符合人才培养与专业定位的学生,试点高校扩大招生规模的愿望强烈,但综合评价招生如何确保公平公正则面临严峻的考验。二是考试规律和教学规律的关系。为改变“一考定终身”,试点省份将高中学业水平考试纳入高考评价体系,推出学业水平考试选考每生每科2次机会,并且打通年级界限实现不同年级学生可以同场竞技,这一举措有利于减轻学生心理压力,减少考场偶发因素对考试信度的影响,符合考试规律;但在一定程度上增加了学生选择考试次数和何时考试的焦虑,学校的教学安排围着考试安排转,存在考试规律和教学规律如何协调的难题。三是个体理性与群体理性的关系。高考改革涉及学生、家长、中学、高校和国家多个利益相关者的关系,对同一项改革举措的评价会有很大差异。比如在选考科目的选择上,学生个体的选择和国家需要、高校需求之间是否匹配非常复杂,调节国家意志与个体发展之间的张力是破解高考公平难题的根本[10]。新高考扩大学生的选择权,但在实践中确实存在为了高分的功利性选择趋向,因此如何协同不同利益相关者之间的关系,引导学生把国家需要、高校需求和自己的兴趣爱好特长结合起来,是迫切需要解决的问题[11]。教育部根据上海、浙江试点和总结评估的情况,及时出台《普通高校本科招生专业选考科目要求指引(试行)》,增加了引导性和限制性因素,对协调个体理性与群体理性的关系,起到了比较好的作用。


4.3 第四代评估理论的适用与局限
  高考改革评估借鉴了第四代评估理论尊重利益相关者参与、协商的观点,以及循环往复逐步解决问题的方法。针对浙江高考综合改革评估中发现的问题,如学业水平考试合格考与选考同卷考试的问题,浙江在《若干意见》中进行了政策调整,之后的第三方评估再次对此进行问卷调查,结果显示,公众对学业水平考试合格考与选考分卷考试比较认可。这就体现了第四代评估重视利益相关者参与,循环往复逐步解决问题的过程。但第四代评估理论的方法并不能解决所有的问题,因此,高考改革评估中也要借鉴数据分析等传统评估方法。高考改革面临科学性与公平性的价值冲突,高考改革政策制定者与执行者常常面临两难的价值选择,要达成共识还需要发挥政府的主导作用。正如罗尔斯(John Bordley Rowis)所说,同一个社会中,有不同的价值取向,就会存在不同的正义观,人们选择这一种而放弃另一种,取决于这种选择带来的更广泛的结果[12]。因为高考改革的复杂性和高利害性,评估结果的运用还要服从于政府部门的价值选择,必须保障国家及其教育行政部门发挥主导作用,在权衡各种利益诉求的基础上保证基本的社会正义。因此,有观点认为,有望在超越理性主义和建构主义之上走向综合的第五代评估,即超越理性主义与建构主义的复合的公共政策评估途径[13],高考改革评估也将在公共政策评估理论的完善中提升政府决策的效能。

  总之,探索多主体合作的高考改革评估是深化高考改革、引导理性社会舆论、丰富教育评价与考试理论的需要,有助于构建具有中国特色的高校招生考试制度,推动教育治理体系与治理能力现代化。高考改革评估着力于回答“谁来评估”“评估什么”“如何评估”的问题。基于高考改革评估的复杂性,应着力处理好高考改革的科学性与公平性、教学规律与考试规律、个体理性与群体理性等关系,并应在政策评估理论的发展中逐步完善。









您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存