查看原文
其他

张会杰:“四个评价”落实中的主要矛盾及化解思路

张会杰 中国考试 2022-04-25

作者:

张会杰,华东师范大学教育学部考试与评价研究院,副教授。


原文刊载于《中国考试》2020年第11期第9—16页。


摘要:教育评价尤其是考试招生制度中的评价涉及面广,是我国教育改革中最具难度、最复杂和最敏感的领域之一。“四个评价”落实过程中存在着评价的主观性与人情权钱的干扰之间的矛盾、评价效度与效率之间的矛盾、评价方式的多元化与决策的单一标准之间的矛盾等。这些矛盾是长期和普遍存在的,并非为特定阶段或我国国情所独有,虽然存在不公正的可能性,但消极效果并不必然发生。化解这些矛盾的基本出发点在于教育价值的判断及其证成,并聚焦评价效度这一根本要义。针对评价中可能出现的各种问题以“疏”而非“堵”加以解决,矛盾化解过程中应尽力做到责任—权利—利益激励相容。矛盾化解的基本框架在于:学校自主评价,政府依法宏观管理,社会参与监督,并通过学生选择权利的充分保障及市场竞争等倒逼评价主体的能力建设。



关键词:教育评价;评价制度;综合评价;“四个评价”;评价效度;评价效率


  《中国考试》2020年第9期刊发了刘海峰教授和李木洲研究员的文章《构建“四位一体”功能互补的教育评价新体系》(以下简称“刘海峰教授一文”)。针对《深化新时代教育评价改革总体方案》提出的“改进结果评价,强化过程评价,探索增值评价,健全综合评价”(以下简称“四个评价”),该文提出,构建以“四个评价”为核心的功能互补的“四位一体”教育评价新体系是一项系统工程,不仅需要从理论层面深刻认识“四个评价”,从实践层面创造有利实施条件,还应注意处理好“四个评价”之间可能存在的矛盾关系[1]。笔者认为,如何看待和处理“四个评价”可能存在的矛盾关系对于新时代教育评价改革的落实将发挥重要的甚至决定性的作用,本文就此提出个人的粗浅认识,以期抛砖引玉,促进这一重要理论与实践议题的发展。

 1

“四个评价”落实中的主要矛盾

1.1 评价的主观性与人情权钱的干扰之间的矛盾
  “价值”一词指向客体对主体需求的满足。评价主体根据价值主体的需求,衡量价值客体是否满足价值主体的需求,以及在多大程度上满足价值主体的需求,这一评价活动的本质就是价值判断[2]。评价是一种主观性的精神活动,总是包含着对一定价值关系可能后果的预见和判断[3]。诺贝尔奖获得者哈耶克认为,过去一百年里经济学的每一项重大进步,都是向着不断采用主观主义的方向前进了一步[4]。这固然是一家之言,但其视角有助于启发我们进一步理解教育评价的本质内涵及其内在特性。笔者认为,教育评价与其他教育活动(如教育测量)首要的也是根本的区别在于评价所采用的主观主义方法论。教育评价关注和揭示价值主体的需求与客体特性之间的契合度,而教育测量侧重的是对客体自身特性的事实刻画。主观主义意味着,仅从对客体自身特性的客观事实判断不能直接推导出价值判断,虽然事实判断是价值判断的必要基础和基本手段,但评价必然要依托价值主体的需求。以棘手的实践难题——高校招生为例,作为价值主体的高校因在人才培养上有着不同的目标与定位,故而对学生的优势潜能有着不同的需求,高校为实现自身的人才培养目标,理应自主判断并选择适合本校人才培养目标的评价方式与评价标准。
  评价的主观性不可避免地带来风险,首当其冲的当属人情权钱的干扰。笔者认为,评价的主观性与人情权钱的干扰之间的矛盾是我国教育评价的根本矛盾。刘海峰教授曾指出,正是出于有效地制衡人情与关系的困扰,中国才率先发明了考试制度[5]。可见这一矛盾在教育考试与评价发展中所处的支配性地位。在我国,考试招生制度中的评价,其典型特征是“唯分取人”,由于其显而易见的不合理性,改革屡屡倡导要“德智体美全面衡量,择优录取”,然而,实然的招生却无法摆脱“唯分取人”。对学术水平的评价也大体如此,发表论文的数量、发表论文的刊物级别、主持国家级与省部级项目的数量,依据这些指标就基本完成了对高校教师科研水平的评价,至于这些指标本身是否真有价值,则几乎不予考虑,这显然违背了评价主观主义的方法论。刘海峰教授一文提出,高校招生“如果摒弃高考分数,必然会导致人情关系的介入以及权力与金钱的干扰,破坏教育公平与社会公平”[1],揭示出这一矛盾的冲突性,以及一旦处理不好所带来的破坏性影响,这是学术界和实践界都担心忧惧的“深水区”。我国的评价制度特别是高校招生,通过将高校的评价主体地位及自主选拔的权利让渡给省级教育行政部门,以实现对人情权钱干扰的防范,应然的评价主体行使价值判断的运作空间受到直接的根本性的限制。


1.2 评价效度与评价效率之间的矛盾
  考生招生中的“效率”,以往研究主要指向两重含义:一是人才选拔方面的效率,如何提高考试的信度效度和区分度,以准确检验出应试者的实际水平;另一重含义则面向选拔如何能做到简便易行,省时、省事、省力[6]。本文提及的“效率”仅就第二重含义而言。从考试与评价的科学性来看,效度则是更加基本的考虑因素。目前,对效度的共识性定义是,“基于测试的使用意图,证据和理论在多大程度上支持所作出的测试分数解释。”[7]11参考其思想内核,我们可以把教育评价的效度理解为基于评价的使用意图,证据和理论在多大程度上支持所作出的价值判断及决策。效度思想凸显教育评价中的价值判断,以及决策不能离开评价活动所服务的根本目的而独立存在。为了追求评价的效度,往往需要搜集多方证据支持所作的决策,因此效度和效率常常是冲突的。

  以高校招生制度中的综合评价为例,在评价内容上综合考查学生德智体美劳发展状况,在评价方式上兼顾结果评价、过程评价、增值评价等多重形式,对于高校选拔全面而有个性的人才显然是更具效度的;然而,从目前的高考综合改革试点来看,除具备资质的少数高校可以依托综合评价、“三位一体”“强基计划”等模式录取外,绝大多数高校依然没有机会践行这一改革理念。高校招生现行的总分大排序录取机制,不仅直接排除了对人情权钱的干扰,而且高效、经济;与之相比,招生时全面采取综合评价不仅时间和精力投入要大幅提高,对招生人员评价素养的要求也较高。此外,高考科目一年多考、录取时“一档多投”等改革措施,均面临着评价效度与效率之间的矛盾。


1.3 评价方式的多元化与决策的单一标准之间的矛盾
  从评价主体、评价标准、评价方法、评估过程以及评价结果的解释等不同角度,教育评价可以划分为诸多类别,“四个评价”反映的就是评价方式的多元化。如何协调评价方式及深嵌其中的价值多元化与决策的单一标准之间的矛盾是难以回避的理论与实践问题。要特别说明的是,近几十年来西方国家教育及学术界较为流行的表现为“政治正确”的“多元主义”值得我们警惕和引以为戒,这是一种为了多元而刻意多元,贬抑主流价值、牺牲主流文化,将少数群体的边缘价值和文化罩上道德光环的后现代性的意识形态。本文谈及的评价方式的多元化建立在正义一元论基础之上,仅就评价的标准而言,是全面领先或是全面均衡抑或单项冒尖,哪一类算是真正的人才,总分大排序录取或是偏重单科冒尖的录取哪一种更合理?实际上并没有完全统一的答案和公认的价值标准。据称,民国时期,“北大有一项特别规定,入学考试如果有一两门惊人的出色,则即使总平均不及格,仍旧可以取录的。”[8]理想状态下,不同高校的人才培养理念应该各有侧重,有的学校更愿意招收全面发展的学生,有的学校更青睐个性而有特长的学生,这都无可厚非,也是学校特色发展的重要条件。
  美国学者Zwick教授认为,我们永远也做不到真正客观地评价大学招生制度,因为对怎样的学生有权进入好大学这件事,从来都没有一个放之四海而皆准的标准;她通过比较多种类型的数据得出,没有真正客观的方法来评估招生系统,因此学校应该使用他们认为符合其教育目标的任何入学标准[9]。当代社会多元价值和文化共存,不存在一个无所不包的为所有人一致赞同的价值标准,评价政策应为多元价值的平等竞争提供机会。然而,现实世界中,价值判断与决策的标准还颇为单一,比如,当下基础教育领域中师生主要追求的显然还是考试分数,这是各阶层普遍追求的“硬通货”。之所以这样,是因为对绝大多数考生和高校而言,高考总分这一结果性指标是录取决策的唯一标准。选拔性相对较弱的评价亦存在以分数作为决策关键要素的现象,以大学生奖学金评审为例,各高校还是以学生的平均学分绩点(grade point average, GPA)作为最重要的因素,评审机制过于强调课程成绩,“奖学金引导学生追求GPA,这对创新不利”[10]

 2

对上述主要矛盾的基本认识

2.1 这些矛盾是长期存在的,并非为特定阶段所独有
  “评价是一件非常困难的事情,甚至可以说是管理学的世界性难题。”[11]评价是确定评价对象的优点、价值的过程,评价活动的出发点和落脚点在于价值判断。价值及其判断不仅是主观性的,还是个体化的,每个人都可以作出判断。价值判断采用主观主义方法论,从逻辑上看,由于人类价值认识能力的局限以及公正判断时德性的缺乏,上述矛盾将长期存在于教育评价的发展过程中,甚至贯穿于人类教育评价发展的始终,并非为特定阶段或时期所独有。以人情权钱的干扰为例,“重人情、讲关系、看面子”是中国社会长期以来形成的传统观念,短时间内难以彻底消除[12]。学术界和公众对此并无认知分歧,关键是置身于以刚性指标的事实判断取代综合考量的价值判断这一历史悠久、根基深厚的社会环境中,是重复“唯分数”等刚性指标在教育评价中的独尊地位并继续承受其代价,还是从根本上解决教育评价指挥棒问题,为自由探索评价范式转型的各种尝试创设机会?是断定以测量代替评价是“最不坏的制度”,还是相信西方国家长期和我国民国时期短暂践行的评价范式“更不坏”?何去何从,这本身亦是一个价值判断和价值选择。笔者认为,人情权钱的干扰、效率优先及决策的单一标准等为“四个评价”的全面和深入落实增加了难度和复杂性,评价范式转型的进程或将荆棘丛生,道阻且长,但是不行不至、不为不成,不能因为艰难就止步不前,行而不辍,则未来可期。


2.2 这些矛盾是普遍存在的,并非我国的国情所特有
  在高等教育发达的国家,选拔性高校的招生长期采用综合评价的录取机制,实践中同样面临人情关系以及权钱的干扰。记者丹尼尔·金的系列报道及专著《大学潜规则:谁能优先进入美国顶尖大学》详细披露了美国顶尖私立大学的招生内幕,他还因此荣获了2004年普利策奖[13]。2020年7月,“昆明小学生研究癌症获奖”话题引发热议,舆情压力下,涉事学生的父亲致歉并承认过度参与编撰,这一事件有力地佐证了刘海峰教授一文中的观点:“若将学生的‘科研成果’‘文体特长’等与升学直接挂钩,很可能导致相关活动的功利化与虚假化,以致催生层出不穷的科研‘拼爹’闹剧。”[1]笔者想要表达的是,类似现象在其他国家和地区也是存在的,韩国前任总统朴槿惠被罢免,导火索之一就是其闺蜜之女在升大学时所谓的马术特长及其得到的特殊关照。2019年,现任总统文在寅面临执政危机,其法务部长的女儿高中时期发表过一篇学术论文,这篇论文助力她在2010年进入高丽大学,多年后,这篇论文引发广泛的质疑,持续的大规模抗议迫使该部长辞职[14]。总之,这一矛盾在各国教育评价特别是考试招生制度中具有普遍性,并非我国的国情所特有。


2.3 综合评价存在不公正的可能性,但消极效果并不必然发生
  教育评价的公正性要求公平对待所有应试者,他们都有同等机会来证明自己的水平,且每位应试者都能得其所应得。当招生不完全依据分数,尤其不依据一场高利害考试的总分数时,“人情请托”“关系盛行”“权钱交易”等确实有存在的可能性,但其消极效果并不必然发生。美国的名校,比如哈佛大学、耶鲁大学和普林斯顿大学除招收精英阶层的子女外,还吸纳上升阶层的优秀学生,接纳一定数量的弱势群体的孩子,这些构成招生政策的基本框架[15]。得益于综合评价,一些相对弱势阶层的学生有机会展示自己的独特一面,故而亦有机会得到录取。达特茅斯学院的招生负责人曾介绍,一封来自学校清洁工人的推荐信帮助一位来自大型公立高中的优秀申请者在诸多天才般的学生中脱颖而出,并获得招生委员会的全票通过,这封推荐信打开了可以洞悉这个学生生活的一扇窗[16]。由于人类智识及德性的天然局限,由人组成的评价机构及机制肯定存在不公正的可能性;但是,主观价值判断的产物绝非产生全然的消极效果。我国民国时期的大学因为不唯分数进而招录到闻一多、朱自清、罗家伦、钱锺书、林巧稚、臧克家、钱伟长等后来成为行业大家的优秀学子。从2011年开始,浙江省实施“三位一体”招生,试点至今,已连续实现零投诉[17]。这一探索表明,摆脱唯分数的录取机制,以高校作为招生主体进行选拔或许没有部分学者所预想的那么悲观。因此,理论与实践的关注重点不应该是要不要,而是如何做,尤其是对这些可能出现的不公正进行标本兼治的防范。

 3

上述主要矛盾的化解思路

  矛盾的反复发生和不断解决构成了评价工作的实践进展,以分数为出发点和根本旨归的“唯分数论”其实也是一种化解矛盾的思维和方法。只是,逻辑与实证均可证明,“唯分数论”在化解上述矛盾时,虽能“杀敌一千”,但无可避免地会“自损八百”。原本作为评价依据的分数被高举成为评价本身,在其强而有力辖制力量的裹挟下,分数成为最现实的也是最大的功利,其背后的教育与人的发展空间被极大压缩。清华大学吴国盛教授指出,我国社会广泛存在的功利主义对于创新氛围是一种极大的损伤,教育的目的是高考,高考的目的是找工作,教育仍在生产一些单纯为了某种特殊目的来从事学习任务的后备人才,并没有激活无功利的探索热情[18]。如果具有专注于对知识本身的渴望、对真理本身的热情、对探索宇宙奥秘不可遏制的冲动的学习者也是不可多得的优秀人才,那么,当高考总分数占据绝对的主导地位,许多潜在的“天才”“优才”已经和正在被拒之门外,机会实际是留给了“中才”甚至“庸才”。2018年以来,破除以“唯分数”为代表的“破五唯”,以及2020年提出的“四个评价”成为构建现代教育评价新体系的基本纲领。然而,由于我国制度化的基于客观主义刚性指标的考试与评价实践历史悠久,思维根深蒂固,“破五唯”以及“四个评价”的落实显得困难重重。如何化解评价过程中的主要矛盾,如何规避风险,责任谁来承担,如何开启破冰之旅,笔者尝试提出以下思路。


3.1 以教育价值的判断及其证成为基本出发点,并聚焦评价效度
  西方国家的选拔性高校招生时采用的选拔办法,其效率远远低于我国高校。比如:美国选拔性高校招生部门几十上百名专职人员要逐一审阅每名申请者提交的包括考试成绩在内的各类申请材料,历时数月之久。哈佛大学每年通过ACT、SAT和PSAT的组织机构获得高分考生的联系方式,主动向其中的高分学生(大约10万名)邮寄招生资讯,鼓励他们报考哈佛大学,而该校本科招生规模稳定在1600名左右[19]。此外,学生可以申请多所高校并有机会被多所高校录取,最终的决定权在学生手中,高校纵然是千挑万选,被选中的学生依然有极大的可能性放弃到这些高校就读,如加州大学伯克利分校2019—2020学年新生的实际注册率仅有45%[20]。高校的招生录取充满不确定性,付出的时间和精力看起来白白浪费;但是,很显然,这样的选拔制度所依托的评价思想是效度优先,即使高校的辛劳“付之东流”也在所不惜,因为评价活动和招生过程视评价效度为最高目标,评价立足于个体的人。这样的机制在化解评价主要矛盾时,基本的出发点在于教育价值的判断及其证成,珍视教育中那些不可或难以测量之物,评价聚焦于评价效度这一根本要义。


3.2 “疏”而非“堵”,并坚持责任—权利—利益激励相容
  《第四代评估》一书的扉页上印着这样一段话:“我仅知道社会的最高决策权不在别处,就在人民之中。如果我们认为人民不够开通,难以行使理智的决策权,那么,补救的方法不是将此决策权从他们手中收回,而是给他们指明方向。”[21]对教育评价中可能出现的各种问题以及主要矛盾的化解,西方国家与我国民国时期用“疏”而非“堵”的方法加以解决的思路值得借鉴。比如,对于文艺或科研方面有特长的学生,美国的大学招生鼓励其提交相关的艺术作品(如原创音乐、戏剧表演录像、幻灯片、小说诗歌等)或科研作品,招生办公室会把这些作品分配给相关专业的教师审阅,其间还会辅以面试等方式对其进行核查,一旦发现造假,不仅没有机会升学,还可能惹上官司。2019年,美国大学爆出史上最大规模的招生丑闻案,司法部对此展开多层面的司法调查,不仅涉案的伪升学咨询机构的负责人受到了法律的严惩,还有50多名家长被指控,第52名被告——通过行贿送孩子进入名校的中国籍妈妈于2019年9月16日在西班牙被捕,她一直被拘留在西班牙监狱,直到被引渡到麻州波士顿出庭,参加认罪与否的听证,最终法院判处她支付25万美元罚款以及5个月监禁[22]。这个案例显示造假者(既包括受贿人也包括行贿者)会受到法律的严惩,已经在大学里就读的当事学生会被开除学籍,所有涉案人员的调查结果及审判信息都会面向社会公开,对家长尤其是学生本人,其事业发展或将面临毁灭性打击。《教育与心理测量标准》提出,对于“任何形式的作弊或降低考试效度和考试结果解释公平性的行为都应及时调查,并采取适当的行动”[7]137。基于这样的疏导或可称之为民情培育机制,西方国家考试招生制度中学生及家长自然不愿意也不敢造假,即便学生优异的科研项目在招生时有用武之地,却并没有导致学生的科研探索普遍的虚假化,没有催生出科研“拼爹”闹剧。
  值得深刻反思的是,我国在处理教育评价相关矛盾时,责任、权利、利益三者常常是剥离的。比如高考制度中,负责招生的机构并不承担后续的人才培养责任,被录取的学生是否身心健康、是否适合本专业的学习、是否有潜力在本领域成名成家,招生机构无法顾及。对于绝大多数承担培养责任的高校,其招生办公室实际上是“接生”办公室,其职能仅仅是或主要是接收来自省级教育考试机构的投档名单,然后以高校的名义发放录取通知书,仅此而已。责任、权利、利益三者的剥离还体现在对高校尤其是高水平大学,人才培养能否取得实效对其竞争优势的获得并不至关重要。教育评价尤其是考试招生制度中的评价涉及社会的许多方面,是我国教育改革中公认的最具难度、最复杂和最敏感的领域之一,由于系统性、综合性强,矛盾化解过程中一定要尽力做到责任—权利—利益激励相容,这是破解教育评价“五唯”弊病以及处理好“四个评价”主要矛盾的根本方向。


3.3 赋予价值主体评价自主权,通过充分保障学生权利等倒逼评价主体的能力建设
  综合上述论述,笔者认为,对于“四个评价”落实过程中主要矛盾的化解,对于可能出现的各种问题,不能通过严格管控甚至剥夺学校的评价主体地位及评价自主权的方式进行解决,一个可行的思路是依托法治,综合运用市场竞争、行业自治以及学校的自我规制等多重手段进行全方位治理。矛盾化解的基本架构在于学校自主评价、政府依法宏观管理、社会参与监督。在西方国家,高校尤其是私立高校具有充分的招生自主权,只要不触及、不逾越法律底线,如何招生由高校自主决定,政府在考试招生中的职能主要是依法宏观管理。2020年8月13日,美国司法部宣布了一项针对耶鲁大学为期2年的调查结论,即耶鲁大学存在系统性的歧视亚裔和美国白人的行为,同等情况下,亚裔和白人只有非裔美国人1/8和1/4的录取概率;司法部要求耶鲁大学在未来的招生中必须先向司法部提交详细的招生方案,并保证其做法在法律许可范畴之内[23]。耶鲁大学否认这一指控,并表示没有计划改变其招生做法[24];于是,2020年10月8日,司法部正式起诉耶鲁大学在本科招生中存在非法歧视[25]。此外,社会的监督特别是媒体的全方位多角度披露,在化解矛盾时也发挥着不容忽视的作用。
  新时代教育评价改革应坚持责任—权利—利益激励相容,这就使得矛盾化解的关键主体必须也必然是价值主体,“谁用谁评价”是一个关键原则,如果价值主体的评价自主权无从体现,“四个评价”的核心要旨将难以真正实现。考试招生制度中化解主要矛盾的关键主体是招生学校,只有当学校能免于强制,有充分的自主权利以及强劲的内在动力突破格套不拘一格选拔优秀学子时,考试招生制度才算迈出了实质性的一步。笔者认为,招生学校评价权利的落实应从学生多重选择权利的切实保障入手,这体现了评价博弈中对弱势一方的保护。由于人类智识及德性的局限,由人组成的评价机构及机制难免存在失误和过错,此时,保护弱者的权利尤为重要。此外,学生多重选择权利的充分保障也是生源市场竞争的基石,有助于高校整体办学活力及切实改进之内在动力的激发。以美国高校招生为例,长期以来,学生不但可以立足自身优势自主地选择采用不同招生模式的高等学校,还可以申请多所高校并有机会同时被多所高校预录取,进入大学后还可以校际转学[26]。市场机制催生着自律和自治机制的建立,如果高校在招生时“潜规则”超过一定的限度,市场会惩戒并最终淘汰它。与仅有一次被录取机会的招生机制相比,如果学生确实优秀,即便由于偶然因素被某所高校拒之门外,学生依然会有比较理想的升学机会,那么综合评价时主观判断的误差及风险,特别是学生及家长可能的不满,一定程度上就会被消解。这或许也是美国一些著名大学,尤其是一流的私立大学招生过程中虽然存在各种“潜规则”,但整个社会对高校自主权及综合评价的招生理念没有动摇过的一个原因。市场机制还激发和推动着创新的出现,为了在生源市场竞争中取胜,高校不得不提高评价能力,甚至不得不持续关注入学后对学生的教育教学及其培养成效,这或许也是美国高等教育尤其是其一流大学整体教育教学水平在世界上独领风骚的一个缘由。

  任何制度都应当是以人为目的、为人服务的。制度优劣的评判建立在所期待实现的目标基础之上,如果并不认为我们的评价亟须回归教育与人的发展本身,那么,“唯分数”等“五唯”评价方式的改革就不十分必要,况且改革有改革的挑战和风险,不改也有不改的合理性和社会基础。只有认识到当下的教育评价过分强调刚性指标的绝对价值,评价已经在一定程度上异化成为管控人的枷锁,而这对于国家和民族的发展,对于个人的成长都有严重的消极影响和后果;只有确信“四个评价”是正确的发展方向,坚信在这一方向上的持续探索意义深远:唯其如此,“四个评价”落实过程中的主要矛盾才能真正受到重视,并进而逐步得以化解,“四个评价”的核心要旨才能被真正地追求和实现。



更多相关文章

周洪宇. 深化教育评价改革 加快推进教育现代化——《深化新时代教育评价改革总体方案》解读[J]. 中国考试, 2020(11): 1-8.


精彩回顾 | “深化新时代教育评价改革研究”系列文章





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存