查看原文
其他

“高分通胀”的背后,是教育的悲剧

The following article is from 陈志文观察 Author 陈志文

今年中高考分数公布,和我们预设的疫情影响分数下降的场景不同,各地高分考生纷纷井喷。


北京中考满分580分、570以上的考生创造了纪录,超过1400余人(一说1300余人),而去年仅有9人。高考也一样,700分以上80人,而2019年仅有24人。中高考都创下了历史最高纪录。


不止北京。上海中考考生总量约8万人,数学成绩在141-150(150)分的有26988人,136分以上的达到3.78万人,逼近一半人数。英语成绩在141-150分的高达15985万人,136分以上的3万多人。


在河南,高考600分以上的考生达44162人,700分以上考生169人,但2019年高考状元也仅有702分。在河北,600分以上考生超过3万人,700分以上106人,均大幅提高,创造了历史最高纪录。





都是高分考生,分数的筛选价值越来越微弱,也不断加剧着分数的竞争,已经不再是分分计较,中考甚至是零点几分的计较。


选拔性考试变得越来越水平化、简单化,甚至模式化,高分考生越来越多。


以前的中高考不是这样的,作为一项选拔性考试,区别度还是显著的。也就是说,学业优秀与否,分数差距是很大的,第一名与第二名之间差距也不小。在中高考中,满分是极其稀缺的,能有一两个人已经了不起了。但现在,想当第一名,恨不得要求你门门满分或者逼近满分。


为什么会这样?在我看来,大体有五方面原因:


第一,把考试难度与负担强行挂钩,一直试图通过降低考试难度来减负。


第二,求稳成为各地中高考的核心诉求,民意诉求,导致中高考考试不断模式化,考试内容与题型甚至大面积固化。


第三,与招生改革的指导思想有关,相关部门一直希望以水平测试替代选拔性考试,破解应试教育,破解对分数的追求。


第四,家长对学生教育投入的重视,应试教育发达,客观上导致考生水平也在提高。


第五,随着高等教育与高中教育普及,中高考不得不承担更多水平测试的职能,不得不部分水平化。当然,今年疫情备考不充分,让各级考试在命题上也不得不适当下调难度,这是今年的特殊情况。


这里面有客观原因,也有非客观原因,而非客观原因更值得深入探讨。


首先就是把考试难度与负担强挂钩。


上世纪90年代以来,舆论与大众对以高考为代表的升学考试口诛笔伐,无限上纲上线,指责大学教授也不会做什么题之类的标题比比皆是。考试试题难度被认为直接影响甚至决定学生的负担,试题难度大,压力就大。


在这种舆论压力下,各级选拔性考试不断退让,追求稳定,降低难度,中高考试题因此越来越模式化,甚至固化,“万年不变”的送分题越来越多,考基本智商的题比比皆是。中高考越来越像托福、雅思等水平化考试,越来越远离选拔性考试。




这是近年来各类升学考试中值得注意的一个趋势,其背后无非是一个荒唐的逻辑:试题难度与学生负担成正比,为降低负担而不断降低难度。


其实,考试的难度与负担之间没有必然联系,这是一个浅显的基本逻辑,基本道理。如果谈到负担,其实只与你考试的期望值相关联。再简单的考试,想考第一都是比较难的,再难的考试,想考零分都是很容易的,而非试题的难度。但遗憾的是,很多人把这个逻辑颠倒了。


这一现象,还与我们近年一些招生改革的思想有关,与倡导甚至照搬英美的招生录取方式有关,推行选拔性考试水平化、等级化,试图以水平测试破解应试教育难题。


不同的考试,其定位与目的,效果和作用是不同的,简单从功能上来说,一种是水平考试,一种是选拔性考试。原则上讲,水平考试难度相对较低,从测量角度看,区分度较低,是粗颗粒的,只是一个大致分层。但是选拔性测试不同,它更强调对优秀人才的区别与选拔,要求区分度更高,是细颗粒的。


我们所熟知的美国的各种考试多数是前者。美国“高考”SAT实际上相当于我们的高中学业水平测试,美国的“中考”SSAT类似我们初中学业水平测试。同样,托福也是一种语言水平测试。这类水平测试在分数的计量上也是不同的,比如老SAT满分为2400分时,即便再低,一般也不会低于1200分,想低于这个分,稀缺度和考2380分以上一样难,因此经常有人开玩笑说:你如果SAT能考到1100,我就请你吃饭。


美国盛行的这种水平化考试,是与其录取制度配套的,即水平考试作为一个基础学术评价,学校在此基础上综合评价后招生录取。这些成绩是基础,但不是唯一依据。


中国则不然。因为诚信等原因,最后不得不回到分数这个唯一的刚性依据上来,这时,盲目套用美国的水平测试,那几乎是一场灾难。人家用一个粗框架的水平测试作为一个评价基础,我们却需要把这个东西作为唯一标准,怎能不出问题?


近日江苏文科第一名(严格讲并非第一名),因为历史科目B+无缘北大清华就是这个原因。其实按江苏的规则,她无缘大部分的985高校,不止是清华北大。




2008年江苏高考改革,考试上的基本模式就是选拔性考试(语数外)+水平测试。这一分裂的混搭组合,目的是降低分数的残酷竞争,但却造成了更多的混乱,不得不废弃。


除此之外,我们的考试越来越简单,还有一个潜在原因,搞“分数GDP”,让多数考生与家长都有分数的获得感,皆大欢喜。比如某市曾经在一年之间就让高考分数平均分上涨了100分左右。


近年各地在“分数GDP”的竞争上也越来越激进,尤其是中考,几乎一个比一个容易,无法区分。越来越多的人是高分考生,家长学生脸上都有光。这很有点像消灭薄弱校的做法,挂牌子,改名字,于是大家都是名校,皆大欢喜。


如果这个做法对人才选拔与培养有利,没什么不可以,遗憾的是,多数适得其反。考生的分数越来越高,表面上家长和孩子都皆大欢喜,岂不知害苦了中国教育。


首先,考试简单化、水平化、模式化,大大降低了考试的区分度,完全破坏了选拔人才的功能,带来了更激烈的分分计较。


我们虽然不断推进招生改革,包括综合素质评价,但因为诚信等种种现实困难,在公平强大的诉求下,综合素质评价只能是“一参考”,最后升学考试多数还是要回到分数这把刚性的尺子上来。这时,分数之间的竞争更加激烈,已经不再是分分计较,而是零点几分的计较。1分2分有区别吗?当然没有。破解分分计较的办法,带来的却是更残酷的零点几分的计较。




其次,也是更糟糕的,考试越来越水平化,甚至固化,分数越来越高,区分度越来越低的分数,对于人才选拔的意义越来越小,尤其是对拔尖人才,甚至起反作用,选拔出的更多可能是中间人才,未必是顶尖人才。


这也导致一些名校,不得不放弃依赖高考分数的选拔,越来越多地走特殊类型招生,希望通过其他尺子,弥补缺乏区分度的尺子。自主招生近年大行其道就是这个原因。


近年著名高校在浙江搞的三位一体,表面上是综合评价,即60%是高考分数,10%是中学学业水平评价,30%是学校自己的评价。但核心还是需要靠高校自己的笔试与面试做一次再甄别,以选拔出最优秀的。


2019年,在清华大学三位一体测试考场,很多考生提前交卷,一个关键原因就是题目难度,考生自知没戏,索性提前交卷准备下午其他学校的测试。有一名女生对记者说:真难,题型都没有见过。其实,这句话可以反向理解:高考的题型与内容都是见过的。


近年各地高考状元普遍不再来自当地名校,呈现全面分散的现象,有人高兴地认为这是优质教育资源均衡的结果,岂不知这是考试简单化、水平化的结果。这种低难度,水平化甚至固化的测试,最后较量的是熟悉程度,是谨慎不出错,拼的不是能力,而是不丢分。因此,更多的人都有可能胜出。


这种升学考试,最后褒奖的不全是最优秀的人,多数是最擅长刷题的人。对于极其优秀的学生,反而增加了大量无效负担,为了几分的区别,很多孩子不得不花上一年甚至更久的时间重复训练,才能确保进入一个理想的学校。从这个角度上看,这种考试,恰恰是给优秀学生增加了无效负担。




其次,与各级考试难度下降,考试模式化、固化相伴,在应试教育的现实状况下,各地也出现了学生学业水平下降的新问题。


这方面最典型的案例,莫过于江苏的2008年高考模式。2008年江苏的高考改为语数外(不分文理)+水平(等级)测试。前面还是选拔性考试,后面的测试则直接表述为A+,A等。这个方案的出发点非常理想,也很可爱。


这个方案引起各方非议只是一方面,比如今年所谓文科第一名无缘北大清华的结果。另一方面,水平测试带来江苏考生在物理等等级测试科目上水平的大幅度下滑。


北京某著名大学对江苏生源的长期监测表明,原来数学物理成绩遥遥领先于全国,高居该校第一名的江苏生源,2008年新高考后,数学物理成绩下降显著,尤其是物理,在实施新高考5年后,江苏考生的物理成绩在学校新生摸底测试中,从第一名跌至第19名。


其根本原因就是考试的模式,语数外不分文理,数学难度不得不降低,而后面更彻底的是粗颗粒的水平(等级)考试,难度大幅下降。考的简单了、少了,学生学的就少了,导致江苏考生在这些学科上的水平大幅度下滑。因此,该校近些年对于江苏考生不再像以前那么青睐了。


功利文化是弥漫性的,一旦考试这个指挥棒简单了,学的就必然少了。从这个角度看,从为国家人才培养的角度看,我们要高度警惕,中高考考试水平化,简单化,是否会带来人才培养质量的普遍下降?


最后,如果说区分度降低,难以选拔出优秀人才还可忍受的话,那么选拔性考试简单化、水平化、模式化,则直接推动了应试教育的发展,这是我们坚决不能接受的。


一方面推动中高考等选拔性考试逐渐水平化,简单化,另一方面,为了追求所谓的平稳,命题不得不模式化,甚至固化,各地中高考所考核的知识点与题型大多连年保持不变,这几乎等于考试试题三年早知道。对于理科科目,区别只是切入点与参数的变化。




要保证在这种考试中脱颖而出,关键在于不出错,怎样才能做到这一点?训练,连续不断的重复训练,因为重复训练是最有效的,这也就是全国弥漫性的应试教育难以根除的重要原因之一。


我曾在某地一所重点中学看到一个班训:作业按时交,必上211。这个班训鲜活地反映了目前考试的特点或者说不足。考什么,其实大家都知道,核心是扎实训练,不出错,因为这种重复训练是有意义和有效的。


衡水中学等地方中学全面崛起,虽然有多种原因,但其中一个原因就在于这种考试模式,让扎实的重复训练有了重大意义。这可能是一些专家在批判考试难时始料未及的。


同时,区分度降低,也前所未有地强化了分数的价值,分分必争成为一个普遍而现实的问题。即便是在北京,考生不足7万人的情况下,一个高分分数段有几十人甚至上百人比比皆是。


在一些考生大省,比较高的分数段1分动辄200-300百人,甚至近千人,而一所高校在当地招生量才有多少?反观低分分数段,1分段往往只有几个人。最后推动的只能是应试教育的加剧。


在我们还无法全面推行综合素质评价,对于大多数人只能以考试成绩为核心录取依据的背景下,这种选拔性考试水平化、固化,恰恰强化了应试教育。毕竟,刷题是管用的,效果是明显的,就如托福、GRE一样。


中高考分数全面上涨,表面上皆大欢喜,大家都收获满满成就感,但也误导了很多的家长与学生。人是有区别的,尤其是中考虚高,导致很多家长与考生对自己做出误判,无意间推升了对教育的期望值。


中考分数几乎没有区分度的情况下,顶级名校与其他中学的录取分数几乎没有区别,于是很多家长误以为自己孩子很优秀,一不留神就能考上北大清华,于是拼命补习,希望把最后一公里补上来,客观上推动了教育的剧场效应。


因此,中高考难度加大,拉开差距后,一个积极的意义就是让一部分家长与考生有清醒的认知,选择适合自己的道路,而不是拼命补习、训练,全部追名校。新加坡在这方面的做法给了我们很好的启示,从小升初考试开始,就让一批家长彻底放弃了精英道路的追求。


升学考试这种选拔性考试简单化、水平化,在还不能全面推行综合素质评价的背景下,对中国教育是弊大还是利大?在我看来,答案是明确的。


是时候予以纠正了。中高考试题要打破水平化,简单化,甚至固化倾向,加强区分度,尤其是打破固化倾向,每年的试题无论考核点还是出题形式,都需要加大变化,最大程度减少重复率,让所有人无试可应,反而可以最大程度降低应试教育,减轻学生负担。


最后还想提醒大家,考试无论难易,对考生都是公平的,家长和学生不必焦虑。



来源 | 陈志文观察作者 | 陈志文责编 | 陶小玮

2594889720@qq.com

• 晦涩是种思想病——也说浙江高考满分作文

谁是你的得力干将?

• 开启一场面向未来的新学习浪潮 ——中国教育创新年会主办者手记

▼ 点击「阅读原文」,一键购买!
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存