“高分通胀”的背后，是教育的悲剧

新校长传媒 2021-12-23

The following article is from 陈志文观察 Author 陈志文

今年中高考分数公布，和我们预设的疫情影响分数下降的场景不同，各地高分考生纷纷井喷。

北京中考满分580分、570以上的考生创造了纪录，超过1400余人（一说1300余人），而去年仅有9人。高考也一样，700分以上80人，而2019年仅有24人。中高考都创下了历史最高纪录。

不止北京。上海中考考生总量约8万人，数学成绩在141-150（150）分的有26988人，136分以上的达到3.78万人，逼近一半人数。英语成绩在141-150分的高达15985万人，136分以上的3万多人。

在河南，高考600分以上的考生达44162人，700分以上考生169人，但2019年高考状元也仅有702分。在河北，600分以上考生超过3万人，700分以上106人，均大幅提高，创造了历史最高纪录。

都是高分考生，分数的筛选价值越来越微弱，也不断加剧着分数的竞争，已经不再是分分计较，中考甚至是零点几分的计较。

选拔性考试变得越来越水平化、简单化，甚至模式化，高分考生越来越多。

以前的中高考不是这样的，作为一项选拔性考试，区别度还是显著的。也就是说，学业优秀与否，分数差距是很大的，第一名与第二名之间差距也不小。在中高考中，满分是极其稀缺的，能有一两个人已经了不起了。但现在，想当第一名，恨不得要求你门门满分或者逼近满分。

为什么会这样？在我看来，大体有五方面原因：

第一，把考试难度与负担强行挂钩，一直试图通过降低考试难度来减负。

第二，求稳成为各地中高考的核心诉求，民意诉求，导致中高考考试不断模式化，考试内容与题型甚至大面积固化。

第三，与招生改革的指导思想有关，相关部门一直希望以水平测试替代选拔性考试，破解应试教育，破解对分数的追求。

第四，家长对学生教育投入的重视，应试教育发达，客观上导致考生水平也在提高。

第五，随着高等教育与高中教育普及，中高考不得不承担更多水平测试的职能，不得不部分水平化。当然，今年疫情备考不充分，让各级考试在命题上也不得不适当下调难度，这是今年的特殊情况。

这里面有客观原因，也有非客观原因，而非客观原因更值得深入探讨。

首先就是把考试难度与负担强挂钩。

上世纪90年代以来，舆论与大众对以高考为代表的升学考试口诛笔伐，无限上纲上线，指责大学教授也不会做什么题之类的标题比比皆是。考试试题难度被认为直接影响甚至决定学生的负担，试题难度大，压力就大。

在这种舆论压力下，各级选拔性考试不断退让，追求稳定，降低难度，中高考试题因此越来越模式化，甚至固化，“万年不变”的送分题越来越多，考基本智商的题比比皆是。中高考越来越像托福、雅思等水平化考试，越来越远离选拔性考试。

这是近年来各类升学考试中值得注意的一个趋势，其背后无非是一个荒唐的逻辑：试题难度与学生负担成正比，为降低负担而不断降低难度。

其实，考试的难度与负担之间没有必然联系，这是一个浅显的基本逻辑，基本道理。如果谈到负担，其实只与你考试的期望值相关联。再简单的考试，想考第一都是比较难的，再难的考试，想考零分都是很容易的，而非试题的难度。但遗憾的是，很多人把这个逻辑颠倒了。

这一现象，还与我们近年一些招生改革的思想有关，与倡导甚至照搬英美的招生录取方式有关，推行选拔性考试水平化、等级化，试图以水平测试破解应试教育难题。

不同的考试，其定位与目的，效果和作用是不同的，简单从功能上来说，一种是水平考试，一种是选拔性考试。原则上讲，水平考试难度相对较低，从测量角度看，区分度较低，是粗颗粒的，只是一个大致分层。但是选拔性测试不同，它更强调对优秀人才的区别与选拔，要求区分度更高，是细颗粒的。

我们所熟知的美国的各种考试多数是前者。美国“高考”SAT实际上相当于我们的高中学业水平测试，美国的“中考”SSAT类似我们初中学业水平测试。同样，托福也是一种语言水平测试。这类水平测试在分数的计量上也是不同的，比如老SAT满分为2400分时，即便再低，一般也不会低于1200分，想低于这个分，稀缺度和考2380分以上一样难，因此经常有人开玩笑说：你如果SAT能考到1100，我就请你吃饭。

美国盛行的这种水平化考试，是与其录取制度配套的，即水平考试作为一个基础学术评价，学校在此基础上综合评价后招生录取。这些成绩是基础，但不是唯一依据。

中国则不然。因为诚信等原因，最后不得不回到分数这个唯一的刚性依据上来，这时，盲目套用美国的水平测试，那几乎是一场灾难。人家用一个粗框架的水平测试作为一个评价基础，我们却需要把这个东西作为唯一标准，怎能不出问题？

近日江苏文科第一名（严格讲并非第一名），因为历史科目B+无缘北大清华就是这个原因。其实按江苏的规则，她无缘大部分的985高校，不止是清华北大。

2008年江苏高考改革，考试上的基本模式就是选拔性考试（语数外）+水平测试。这一分裂的混搭组合，目的是降低分数的残酷竞争，但却造成了更多的混乱，不得不废弃。

除此之外，我们的考试越来越简单，还有一个潜在原因，搞“分数GDP”，让多数考生与家长都有分数的获得感，皆大欢喜。比如某市曾经在一年之间就让高考分数平均分上涨了100分左右。

近年各地在“分数GDP”的竞争上也越来越激进，尤其是中考，几乎一个比一个容易，无法区分。越来越多的人是高分考生，家长学生脸上都有光。这很有点像消灭薄弱校的做法，挂牌子，改名字，于是大家都是名校，皆大欢喜。

如果这个做法对人才选拔与培养有利，没什么不可以，遗憾的是，多数适得其反。考生的分数越来越高，表面上家长和孩子都皆大欢喜，岂不知害苦了中国教育。

首先，考试简单化、水平化、模式化，大大降低了考试的区分度，完全破坏了选拔人才的功能，带来了更激烈的分分计较。

我们虽然不断推进招生改革，包括综合素质评价，但因为诚信等种种现实困难，在公平强大的诉求下，综合素质评价只能是“一参考”，最后升学考试多数还是要回到分数这把刚性的尺子上来。这时，分数之间的竞争更加激烈，已经不再是分分计较，而是零点几分的计较。1分2分有区别吗？当然没有。破解分分计较的办法，带来的却是更残酷的零点几分的计较。

其次，也是更糟糕的，考试越来越水平化，甚至固化，分数越来越高，区分度越来越低的分数，对于人才选拔的意义越来越小，尤其是对拔尖人才，甚至起反作用，选拔出的更多可能是中间人才，未必是顶尖人才。

这也导致一些名校，不得不放弃依赖高考分数的选拔，越来越多地走特殊类型招生，希望通过其他尺子，弥补缺乏区分度的尺子。自主招生近年大行其道就是这个原因。

近年著名高校在浙江搞的三位一体，表面上是综合评价，即60%是高考分数，10%是中学学业水平评价，30%是学校自己的评价。但核心还是需要靠高校自己的笔试与面试做一次再甄别，以选拔出最优秀的。

2019年，在清华大学三位一体测试考场，很多考生提前交卷，一个关键原因就是题目难度，考生自知没戏，索性提前交卷准备下午其他学校的测试。有一名女生对记者说：真难，题型都没有见过。其实，这句话可以反向理解：高考的题型与内容都是见过的。

近年各地高考状元普遍不再来自当地名校，呈现全面分散的现象，有人高兴地认为这是优质教育资源均衡的结果，岂不知这是考试简单化、水平化的结果。这种低难度，水平化甚至固化的测试，最后较量的是熟悉程度，是谨慎不出错，拼的不是能力，而是不丢分。因此，更多的人都有可能胜出。

这种升学考试，最后褒奖的不全是最优秀的人，多数是最擅长刷题的人。对于极其优秀的学生，反而增加了大量无效负担，为了几分的区别，很多孩子不得不花上一年甚至更久的时间重复训练，才能确保进入一个理想的学校。从这个角度上看，这种考试，恰恰是给优秀学生增加了无效负担。

其次，与各级考试难度下降，考试模式化、固化相伴，在应试教育的现实状况下，各地也出现了学生学业水平下降的新问题。

这方面最典型的案例，莫过于江苏的2008年高考模式。2008年江苏的高考改为语数外（不分文理）+水平（等级）测试。前面还是选拔性考试，后面的测试则直接表述为A+，A等。这个方案的出发点非常理想，也很可爱。

这个方案引起各方非议只是一方面，比如今年所谓文科第一名无缘北大清华的结果。另一方面，水平测试带来江苏考生在物理等等级测试科目上水平的大幅度下滑。

北京某著名大学对江苏生源的长期监测表明，原来数学物理成绩遥遥领先于全国，高居该校第一名的江苏生源，2008年新高考后，数学物理成绩下降显著，尤其是物理，在实施新高考5年后，江苏考生的物理成绩在学校新生摸底测试中，从第一名跌至第19名。

其根本原因就是考试的模式，语数外不分文理，数学难度不得不降低，而后面更彻底的是粗颗粒的水平（等级）考试，难度大幅下降。考的简单了、少了，学生学的就少了，导致江苏考生在这些学科上的水平大幅度下滑。因此，该校近些年对于江苏考生不再像以前那么青睐了。

功利文化是弥漫性的，一旦考试这个指挥棒简单了，学的就必然少了。从这个角度看，从为国家人才培养的角度看，我们要高度警惕，中高考考试水平化，简单化，是否会带来人才培养质量的普遍下降？

最后，如果说区分度降低，难以选拔出优秀人才还可忍受的话，那么选拔性考试简单化、水平化、模式化，则直接推动了应试教育的发展，这是我们坚决不能接受的。

一方面推动中高考等选拔性考试逐渐水平化，简单化，另一方面，为了追求所谓的平稳，命题不得不模式化，甚至固化，各地中高考所考核的知识点与题型大多连年保持不变，这几乎等于考试试题三年早知道。对于理科科目，区别只是切入点与参数的变化。

要保证在这种考试中脱颖而出，关键在于不出错，怎样才能做到这一点？训练，连续不断的重复训练，因为重复训练是最有效的，这也就是全国弥漫性的应试教育难以根除的重要原因之一。

我曾在某地一所重点中学看到一个班训：作业按时交，必上211。这个班训鲜活地反映了目前考试的特点或者说不足。考什么，其实大家都知道，核心是扎实训练，不出错，因为这种重复训练是有意义和有效的。

衡水中学等地方中学全面崛起，虽然有多种原因，但其中一个原因就在于这种考试模式，让扎实的重复训练有了重大意义。这可能是一些专家在批判考试难时始料未及的。

同时，区分度降低，也前所未有地强化了分数的价值，分分必争成为一个普遍而现实的问题。即便是在北京，考生不足7万人的情况下，一个高分分数段有几十人甚至上百人比比皆是。

在一些考生大省，比较高的分数段1分动辄200-300百人，甚至近千人，而一所高校在当地招生量才有多少？反观低分分数段，1分段往往只有几个人。最后推动的只能是应试教育的加剧。

在我们还无法全面推行综合素质评价，对于大多数人只能以考试成绩为核心录取依据的背景下，这种选拔性考试水平化、固化，恰恰强化了应试教育。毕竟，刷题是管用的，效果是明显的，就如托福、GRE一样。

中高考分数全面上涨，表面上皆大欢喜，大家都收获满满成就感，但也误导了很多的家长与学生。人是有区别的，尤其是中考虚高，导致很多家长与考生对自己做出误判，无意间推升了对教育的期望值。

中考分数几乎没有区分度的情况下，顶级名校与其他中学的录取分数几乎没有区别，于是很多家长误以为自己孩子很优秀，一不留神就能考上北大清华，于是拼命补习，希望把最后一公里补上来，客观上推动了教育的剧场效应。

因此，中高考难度加大，拉开差距后，一个积极的意义就是让一部分家长与考生有清醒的认知，选择适合自己的道路，而不是拼命补习、训练，全部追名校。新加坡在这方面的做法给了我们很好的启示，从小升初考试开始，就让一批家长彻底放弃了精英道路的追求。

升学考试这种选拔性考试简单化、水平化，在还不能全面推行综合素质评价的背景下，对中国教育是弊大还是利大？在我看来，答案是明确的。

是时候予以纠正了。中高考试题要打破水平化，简单化，甚至固化倾向，加强区分度，尤其是打破固化倾向，每年的试题无论考核点还是出题形式，都需要加大变化，最大程度减少重复率，让所有人无试可应，反而可以最大程度降低应试教育，减轻学生负担。

最后还想提醒大家，考试无论难易，对考生都是公平的，家长和学生不必焦虑。

来源 | 陈志文观察作者 | 陈志文责编 | 陶小玮

2594889720@qq.com

• 晦涩是种思想病——也说浙江高考满分作文

•谁是你的得力干将？

• 开启一场面向未来的新学习浪潮 ——中国教育创新年会主办者手记

▼ 点击「阅读原文」，一键购买！

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

“高分通胀”的背后，是教育的悲剧

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

生成图片，分享到微信朋友圈

“高分通胀”的背后，是教育的悲剧

您可能也对以下帖子感兴趣