邵志芳 , 庞维国 , 段芮:高考试卷的性差分辨力及其与录取性别比的关系
摘要
高考科目和内容的设置,被认为是导致近年来高考录取中"男少女多"的重要原因。本研究采用2005、2008、2011和2014年全国高考数学、语文、英语试卷,对在校高中生进行实测,取得了各年份考试成绩的性别差异量,进而考察了各份试卷性差分辨力的稳定性,以及女生上线比例与参试者性别比和录取率的关系。结果显示:(1)近些年高考试卷的性差分辨力不太稳定;(2)高考成绩的性别差异确实存在,但总体差距不大;(3)参试者性别比和录取率等因素的变化,是导致高考录取性别比变化的主要原因。
关键词:高考;性别差异;录取性别比;参试者性别比;性差分辨力
一、导言
进入21世纪以来,我国学生学业成绩“女强男弱”趋势逐年明显。这一现象表现在高考中,就是普通高校录取学生的性别比从“男多女少”转化为“男少女多”,且差距持续拉大。根据教育部(2016a)网站公布的统计数字,1999年女生占全部录取学生的比例仅为40%;到2006年接近50%,2007年达到53%,2008年升至55%;2013年和2014年维持在55%;2015年略有上升,达55.65%。也就是说,近年来,高考录取的学生中,男生比例平均低于女生11个百分点。
这么大的差距从何而来?有人认为,这可能源于考试科目和内容的设置有利于女生。事实上,近年来关于高考成绩的性别差异的研究结果也显示,女生在文科类考试中成绩明显好于男生。例如,雷新勇(2007)发现,上海高考中女生的英语成绩比男生高了近15分;曾满超等(2012)发现,山东省某市2011年考生除数学成绩性别差异不大以外,语文、英语两科目上女生的得分都显著高于男生;李金波和杨军(2014)的研究结果也显示,在语文、数学(文科)、英语、文科综合、政治等科目上,女生成绩高于男生,男生仅在理科综合和物理两科目上超过女生,而在其他科目上男女生差异不大。李文道和孙云晓(2012)甚至认为,应试教育本身就将男生置于不利地位。
考虑到我国高考改革将实行全国统考减少科目,主要参考语文、数学、英语这三个科目的总分,兼顾其他科目学业考试成绩等措施,如果男生的语文和英语成绩真的远低于女生,那么我们确实有理由担心上述措施可能会进一步扩大高考成绩的性别差异,加剧高等教育地性别公平性问题(邵志芳,庞维国,2016;王金娜,2016)。但是,作为衡量学业能力的最重大、最权威的一次考试,高考成绩真有这么大的性别差异,从而造成录取性别比逐年放大以至如此悬殊吗?这是本研究要回答的核心问题。
回答这一问题面临着一个重大困难,那就是我们不清楚各年份高考试卷能否相对稳定、清楚地反映学业能力的性别差异。由于学业性别差异远小于个别差异,所以,即使性别差异客观上存在,也未必每次考试都能将其体现出来;或者,即使各次考试都体现出性别差异,测出的性别差异量也可能很不一致。换言之,考查高考的性别差异时,我们面临着测量工具的“性差分辨力”问题:该工具能在多大程度上表现出被测特征的性别差异?测出的性别差异量是否稳定?在多维度、间接测量的情况下(例如,在对人类的学业能力、认知能力和人格测量过程中),性差分辨力及其稳定性问题显得尤为突出。根据Hide(2005)的元分析,对于同一种认知能力或人格特质的诸多性别差异研究,得出的性别差异量往往都是不同的,有的发现了显著差异,有的则认为无差异。换言之,测量工具可以比作被测量的性别差异的“放大镜”,这些“放大镜”的“放大倍数”(即性差分辨力)不尽相同。
在本研究中,我们对测量工具的性别差异分辨力的定义是:对于同质测试对象的某一可能具有性别差异的生理或心理特征,不同的测验测得的性别差异量的相对大小。同时,我们用性别差异t检验的效应量指标Cohen’s d作为性别差异量的指标(该指标被广泛用于元分析,在性别差异研究中,更是被作为性别差异量的指标)。对于单项研究而言,只要测试对象同质,我们即可设定:
性差分辨力= (特定测验的Cohen’s d) / (同类测验的最大Cohen’s d)
高考成绩的性别差异量,不仅取决于各年份考生的实际性别差异量,而且取决于各年份试卷内容不同所造成的“放大倍数”的差异。因此,本研究将依次探讨以下两个问题:
1.近年来高考试卷的性差分辨力是否基本稳定?
2.高考成绩的性别差异是不是导致高校女生比例逐年升高的首要原因?
要回答第一个问题,就要选择同一届的学生,将其随机分为多个同质性的样本,用不同年份的高考试卷加以测试,比较不同年份的试卷的性差分辨力。如果各年份试卷得到的性别差异量相同,说明它们的性差分辨力相等。当然,更可能的情况是,各年份试卷有不同的性差分辨力。由于已入学的大学生已经不能代表当年的全体考生,所以本研究的考生从将要参加高考的学生中抽取。
要回答第二个问题,就要考查在给定录取分数线的情况下,上述学生样本的录取性别比。这样就能看到,近年来高考录取的男女生占比的11个百分点的差异与考试成绩的性别差异有何种关系。
二、方法
理想状态下,应当测定尽可能多年份的高考试卷的性差分辨力。但是,由于参试者人数限制,我们无法对全部试卷进行检验,故选择了2005、2008、2011和2014年的语文、数学和英语高考试卷(全国卷甲卷)作为测验材料。本研究抽取的参试者,为即将参加2016年高考的上海、山东、浙江、湖南等省市的代表性高中的高二学生。包括上海市FX中学528人(男227/女301),湖南省CS实验中学486人(男224/女262),浙江省DY中学640人(男301/女339),山东省CL一中1658人(男833/女825人)。他们均已基本学完高中教学内容,即将进入复习迎考的高三阶段。
受高中课程时间安排上的限制,本研究中难以要求参试者按照高考的规定时长和环境要求完成全部三门科目的完整试卷,为此,我们把每份试卷都分割成2~3份分试卷,要求每位参试者完成1份分试卷。其中,每个年份的数学试卷被平均分为3份,故数学的分试卷共有12份。每个年份的语文试卷也分为3份分试卷(由前面的试题平分得到的2份平行分试卷,另加写作1份分试卷)。英语试卷的拆分方式是:2005和2014年的试卷剔除听力部分(因为其他年份无听力题)后,分别平分为2份分试卷;另外将2008和2011年的试卷分别平分为3份分试卷,故4个年份的英语试卷总共拆分成了10份分试卷。每份分试卷都规定在一节课内完成。
在本研究中,各科目参试者的最终人数分布情况是:数学1203人(男生593人),语文1184人(男生550人),英语925人(男生442人),总计3312人(男生1585人)。每位参试者随机得到一份分试卷,并按要求在规定时间内完成。
测试完毕后,课题组人员依据评分标准进行阅卷、计分。
三、结果
(一) 数据的有效性筛查
试卷回收后,剔除了部分无效试卷。这些无效试卷包括:未进行作答的试卷143份,未填写关键信息(性别)的试卷9份。最终获得有效试卷3160份。
(二) 各科目性差分辨力
本研究的测试对象理论上是同质的,故各科目各分试卷的性差分辨力可以直接比较。数学、语文、英语的分辨力等结果,分别如表 1、表 2和表 3所示。
从表 1可见,在数学学科,除了在2008-2和2014-3这两份分试卷上男生成绩低于女生(但未达到显著差异)外,在其余分试卷上,均为男生的成绩高于女生,但是多数分试卷的Cohen’s d值小于0.2。只有在2005-1这份分试卷上,男生成绩显著高于女生。2014-1这份分试卷上,性别差异接近但未达到显著水平。12份数学分试卷Cohen’s d最大值为0.47,以该值为分母,其余各分试卷Cohen’s d为分子,计算得到其余各分试卷性差分辨力介于0.04~0.79之间(负号表示女生得分高于男生)。由表 1中的分辨力值可见,2005和2014年的数学试卷对于性别差异的分辨力较高。
从表 2可见,在所有语文分试卷上,男生的成绩都低于女生,Cohen’s d值的绝对值最大超过0.7,但2008年和2014年的d值相对较小。性差分辨力指标亦显示2005和2011年的语文试卷对于性别差异的分辨力较高。
从表 3可见,在所有英语分试卷上,男生的成绩都低于女生。而且,d值的绝对值更大;2005年与2014年Cohen’s d值相对较小,但也超过0.3。这说明,在英语考试中,女生占绝对优势。性差分辨力指标也表明,2005、2008和2011年的英语试卷对于性别差异的分辨力都较高,其中2011年的分辨力最高。而且,Cohen’s d的最大值出现在英语试卷中,说明英语也是三门科目中性别差异量最大的。
(三) 特定分数线的上线人数
为了更好地解释高考录取中女生人数超过男生的情况,本研究分别以各分卷得分率0.5(卷面满分的1/2)、平均分、平均分±1个标准差(M + SD与M -SD)为分数线,统计上线参试者人数和性别比,结果如表 4所示。从表中可以看出,如果以一份分试卷的成绩作为依据“录取”参试者,无论分数线如何划定,各年度录取的女生都多于男生;且上线男女人数比值大多远低于参试学生的男女人数比值,仅2014年的结果接近该值。
四、讨论
(一) 近年来高考试卷的性差分辨力是否基本稳定
从各份试卷得分的性别差异检验分辨力可以看出,对于同一水平的参试者群体,不同年份的高考试卷对其性别差异的分辨力(或“放大倍数”)很不稳定。有的年份将其放得很大,例如,2011年的英语试卷,3份分试卷的性差分辨力分别为-0.89、-1、-0.91。有的则相对较小,例如,2014年的英语试卷,2份试卷的性差分辨力分别为-0.35、-0.38。概言之,性差分辨力在各年份间的波动幅度相当大。而且,t检验显示,数学考试中只有1份分试卷测得的性别差异达到显著水平,语文和英语达到显著水平的分别有3份和7份。
虽然性差分辨力很不稳定,但根据显著性检验结果,还是可以得到两个基本的结论:
(1) 高考成绩的性别差异客观上确实存在。否则,显著性检验产生的假阳性结果所占比例应低于设定的显著性水平(一般是5%),因而不可能这么多次检测出显著差异。
(2) 数学和语文高考成绩的性别差异并不很大,而英语成绩的性别差异程度比较显著。数学和语文的多数分试卷未能检测出显著意义上的性别差异。数学试卷的成绩t检验效应量Cohen’s d值都不大(小于0.2),这说明男生在数学上仅占微弱优势。语文成绩的Cohen’s d值相对较大,都是女生强于男生,但性别差异较大的分试卷仅有3份。性别差异量最大的是英语成绩。女生不仅所有英语分试卷成绩都高于男生,其Cohen’s d值比语文和数学更大,而且多数分试卷都表明性别差异达到了显著水平。不过,高考英语也有3份分试卷(尤其是2014年的2份)没有出现显著的性别差异。这说明,即使客观上存在性别差异,只要采用了性差分辨力低的试卷,性别差异也未必能够表现出来。
(二) 高考成绩的性别差异是不是导致高校女生比例逐年升高的首要原因
高考成绩的性别差异本身不大,这种差异用性差分辨力低的试卷(例如本研究中2014年的高考试卷)更是难以表现出来,因此可以说,高考成绩的性别差异不是导致高校女生比例高于男生的首要原因。而参试者性别比和两性总录取率,可能在其中起了更大的作用。
根据教育部(2016b)发布的2015年的数据,虽然全国高中教育阶段女生所占的比例未过半数(47.87%),但是,在高级中学中女生的比例却超过了男生,达到50.82%,即性别比(男/女)约为0.968:1。可见,当前作为高校学生主要来源的高中,女生人数已经超过了男生,即使高考试题对两性不偏不倚,录取人数也应该是女生居多。
本研究的参试者性别比(男/女)约为0.918 :1。根据表 4数据可知,在绝大多数情况下,女生录取数都多于男生。而且,即使是将分数线设置在低于平均分1个标准差(M -SD)这样一个较低水平,2005、2008和2011年度的上线性别比也都未超过0.8:1,远低于本研究的参试者性别比。这说明,当试卷的性差分辨力较高时,考试成绩的性别差异显著,从而可以在相当大程度上拉开两性的上线比例。但是,本研究得到的一个更为重要的研究结果是,2014年的试卷对男女生做到了基本平衡,其(M -SD)分数线对应的录取性别比(0.90:1)几乎等于参试者性别比。这说明,当试卷的性差分辨力较低时,录取性别比基本上就取决于参试者性别比。而事实上,2014年高考的性差分辨力虽然最低,录取性别比仍达到45:55(或0.82:1)。因此,考试成绩的性别差异不是录取性别比失衡的首要原因,甚至不是其重要原因。就本研究得到的数据而言,在高考这一环节,参试者性别比的变化才是首要原因。
本研究的参试者性别比(男/女)约为0.918:1,比教育部发布的全国高中生性别比更低。如果这是全国高中的普遍趋势,那就预示着,未来参加高考的女生比例很可能继续增加。这与部分学者(马宇航,杨东平,2016)的预测不谋而合:随着我国经济的进一步发展,高校学生男女人数的差距还会继续扩大。
我国高等教育的发展和普及产生的另一个直接结果,就是高考的录取率也在逐年提高,这意味着录取分数线也在相对地逐年降低。根据统计学的原理,在正态分布的情况下,若两个群体的平均分相等但标准差不等,如果分数线高于平均数,则标准差较大的群体的录取比例将高于标准差较小的群体;如果分数线低于平均数,则标准差较小的群体的录取比例将反超标准差较大的群体。
从本研究得到的数据看,男生成绩的标准差普遍大于女生,在34份分试卷中,男生标准差大于女生的有24份。如果在低录取率的年代,单是男生考分的标准差较大这一因素,就可以导致高校男生多女生少的局面。而现在,许多省份的录取率都已超过50%,高校集中的省份的总录取率甚至达到了80%左右。因此,考分标准差较小的女生,得到更多的录取机会也就顺理成章了。
(三) 建议
高考成绩性别差异的原因,根本上源于两性认知能力倾向的差异。男性长于空间认知、女生长于言语交流,这早已是心理学界的共识(Strand, Deary, & Smith, 2006; Voyer & Voyer, 2014)。女生自我约束能力强于男生,则是其学业成绩好于男生的重要人格因素(Renato,2016)。既然认知能力倾向影响了学习成绩,客观地予以反映,以供高校录取时参考,这无论从教育公平还是考试的科学性角度来说,都是合理的。而且,这样也更有利于男女生正视自己的性别特质,相互取长补短。
另外,从试题来看,即使是性差分辨力较高的试卷,也不是在每道试题上都能发现性别差异。命题时很难控制试题有利于哪一方。
综上所述,我们不主张在高考环节急于采取措施平衡两性录取比例。在基础教育阶段根据男女生的特点,因材施教,平衡高中阶段男女生比例,才可能从根本上解决教育中的性别公平或平衡问题。
五、结论
在本研究条件下,可以得出如下结论:(1)各年份试卷对同质参试者有不同的分辨力,显示出其对学业成绩性别差异的分辨力不稳定;(2)高考成绩的性别差异确实存在,但总体差距不大;(3)高校录取女生比例逐年升高的首要原因是参试者性别比的变化。
参考文献
教育部. (2016a). 高等教育普通本、专科学生数(Number of Regular Students Enrolled in Normal and Short-cycle Courses in Higher Education, 2015年度). http://www.moe.gov.cn/s78/A03/moe_560/jytjsj_2015/2015_gd/201610/t20161011_284357.html
教育部. (2016b). 各级各类学校女学生数(Number of Female Students of Schools by Type and Level, 2015年度). http://www.moe.gov.cn/s78/A03/moe_560/jytjsj_2015/2015_qg/201610/t20161012_284506.html
雷新勇. (2007). 上海高考英语分数的性别差异及其原因. 上海教育科研, 06, 43-46.
李金波, 杨军. (2014). 高考学科表现的性别差异分析. 教育与考试, (6), 5-10.
李文道, 孙云晓. (2012). 我国男生"学业落后"的现状、成因与思考. 教育研究, 09(38), 43.
马宇航, 杨东平. (2016). 高等教育女性化的国际比较研究. 江苏高教, 189, 7-11.
邵志芳, 庞维国. (2016). 高考成绩性别差异研究的回顾与展望. 华东师范大学学报(教育科学版), 34, 69-75+118.
王金娜. (2016). 高考统考科目的"文科偏向"与隐性教育不公平—基于场域-文化资本的视角. .教育发展研究, (20), 8-14.
曾满超, Mun Tsang. (2012). 中国高考成绩的性别差异(英文). 北京论坛(2012)文明的和谐与共同繁荣—教育分论坛论文及摘要集. 北京大学、北京市教育委员会、韩国高等教育财团: 2012: 42
Hyde J. S.. (2005). The Gender Similarities Hypothesis. American Psychologist, 60, 581-592. DOI:10.1037/0003-066X.60.6.581
Renato G. G. C.. (2016). Gender differences in academic achievement:The mediating role of personality. Personality and Individual Differences, 94, 54-58. DOI:10.1016/j.paid.2016.01.011
Strand S., Deary I. J., Smith P.. (2006). Sex differences in cognitive abilities test scores:A UK national picture. British Journal of Educational Psychology, 76, 463-480. DOI:10.1348/000709905X50906
Voyer D., Voyer S. D.. (2014). Gender differences in scholastic achievement:A meta-analysis. Psychological Bulletin, 140, 1174-1204. DOI:10.1037/a0036620
特稿
华东师范大学出版社
天猫旗舰店 微信微店
点击「阅读原文」访问华东师范大学学报教育科学版官网