SAT考题重复,你为何慌张呢?
2018年8月25日北美SAT考题分别沿用去年10月的亚太试卷和3月的北美试卷,引发了中美两国SAT考生的广泛关注甚至焦虑,美国甚至有考生家庭发起白宫情愿,要求取消本次SAT考试成绩。
今天,王鹤群博士撰文对此进行了详细的分析,我们认为本文也是迄今为止对SAT试题重复事件最专业的解读。王博士的研究方向系标准化考试测试,她在该专业全美排名第一的密歇根州立大学获得哲学博士学位后,一直从事托福、SAT等标准化考试的教学实践,是目前留美语培市场上最专业的标化导师。本文首发于王博士个人公众号留学生活,本号经王博士授权转载。
引子
“来来来,中元节啊,我给你讲一个鬼故事。”
“啥?”
“就是啊,一个秀才去赶考,结果进入考场一看,这试卷上的题目,自己曾经在梦中都做过啊!”
“哇!他一定金榜题名了呀!”
“嗯,走出考场的他啊,怕试卷被取消,现在正坐在家里发愁呢。”
“这个鬼故事一点都不恐怖。我再给你补充一个吧。从现在开始,再过500年,会有一次大考正好适逢中元节。当时,很多人腾云驾雾奔向与中原日月颠倒的地方,都会重新考一套旧试题。你想想那个规模,那个场景,恐怖吧?”
“哇!哇!哇!我不知道该说啥好啦!”
“所以说啊,中元节的时候啊,不能讲鬼故事……”
说书人眉头一皱,500年之后的中元节就到来了……
前情回顾
8月25日的北美SAT考试,适逢中国的传统节日“中元节”,就是俗称的“鬼节”。果不其然,这个诡异的日子果然有鬼,一大早我被手机闹醒,就看到几个参加考试的学生发来的信息:这次考试的题目是2017年10月的亚太题目!天啊!题目重合了!早上起来之后,这个新闻逐渐发酵起来,我才知道,美国一部分地区的重复题目是2017年10月份的亚太试卷,另外一部分地区的重复题目是另外一套之前考过的试卷。总之,考题重复了。于是,一些学生去白宫的网站上请愿,说考题缺乏公正性,而另外一些学生抱怨说:是不是要重新考?感觉这次考试如果重新考,会打乱申请的步骤。
(一些学生去白宫情愿,希望能够取消这次考试)
其实,这次考试之前就暴露出一些“八字不合”的音符,比方说,考试之前两天紧急通知:因为极端天气而关闭35个考场,导致一些本来已经飞赴美国的学生无法参加考试。而其他可以参加考试的同学无不感觉自己的幸运,这份幸运感一直持续到他们拿到考卷的那一刻,戛然而止。
(部分被关闭考场的信息)
可是,你为什么会慌张呢?
现在,很多参加考试的考生和国内正在备考的考生,无不被一种慌张、急迫、震惊、忐忑所裹挟。与其熙熙攘攘的焦虑下去,不如静下心来,好好分析一下自己的水平、状态,以及我们所面临的局势。
那么,我们就从第一个问题上开始分析:遇到熟悉的试题,你为什么会慌张呢?
原因一:并没有把试题的答案都背诵下来。
这个原因,原本起于人们的贪念。总是希望自己得到最高分甚至是满分,总是希望自己的分数是全世界拔头筹的,从而让自己进入全世界最顶尖的大学。因此,当看到旧试题的时候,就开始懊悔自己“为什么没有记住答案呢?”这种悔恨之情如百爪挠心,让人分外难受。
破解之法:
歇歇吧!正常人,没有经历过特殊的训练,是不能把见过的试题的答案都背诵下来的。即使是昨天刚刚做过的题目,照样记不住ABCD等答案。所以,这种奢望,本身就不靠谱,因此也不必奢望。试题答案并不像乐谱,没有规律可循,因此全凭机械记忆,这是所有记忆中最枯燥的一种,也很伤脑。与其希望自己记住答案,不如希望自己掌握学习的本领,遇到问题就可以解决,而非将自己的人生寄托在ABCBC, DDACB等诸如此类的字母机械背诵上。
原因二:并没有把试题全都分析清楚,学习明白。
这才是这次考试给我们最大的警示和教育意义。与美国的考生相比,中国的考生大多可以在培训学校里面做到以往的试题。但是每一位考生应该扪心自问:自己认真了吗?所有错误的题目都搞明白了吗?
事实上,试题是一个具有代表性的指标。每一道错误的题目,都代表着与这道题目相关的知识没有明确的掌握。
比方说:
这道题目如果看不出来答案是C,就是对于长句的并列结构还没有充分掌握。
在这个长句中,主句是… murals… appeared during this period. 其中,对于主语murals有两个修饰部分。第一个修饰部分是前面的形容词部分Hundreds of large, colorful new, 另外一个修饰部分是后面的现在分词短语depictingelements of Mexican and American life and history.用现在分词短语替代更为累赘冗余的定语从句,是当代美国学术英语的一大特征。但是,把这句话的主句都看完了,对于我们回答问题仍然于事无补,因为所考察的并列结构出现在之后的补充成分上:some in A but many more in B, on C, or on D such as (e). 这个结构中,ABCD是并列的四个部分,而(e)是用来修饰D的附属成分。具体来说,designatedcultural locations, abandonedlots, unused buildings, infrastructure是并列的成分,而highwaysand bridges是用来修饰infrastructure的附属成分。前面四个并列的成分是以介词短语的形式并列的,因此答案必须要体现出介词短语的特征,答案为C。
以上的例子是一道语法题目,而涉及到阅读,一些考生遇到的问题更多。
目前,一定比例的培训学校和培训老师在阅读的教学中强调技巧,即:让学生在有限时间之内一定要尽量多做对,即使自己不会,也要做对题目。这样的逻辑,难道不荒谬吗?为什么要指望着不会的内容也要做对,而不指望着提高自己的英语水平和实力,让自己可以踏踏实实的学懂呢?
在这样的一个误导形式的教学的影响下,有一部分学生文章都没有看懂或者看完,就去原文中跳着寻找答案,还美其名曰“跳读”。殊不知这样的做法让他们不能对文章的整体脉络、布局谋篇等有一个整体而连贯的把握。其结果就是:对文章没有透彻理解,因此更加谈不上对于题目有透彻的理解,自然而然就不能保证答对题目了。
破解之法:
路漫漫其修远兮,吾将上下而求索。在学习的过程中,考生应该将目光放长远,毕竟我们并不是只要应对一场考试。相反,我们是要通过这场考试的门槛,在美国的大学读书、深造、学知识、学本领。因此,这种相关的英语实力是一定要掌握的,越早掌握就越利于以后的学习。
考生应该把每一道错题作为一个提高自己英语水平的契机,不断钻研,不断进步。
原因三:认为自己错过了进入藤校的“爬藤”的机会,从而无限懊悔。
“金榜题名”从而“衣锦还乡”是我们中国人的传统理念和学术追求,因此很多学生和家长希望通过最高的分数进入最好的大学,这种观点也值得理解。但是,寄希望于通过提前准备好考试内容而让自己获得高分甚至是满分,从而可以进入美国最好的大学的这种想法,不仅不切实际,而且对学生有害。
首先,这种想法是不切实际的,因为美国的大学申请并不是完全由考试分数决定的。学生在校成绩GPA,大型标准化测试成绩SAT,ACT,托福等都只能代表一部分的学术成就,且不要说前30的名校还要考生有SAT Subject的成绩,AP,IB的成绩,学术竞赛获奖的证书等等。除此之外,名校还需要学生有丰富多彩的课余互动并且在这个方向上可以取得一定的成就。这个方面才是很多的高材生奋力比拼的方面,有的学生上大学之前就已经设计了几款app,有的学生已经作为导演执导并且参演了一些影片、纪录片,可谓八仙过海、各显神通。
相较于这种情况,懊悔于一次考试机会的错过就非常不值得了。请记住一点:对于中国考生而言,SAT满分与SAT1450分对于申请藤校而言,几乎没有差别。因此,请不要在一次考试的成绩上患得患失。
其次,寄希望于得到“超水平发挥”的成绩而进入名校,这种想法事实上对于学生是有害处的。在名校里,全世界的优等生共同竞技,可谓是“万类霜天竞自由”。学生们都是高智商的人才,精力充沛、生机勃勃、而且学术底功非常深厚,学习能力也超乎于常人。如果某个考生侥幸进入,那么无异于将自己陷入一场从头输到底的竞争之中。每天的阅读量根本跟不上,对于阅读文章的精髓也无法掌握。这种痛苦,天长日久,会引发抑郁甚至更严重的心理问题。这几年华裔留学生在美国名校自杀的惨痛案件不胜枚举,希望广大学生和家长可以真正的引以为戒。
破解之法:
面对现实,脚踏实地,踏踏实实的学习,认认真真的申请到适合自己的大学,自己喜爱的并且有前景的专业,就已经是人生赢家了。
美国大学委员会College Board的决定
就在昨天早上,美国大学委员会(College Board)针对题目泄露一事做出决定:不会大面积取消考试,而是会采取qualitycontrol(质量控制)和equating等方式,对于一些考生的成绩做出取消决定。
(美国大学委员会的决定)
那么,什么是对于考试的quality control呢?如何判断一个学生的分数应该被取消呢?这里涉及到的是测试学里面的专业知识。
一般而言,我们假定一个考生的答题行为是理性的(rational),那么他做对容易题的概率就比做对难题的概率要大。每一道试题都有一个难度系数,因此,如果一个考生把简单的题目都做错了,而难题却做对很多,则视为该学生的回答不具有理性特征,因此可以进一步怀疑该考生抄袭或者有其他作弊行为。
那么事实上,考生对于不同难度级别的题目是怎么样认识的呢?
对于好学生而言,他们的答题方式是非常理性的。简单题目做对很多,即使错误也是因为马虎或者疲惫、分神等原因。而对于难题,其正确率就会随着题目难度上升而下降,呈现出一个清晰的负相关的关系。
(这是一个负相关关系的图形,以作参考)
而对于学习基础薄弱、不能胜任考试题目的学生而言,他们的回答是混乱而无序的。因为大多数题目都不会做,他们对于很大一个范围的题目的回答都是呈现“random guessing”随机猜测的特征。无论题目的难度系数如何,其答对可能性都在30-35%左右徘徊。
(这是一个没有明确相关关系的图形,以作参考)
因此,ETS只需要在考试模型中设定几处数据监测,就可以把非理性答题者挑选出来。这些人的分数可能会被推迟甚至会被取消。
事实上,这样的quality control对于设计和监管SAT的ETS机构而言,并不鲜见。早在2000年GRE考试刚刚出现机考的时候,就出现了一些考生狂背“机经”而让自己得到名不符实的高分数。而ETS发现了这一点,就通过quality control果断的取消了这样的考生的分数。当年,一位中国的博士在读生要考美国的GRE考试,他首考的分数是1900多(2400满分,1900+已经可以保证得到录取,但是2200+才能得到全等奖学金),但是他通过背诵机考经验,又参加了第二次考试,结果准备的题目全部押中。等了一个月,等到了ETS取消他的考试成绩的通知。很显然,ETS掌握了足够的数据证据,能够有底气的说,他的成绩不是真实实力所得。
那么,什么又是equating呢?这是考试中心必须要进行的常规运算之一。每年多次SAT考试,这些考试又用不同的试题,不同的试卷。那么,如何把考过不同试卷的人的能力在同一个数轴上表示出来呢?这就用到了equating。同样,有的学生考SAT,有的学生考ACT,如何衡量他们的学术实力呢?还是要用到equating. 对于equating的运用,大家本来不要紧张,因为反正每次考试之后,ETS都要做equating的。但是,这次因为考题泄露,equating的做法就会非同寻常,一旦简单题目做错,考生的分数会有惩罚性的下降。这种可能性,已经被ETS公布出来了,请见下图:
总结
不管现在考生的心情如何,尘埃落定后,该浮出水面的迟早要浮出水面。与其焦急的等待分数,不如认真分析一下自己的实力:有哪些优势和进步,有哪些欠缺需要迎头赶上。生命中,将每一种经历都当成让自己成长的动力,才能更好的进步和提高自己。
相关阅读:
作者:王鹤群,系密歇根州立大学哲学博士,研究方向为标准化考试测试,王博士也是托福、SAT、GRE等标准化考试的全科辅导老师。原载:留学生活,本文经授权转载,版权归属作者/原载媒体。
喜欢本文?欢迎点赞/转发/关注/加入留学家长公益交流社群: