我们分析了近千篇录取文书,发现了这些词用得最多
早申请结果都已经放得七七八八了,申请季也到了高潮时刻,相信大家都在争分夺秒地拼文书,希望用洋洋洒洒的数百字再为自己的申请添上浓墨重彩的一笔。
而这头,主页菌也没闲着,借助小工具分析了过往几年近千篇录取文书,得到了一些有趣的发现,来跟大家分享分享。
敲代码的过程菌菌在这里就略过不表了,这次菌菌数据里面包含795篇录取文书,时间跨度从从2016年至2019年,其中不仅包含了Personal Statement,也包含了诸如Why School、Why Major这样的Supplements。在分析过程中,菌菌放弃了出现频率非常高的如on、in之类的介词,a、an之类的冠词,以及I、you之类的代词,只统计了名词和形容词,然后我们就发现了一些有趣的数据……
名词篇
首先我们来说名词,其中出现最多的词是school,一共出现了996次,按照我们795篇文书算的话,平均每篇要出现1.25次,接下来出现900次以上的词还有world和time,也不得不说心怀世界和时间对于每一个申请者都是重要且必须的。
除了出现最高的3个词之外,平均每篇几乎都会有的词还有students、community和life。知识类的词语如research、knowledge和education分别出现了636次、458次和331次。
学科类出现最多的是art,出现了559次,紧随其后的是music、history、science和design。情感类词语出现比较多的词是hope、love和passion,分别出现了448次、383次和304次。
另外对于家庭、文化、人类、机会出场频率也极高,似乎大家对于未来也十分憧憬,从301次出场的future就可见一斑。
剩余出现频次最高的前100个名词如上,我们会发现其中有中国学生选的非常多的学科,比如出现255次的心理学psychology,172次的哲学philosophy,170 & 164次的数学math & mathematics,167次的商业business和164次的经济economics。
另外对于社会、自然、城市、环境,资源、食物等社会相关的词语出现的频率都非常高。个人认知出现的频次也较高,比如mind、sense、identity。
比较有趣的当然还有college和university出现次数的对比,分别为486次和234次,几乎college是university的两倍还要多。另外,虽然parents出现次数比较多,但分开来我们会发现mother和women出现的次数远多于father,因为无论是father还是men甚至都没上榜。
形容词篇
关于形容词,让菌菌出乎意料的是,排名最高的形容词居然是social和different,果然大家都不想给招生官一个stereotype书呆子的形象,拼命的在展现自己社会性和与众不同的一面。而作为中国学生,Chinese和international出现频次高(分别为555次和301次)也是情理之中意料之内。总的来说,通过形容词我们都可以看到一个个带着中国文化、拥有国际化视野又与众不同的申请形象浮现眼前。
剩余出现比较高的词如academic、cultural、personal都很顺理成章,但real出现了200次却是主页菌没想到的,也可能是招生官们还对中国申请者材料真实性存疑才会让大家纷纷用real来体现真实吧,当然这是主页菌瞎猜的。
接下来出现100-200词的形容词有学科方面的political、environmental、interdisciplinary、historical和economic,这一点也意外的和上方名词中总结的出现较频繁的学术类词语相重合。
也还有如strong、intellectual、practical来体现申请者个人特色的词。有趣的还有old和young这一对反义词携手出现,不禁有一种新旧交替感。
剩余出现的频次多的形容词中,有一如既往高频出现的学科类的,比如liberial、mathematical、philosophical,也有种族相关的形容词,比如american、african和asian。
另外诸如creative、independent、curious、professional、rigorous、powerful、innovative等突显个人特点的形容词也非常高频。
比较好笑的如northwestern,这个词一看就是西北大学,但作为西北这个形容词出现了高达54次显得十分不正常,更多的应该还是以西北大学出现。
另外还有让主页菌比较惊讶的是sexual也出现了58次之多。
反正看完了这些形容词,相信卡壳文书词语枯竭的你,可能又多了一些形容自己的好词吧!
Why School篇
最后,主页菌针对why school这一个单独的supplement进行了词频统计,共统计了55篇从2016年至2018年的why school文章的名词和形容词的前10名,来看看大家到底说了学校的什么,以及是如何说的。
其中出现最多的名词自然是大家都会提及的社区community,毕竟美国大学甚至全美国都是非常之在乎这个概念的。而剩下2名均和之前的名词统计结果是一致的,分别为school和world。接下来大家还提及了research、program和opportunities,基本上都是讲学校点的无疑了。
形容词方面,前三甲均和总词频重合,分别为social、different和Chinese,而后面的基本也和整体形容词统计高频词相一致。
所以,分析了一通,文书该写什么,该用什么词,现在你们知道了嘛?