查看原文
其他

一花一世界,词表有乾坤丨《现代汉语常用词表》(第2版)正式出版

汉语中心 商务印书馆汉语中心 2022-05-19
点击上方蓝字可以订阅哦!


这是一部收录现代汉语中最常用的56 790个词语并为这些词语“排座次”的词表类工具书,可广泛应用于语文教材、汉语分级读物和语文词典的编写、汉语词汇教学、中文信息处理等领域。


继2008年我馆推出由教育部语言文字信息管理司组编的《现代汉语常用词表(草案)》后,其修订版《现代汉语常用词表》(第2版)目前正式出版。

《现代汉语常用词表》(第2版)是一部收录现当代社会生活中比较稳定的、使用频率较高的56 790个汉语普通话词语的词表类工具书。正表按词语的使用频度排序,每个词语标有频序号;表后附有音序索引,提供词语的拼音和频序号。收录的词语以单音词和双音词为主,也收录一些常用的缩略语、成语、惯用语等熟语,以及表达整体概念的其他固定短语。修订工作自2015年启动,仍然遵循“通用”“常用”“语文性”原则,在原版基础上删除了220余条已不太常用的词语,增收了1050条新词语和漏收词语,修订某些不合规范、不准确或不统一的词形、读音,对儿化词、轻声词进行了完善,并重新排定了词语的频序号。

这是一本看似枯燥乏味但很有“内涵”的书,读起来很有趣味。捧着“新鲜出炉”的样书,编辑随手翻读,仅仅读罢两页,就有了许多有意思的发现。比如,

根据频度排序观察词语

代词里,最常用的单数形式不是“我”(16)(此处括注的阿拉伯数字是频序号,下同),而是“他”(11);最常用的复数形式却是“我们”(20),不是“他们”(31);


表示指称的人称代词的使用频次由高到低分别为:他→我→我们→他们→她→你→它;


最常用的量词:个(8);


最常用的连词:但(37);


最常用的三个国名:中国(44)、日本(173)、美国(213);

最常用的两个城市名:北京(141)、上海(251);


最常用的十个形容词:大(19)、多(21)、新(51)、高(76)、许多(109)、重要(129)、老(132)、全(159)、美(193)、快(210);


最常用的十个复音词:我们(20)、他们(31)、没有(34)、自己(42)、中国(44)、可以(60)、问题(64)、工作(66)、这个(70)、生活(71)、这样(73);


最常用的十个单音词:的(1)、是(2)、在(3)、一(4)、不(5)、有(6)、这(7)、个(8)、上(9)、也(10)。

……

怎么样?这样读,还挺有意思的吧?更多有趣的发现,等着您来探索。

本书的其他多种用途

想知道某个词常用不常用,频序是多少,可以利用附录“音序索引”,即查即用。


再比如,要编写中小学语文教材,或者对外汉语教材,拿不准应该先教哪个,后教哪个,查一下词表,就清楚了。


汉语分级读物和语文词典的编写,也同样可以利用词表。假如要编写一部适用于中小学生的三万词以内的词典,只要选取频序号小于30000的词语就可以大致完成选词任务,当然,必要的人工干预仍是不可或缺的。


针对不同规模和读者对象的语文词典,在编写工作开始前,也可参考词表提取出用于定义词语的释义元语言,从而使释义更易于被读者理解。


即使是对于一般的写作者,本词表也有很大用处。通过查询本词表,便可知道一组同义词里,哪个更为常用、更通俗,哪个用得较少、更高级,然后根据文风和写作意图来选择用词。比如,在表达“惊讶”这个意思时,可用的词还有“惊愕、惊诧、惊异”,“惊讶、惊异、惊愕、惊诧”这一组词按使用频度由高到低排列为:惊讶(4806)、惊异(8836)、惊愕(13659)、惊诧(13667),这就意味着“惊讶”最常用,“惊愕”和“惊诧”较不常用。如果追求写作的平实、通俗,就用“惊讶”,如果追求用词的新奇和独特,就用“惊愕”和“惊诧”。

以上,只从编辑的角度,带您了解一下本词表的内容和用途,有兴趣的读者,可以参阅本书样张,下面刊出“《现代汉语常用词表》(第2版)修订报告”,以便您了解这次修订的一些情况。



《现代汉语常用词表》(第2版)

修订报告

一、修订缘由

《现代汉语常用词表(草案)》的研制工作启动于1998年,完成于2007年,历时10年。2008年正式出版后又过去了近14年。原词表本身存有若干不足,如常用词漏收失收;词表的词语来源于词典的词目,对现实语言生活的用词用语反映不够及时;在关注词的同时对常用语反映还不足。特别是这段时间我国政治经济社会发展很快,语言特别是词汇使用上有了很大的发展变化,语言研究与规范工作也取得不少新的成果。为了使“词表”能真实反映语言实况,进一步完善,更好地在服务于社会,国家语委在2015年启动了“词表”的修订工作,设立了“《现代汉语常用词表》修订”的研究项目。修订工作仍由原研制单位《现代汉语规范词典》编写组与厦门大学国家语言资源监测与研究教育教材中心负责,具体由李行健、苏新春主持。


二、修订原则

修订工作主要对原词表进行了“增、删、改”三项工作。增补随语言发展而新产生或趋于稳定下来的通用词语,包括为原版明显漏收的词语;删除已经不太使用的冷僻、罕用、陈旧或语用、表意不适宜的词语;更改、替换、修订某些不合规范、不准确或不统一的词形、读音、标示。并重新排定了表内所有词语的频序号。

修订工作仍遵循原词表收录常用词的原则,主要考虑词语的“通用”“常用”“语文性”的特性,以实际社会生活的语用状况为主要依据对象。对一些带有明显口语化、地域性、尚未完全稳定的词语不收或慎收。对要做出增删变更和调整的词语都要求做到提供变更依据与调查数据,在统计的基础上进行了人工干预。对新增词的频序号在语料抽样统计的基础上来确定其频序位置。在“词表”原有收词不大动的前提下适度增减,增删词语的原则与原词表收词的宽严松紧标准大体一致。在注意吸收各种词典的定形、注音、释义材料和其他研究成果时,也根据词表不同于词典的性质、功能与形式的要求与限制,做出有针对性的取舍。修订工作的主要目的是使词表更加贴近当代语言实际,完善内容和体例,以满足各方对词表使用的需求。


三、修订过程

修订工作大致经过以下三个阶段:

第一阶段为2015年下半年至2017年初。课题组经讨论后确定了修订原则与工作步骤,依据新研制的语料库提取常用词表,并与原《词表》词语进行比对甄别筛选,对拟增收、删除或修订的词语进行逐条审查,并附上调查数据,形成新的词表后再做专项检查。2017年5月19日项目结题专家审定会在教育部语言文字应用研究所举行,专家组成员有傅永和(组长)、张世平、孙茂松、谢仁友、盛玉麒、余桂林等先生。专家组经认真审读认为:“课题组制定的修订原则正确可行。在保持原词表总体格局下,增加当代语言生活中的常用词语,删除已不常用的词语,调整不合现行规范或语用实际的注音和词形。修订后的《词表》更符合语文规范化的原则,更能在实际中发挥规范引导作用。”“课题组采用的机器统计和人工干预相结合的方法科学可行。通过扩大语料库、词语的频率和分布统计,词语的频级排序及数据的相互参照比较等手段使修订结果更为准确可靠,更好地反映了现代汉语常用词语的面貌。”同时,也对儿化词、轻声词、字母词、新词的收录等问题提出了进一步完善的建议。

第二阶段,2017年中至2018年。主要是对专家组提出的意见进行专项调查,对同类现象及相邻问题做出处理。决定只收录确有区别意义的轻声词、儿化词。对原表中儿化与非儿化并列的,删儿化词。一般不收入字母词,待条件成熟后再行收录。增补重点放在已经稳定的新词上。定稿后将修订结果向专家组报告,于2018年7月向出版社报送稿件。

第三阶段,2020年7月至9月。在稿件进入编辑加工程序后做了进一步大规模校订,并根据词目之间比对及新的词汇使用状况再次做了增删调整。

修订原则的拟定及修订过程中遇到重要问题由李行健和苏新春共同商量,李先生定夺,苏新春负责具体修订工作。第一阶段的修订由北京课题组和厦门课题组共同完成,第二、三阶段的修订工作主要由厦门课题组完成。参加修订工作的人员主要有李行健、苏新春、朱振平、严小香、龙东华、银晴、赵树元、周飞、张远洋等。


四、修订内容


(一)

增收词语1050条左右

主要有:新产生的政治经济社会事物及思想观念习俗认识方面的新词,如:保障房、充电宝、充电桩、大卖场、大数据、电商、动车、二维码、非遗、富二代、高铁、公众号、官媒、广场舞、闺蜜、海归、冷链、裸官、农民工、暖男、潜规则、区块链、实体店、网店、微信、无人机、线上、线下、心灵鸡汤、新冠肺炎、颜值、一带一路、院线、愿景、宅男、支付宝、抓手、自贸区、自媒体。

新产生的行为习俗方面的新词,如:白菜价、摆拍、暴走、爆表、爆料、备胎、蹭饭、炒房、充值、错峰、点赞、反腐、防控、给力、疾控、家暴、拉动、零容忍、留置、裸捐、裸退、秒杀、民调、碰瓷、拼车、闪婚、失联、双开、套现、偷窥、脱岗、网购、网恋、微博、显摆、引领、云计算、追逃、追星、追责、醉驾。

漏收的常用词语,如:挨家挨户、爱巢、爱侣、安家费、安家落户、暗渠、熬冬、奥林匹克、半工半读、半晌、榜单、博弈、断码、风流人物、高尔夫、环比、减仓、路肩、裸照、天下为公、慰安妇、物竞天择、雾霾、下单、杏坛、堰塞湖、硬笔。


(二)

删除词语220余条

组合性强的搭配性词语,如:本市、本校、此人、单另、换发球、蓝牙技术、六月、区政府、赛似、市政府、县政府、小公共、新课、饮牲口、臧否人物、最快。

少用罕用的旧词,如:捣腾、富强粉、黄历、藐小、六六六、三青团、食品街、通匪、五七干校、正经(指传统经书义)、执政府、字盘。

不再常用的新词语,如:审评、系列剧、秀拔、准高速。

不能独立成词并较少用的单音语素,如:洑、蒿、泓、劐、攉、匡、诓、努、劁、鞣、祥、澡、搌。


(三)

修改拼音

“德行”原收déxínɡ、déxinɡ两个音项;现删去déxinɡ。

“绷”原收bēnɡ、bènɡ音项;现增收běnɡ音项(绷脸)。

“拧”原收nínɡ、nǐnɡ音项;现增收nìnɡ音项(倔强)。

“宿”原收sù、xiù音项;现增收xiǔ音项(量词,一夜)。


(四)

修改词形

如:“下工夫”改为“下功夫”,已经不太使用的异形词,“核实验”改为“核试验”。


(五)

重新排序

对新增词语做小规模抽样语料的调查,编入总词表后再重新确定总频序号。


五、使用的语料

所利用的材料除了研制《现代汉语常用词表(草案)》所用语料外,还增加了以下几种:

1.《中国语言生活状况报告》2005—2019年间的词语表,每年词语约200万条。它们来自同年的国家语言资源语料库,共约150亿字。

2.《现代汉语词典》第5、6、7版,《现代汉语规范词典》第2、3版,以及其他多种语文词典的收词。

3.《现代汉语分类词典》8万条语文词,及《现代汉语分类词典》(修订稿)的10万条语文词。

4.《义务教育学习词表(草案)》15 114条。

5.汉语国际教育用等级词表(9 631条词)。

6.厦门大学中小学教材语料库(约1 500万字)。


六、《现代汉语常用词表》(第2版)概况

《现代汉语常用词表》(第2版)共收词56 790个。包括单音节词3 149个,双音节词40 924个,三音节词6 583个,四音节词5 966个,五音节以及五音节以上词语168个。


《现代汉语常用词表》(第2版)修订组

执笔人    苏新春

(厦门大学嘉庚学院、厦门大学国家语言资源监测与研究教育教材中心)

2021年5月27日



图书信息

《现代汉语常用词表》(第2版)

李行健    苏新春    主编

识别二维码,即可购买



样张欣赏

此图为词表的主体(按频序排列)

此图为附录部分(按音序排列,可以查到每一个词的频序)



目    录

《现代汉语常用词表》(第 2 版)说明

现代汉语常用词表(第 2 版) 

附录

    《现代汉语常用词表》(第 2 版)音序索引

    《现代汉语常用词表(草案)》研制报告

    《现代汉语常用词表》(第 2 版)修订报告



作者简介

  李行健,男,1935年生于四川遂宁,教育部语言文字应用研究所研究员、中国社会科学院研究生院教授,曾任语文出版社社长兼总编辑、国家语委委员,现任国家语委咨询委员会委员、北京语言大学兼职教授、中国语文报刊协会会长、中国辞书学会顾问等。

  苏新春,厦门大学中文系教授、博士生导师,国家语言资源监测与研究教育教材中心主任、两岸语言应用与叙事文化研究中心主任。主要从事汉语词汇理论、词汇与文化、词汇计量、辞书语言、教育教材语言等方面的研究。已出版的著作有《汉语词义学》《文化的结晶——词义》《汉字语言功能论》《当代中国词汇学》《汉字文化引论》《词义文化的钩沉探赜》《汉语词汇计量研究》《现代汉语分类词典》《义务教育常用词表(草案)》等。




往期回顾

为国际中文教育专业研究生打造的专著型教材——《汉语教学理论探索》

今晚7点,直播间见 | 字词典特惠活动来啦!

今晚7点,工具书直播精彩继续 | 用字词典提升自主学习能力

开学季到了,怎么给孩子选字典?

华语教学语法的典范之作——《华语教学语法》(修订本)出版

学生阅读百宝箱 教师教学好帮手丨《〈乡土中国〉整本书阅读与研讨》给您答疑解惑

从三个角度切入,带你整本书阅读《乡土中国》|《〈乡土中国〉整本书阅读与研讨》导读(一)

征集函 |《中国语言生活状况报告(2022)》选题征集

田立新:以史为鉴开创未来 推动中华优秀语言文化传承发展

论文缺乏理论支撑?一本书教你秒懂


点击“阅读原文”可购买此书

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存