"汉语助研"操作指南与案例七:分布分析
一、
术语与方法说明
“汉语助研”的分布模块,主要分析某教材或某语料的汉字或词语在汉字或词汇等级大纲中的分布情况,以探讨教材或语料的难易度, 大致判断该教材中的课文是否适合既定水平的学习者。
选择分布计算的大纲可多选,包括:
旧版 HSK 大纲:《等级大纲》,国家汉语水平考试委员会办公室考试中心, 2001,经济科学出版社。
等级划分:《汉语国际教育用音节汉字词汇等级划分》,中国国家对外汉语教学领导小组办公室,2010,北京语言大学出版社。
新版 HSK 大纲:《新汉语水平考试大纲》,孔子学院总部 / 国家汉办,2009, 商务印书馆。
新版 HSK 九级大纲:《国际中文教育中文水平等级标准》,国家语言文字工作委员会 / 教育部中外语言交流合作中心,2021,北京语言大学出版社。
华文大纲 :《华文水平词汇大纲》,刘华 / 周建设,针对东南亚华裔学习者。
研究者可以在“自定义大纲”中选择别的大纲字词表,例如YCT词汇等级大纲或自建字词大纲。自建字词大纲需预先按格式建好字词表,每行格式为:字词+制表符+等级。例如:我们\t3(\t表示制表符)。
二、
使用指南视频
三、
使用图文步骤
“分布”功能主要用于统计教材或语料的字词表在各种大纲中的分布情况
步骤一,选择需要统计的“分布计算的大纲”,可多选。包括:
旧版 HSK 大纲、等级划分、新版HSK大纲、华文大纲,或者在自定义大纲中选择其他,如YCT大纲或者自建的字词大纲
自建的字词大纲需要预先按照格式建好字词表,每一行一个字或词语,格式如下:字词+制表符+等级,例如:我们\t3,其中\t表示制表符,不是空格。
步骤二,选择“对比字表还是词表”
如需统计分布的是字表则选中“字表”,词表则选“词表”
步骤三,单击“打开字词表文件夹”
字词表文件夹可包含一个或多个字表或词表文件
所有字词表文件须为TXT文件,如在小学生作文语料库中用本软件“用字”或“用词”功能统计出来的字词表,也可以是别的下载的字词表。
同时确保各字词表的首列皆为字或词,如多列,用制表符Tab键隔开。
本系统统计出来的所有字词表皆可直接用此功能进行分布分析
步骤四,单击“设置保存文件夹”
选择或输入保存结果至本地的文件夹路径(不需要先建文件夹)
步骤五,单击“开始计算字词分布”,等待片刻,处理完成
打开本地文件夹即可看见字词表在参考大纲中的分布情况
四、
结果展示与案例
华文教材用字在国际中文教育中文水平等级标准(汉字)中的分布结果如下:
华文教材用字在华测汉字大纲中的分布结果如下:
华文教材用字在新HSK汉字大纲中的分布结果如下:
华文教材用词在词语等级划分中的分布结果如下:
华文教材用词在国际中文教育中文水平等级标准中的分布结果如下:
华文教材用词在华测词语大纲中的分布结果如下:
华文教材在自定义等级大纲(口语大纲)中的分布结果如下:
说明:软件程序为统一处理,所有大纲均按七级格式统计。不足七级的部分大纲,则只统计到实际大纲级数。
该您来试试分布分析了
后台回复“汉语助研”,免费获取正式版软件。
3 后台发送“分布分析”免费获取资源
后台发送“分布分析”,免费获取批量分布分析训练用的大规模语料压缩包。4 操作指南和研究案例分享
关注公众号推文,我们将陆续推出软件的使用操作视频以及典型案例。往期推荐