我要写论文,HSK动态作文语料库怎么用
今天有学妹给我发来私信:撰写偏误分析,这里就要提到HSK动态作文语料库。
打开官网:http://hsk.blcu.edu.cn
HSK动态作文语料库2.0版来啦
1、“HSK 动态作文语料库”是母语非汉语的外国人参加高等汉语水平考试(HSK高等)作文考试的答卷语料库,收集了 1992-2005 年的部分外国考生的作文答卷。语料库 1.0 版收入语料 10740 篇,约 400 万字,于 2006 年 12 月上线。2008年7月,经修改补充,语料库 1.1 版语料总数达到 11569 篇,共计 424 万字。
2、语料库自建成之日起,即秉持“积极主动、全心全意为全世界的汉语教学与研究服务”的理念,始终坚持免费向海内外各界用户开放,极大地促进了作为第二语言的汉语教学与相关研究,取得了十分显著的学术效益。例如,在中国知网(CNKI)中查询,截至2018年1月21日,依据该语料库进行相关研究并已发表的各类论文达3129篇,年度发文量见下图。
3、该语料库软件系统开发于十多年以前,技术已显陈旧,难以保证语料库的正常运转,给广大用户带来诸多不便。从上面年度发文量图的统计数据可见一斑:在2015年达到606篇以后,2016年降至554篇,2017年进一步降至330篇。为此,我们采用目前主流的计算机语言,重新开发了该语料库的软件系统,以便更好地为国内外的教师、学者、科研人员、研究生、汉语学习者服务。
4、本次软件系统开发,保留了“HSK 动态作文语料库”1.1 版的全部语料;检索方式除“一般检索”之外,增加了“特定条件检索”;数据统计增加了可视化图形设计;除检索浏览,用户还可以对发现的语料录入错误和标注错误进行修改;增加了语料自动下载功能(限500条);增加了“个人工作室”,这里有用户做了修改并已提交的语料,在此可以对个人资料进行维护;增加了留言功能,用户可以就相关问题发表自己的看法与认识。详见语料库“帮助”中的“网站使用说明”。
5、本次软件系统开发的总体设计和具体实施由张宝林教授负责,北京语言大学语言科学院孙林嘉讲师、硕士研究生杨星星同学参加了相关研讨和具体工作。软件开发由北京惟数科技有限公司承担。
6、本次软件系统开发,得到“HSK动态作文语料库”课题组负责人崔希亮教授的同意和支持,得到北京语言大学校领导和语言资源高精尖中心领导的肯定与支持。开发经费由张宝林教授主持的语言资源高精尖中心项目“汉语中介语语料库创新工程”承担。北京语言大学信息科学学院荀恩东教授提供了该语料库1.1版的设计数据。郝振斌先生及其团队付出了极大的努力。一并致谢!
“HSK动态作文语料库”课题组
2018年1月
“HSK动态作文语料库2.0”使用说明
系统登录后才能使用,登录后默认为主页,通过系统右上侧导航菜单可以进入字符串检索页面,其中有两个菜单【一般检索】和【特定条件检索】。 | |
一:字符串检索功能使用说明 | |
1、字符串检索功能分一般检索和特定条件检索,其中一般检索只有一个检索关键字输入框,可以将查询的关键字输入进行检索。如果多个关键字,关键字之间用空格、即“ ”隔开。单个关键词检索结果和多关键词检索结果页面如下图所示。 | |
单个关键词检索结果页面 | |
多个关键词检索结果页面 | |
特定条件搜索页面后,有一行输入文本框,标签为‘首’的文本框表示按照某字或词在句首位置的方式查询;标签为“尾”的文本框表示按照某字或词在句尾位置的方式查询;标签为“前词”的文本框表示按照某字或词包含在句子中,一般配合“词后”标签的文本框和“数量”标签的文本框配合使用,组合起来表示查询目标句中包含“词前”标签,间隔多少个汉字以内后出现“词后”标签的汉字。例如“词前”为【我爱】“数量”为【2】“词后”为【学】,那么可以查询类似如下句子:
| |
2、点击检索可与按照所填写查询关键字词信息进行组合查询,将查询结果显示出来。也可以增加背景信息查询项,对背景信息进行查询,只需要点击向下的标号按钮,展开查询组合项进行背景信息查询,如下图 | |
3、查询结果将显示“原句”,“原文”链接和“标注”版链接,可以直接打开查看原文和标注版。同时原句的下面分行显示了该文章的背景信息,包括原文作者国籍、考试时间、作文题目、各项考试成绩和证书等级。鼠标双击“原句”列头,可以将属性信息隐藏起来,再次双击可以恢复显示。可以点击向下箭头展开语料背景信息的查询区域,可以选择背景信息属性进行过滤检索,需要特殊说明的是对作文分数的查询,可以给定范围进行,比如查询作文分数在60分到90分之间的语料信息(包含60分不包含90分),可以在第一个【作文分数】中选择>= 60,在第二个【作文分数】中选在< 90 。双击具体语料信息“原文”,可以弹出编辑语料信息窗口,编辑更改后点击“提交更新”,系统自动将修改的语料信息存入我的工作室。 | |
| |
| |
4、点击原文链接可以打开原文,在打开页面中可以翻页查看,可以用鼠标拖动右下边角改变窗口大小进行原文图片缩放,如下图显示。 | |
5、点击标注版链接可以打开标准版,,可以用鼠标拖动右下边角改变窗口大小,如下图显示。 | |
6、查询结果下面有分页导航栏,可以翻页查看,如下图。 | |
二:句篇检索 | |
句篇检索导航信息,如下图。 | |
1.对“错句检索”,可以检索错句信息,显示结果如字符串检索,功能及操作类似。检索结果截图如下。 | |
2.对“错篇检索”,可以检索错误篇章信息,显示结果如字符串检索,功能及操作类似。检索结果截图如下。 | |
<img src="http://hsk.blcu.edu.cn/Public/htmltpl/img/help/cp1.png" <="" td="" style="font-size: 12px; box-sizing: border-box; display: inline-block; vertical-align: middle; border: 0px;"> | |
3.对“全篇检索”,可以当前语料库篇章信息和原文,显示结果如字符串检索,功能及操作类似。检索结果截图如下。 | |
<img src="http://hsk.blcu.edu.cn/Public/htmltpl/img/help/pz1.png" <="" td="" style="font-size: 12px; box-sizing: border-box; display: inline-block; vertical-align: middle; border: 0px;"> | |
三:统计 | |
1.概况 | |
显示现有语料中:总字数、总词数、作文题目总数、总篇数、各个国家所占篇数、每年的作文数 | |
2.错误信息汇总 | |
第一部分显示字错误汇总,包括字错误类型名、字错误标记、频次、频率(分母为总字数) 第二部分显示词错误汇总:词错误类型名、词错误标记、频次、频率(分母为总词数) 第三部分显示病句汇总:病句类型名、病句标记、频次 第四部分显示错误的篇章总数 | |
单击详细信息可以查看具体信息 | |
3.字汇总 | |
显示:字、总频次、出现问题的频次。如果,这个字的出现问题频次不为0,则可以点击,从而查看出现问题的地方 | |
4.词汇总 | |
显示:词、总频次、出现问题的频次。如果,这个字的出现问题频次不为0,则可以点击,从而查看出现问题的地方 | |
5.按年份字汇总 | |
在页面中选择要查询的年份,单击确定后,显示所选择的年份年考生用字情况汇总 | |
6.按年份词汇总 | |
在页面中选择要查询的年份,单击确定后,显示所选择的年份年考生用词情况汇总 | |
7.按国家统计 | |
某国家考生用字词句篇情况汇总 用户选择国家,可以显示该国考生如下的信息: 平均使用HSK甲、乙、丙、丁级字的数量,超纲字、词的数量; 错字数,别字数,繁体字数,……; 错词数,多词数,缺词数,离合词错误数; 成分多余的主语数、谓语数、……; 成分残缺的主语数、谓语数、……; 句型错误的把字句错误数、被字句错误数、……; 其他错误的语序错误数、词语重叠错误数、……; 错误篇章数,等等。 | |
8.按等级统计 | |
选择等级,进行查询,显示内容如上。 A=高级 A=11 B=高级 B=10 C=高级 C=9 | |
9.标点 | |
在输入框中输入要查询的标点符号(使用错误的标点符号),选择错误类型,单击确定。查询结果将显示在页面上。 | |
四:反馈 | |
管理员将在此发布一些公告。用户可以在这里给语料库管理员留言 。管理员会把一些的留言发布到公告上。 |
分享汉教资讯、共享汉教资源
咨询、合作微信:hanjiaoquan520,备注:姓名+学校/单位+何事
投稿:duiwaihanyugkk@163.com
本周课表
往期推送
【号内搜】| 志愿者 | 公派 | 证书笔试 | 证书面试 | 二面 | 英国BC | 大理事会 | 关键语言 | 招聘 | 考研 | 考博 | 教学 | 学术 | 才艺 | 社群 | 微师APP | 联谊 | 微博 | 抖音
【拼学优惠】新冠肺炎英语面试及云面试攻略