张宝林 | 汉语中介语语料库的2.0时代
汉语中介语语料库的2.0时代
2018年11月8-9日,第十三届国际汉语教学研讨会暨北京大学首届世界汉语研讨会在北京大学成功举行,主题为“新时代国际汉语教学研究与发展”。8日下午至9日上午,第十三届国际汉语教学研讨会分为八个专题,共有256位学者报告了研究成果。北京语言大学语言科学院张宝林教授应邀出席本次会议,并在第七个专题上进行报告研究成果,报告题目为:汉语中介语语料库建设的2.0时代。
张宝林,北京语言大学教授,博士生导师。西北师范大学兼职教授,福建师范大学客座教授,语言资源高精尖中心特聘研究员。研究领域涉及现代汉语语法、对外汉语教学、汉语测试、语料库建设、汉语句式习得、语言培训服务标准、各国语言政策与汉语对外传播策略等。主持或作为主要成员参加国家级、省部级、校级科研项目10多项。独立或合作出版学术专著、教材、大纲、词典等10多部,发表学术论文60多篇。曾先后应邀在韩国、日本、新加坡、美国、英国、法国、奥地利、摩尔多瓦、墨西哥、澳大利亚、新西兰、中国香港、澳门、台湾和内地一些高校进行学术交流,从事汉语教学和汉语师资培训工作。
前言
大数据时代,语料库成为语言资源保护和语言研究必不可少的工具,语料库语言学也已成为语言学下的一个分支。语料库有许多种类型,其中一种类型就是学习者语料库,即收集非母语者学习目的语的语料而构建的语料库,中介语语料库就是学习者语料库。那么今天就让我们一起走进“汉语中介语语料库的2.0时代”。
汉语中介语语料库的2.0时代
由图我们可知,基于语料库的语言研究日趋增长呀!但是1.0代的HSK语料库还有一些问题。
检索“帮助别人”
上图告诉我们,想要搜索像“帮了一个忙”这样的离合词,只需要在索引界面输入“帮 忙”就可以啦!
“是……的”句式的搜索
“连……都”句式的搜索
“因为……,所以……”复句形式的检索
在语料库中分别对“因为……所以……” ,“因为”,“所以”进行检索,得出“所以”这种情况使用频率最高。有心人快去研究一下其中缘由吧!
上图为右有序
上图为左有序
检索语料
原始语料
标注语料
自选设定每页显示语料的数量
敲黑板 划重点啦~
2.0时代的语料库:
1.可以进行更多形式的检索,例如:对句式和复句进 行检索,词语搭配检索;
2.语料呈现更全面,更人性化;
3.可以对字词总数,偏误数等数据进行统计;
4.用户可以对相关问题进行反馈,给使用者提供了一与管理者的非实时互动界面;
5.可以对所需语料进行下载.
HSK 2.0版语料库网址分享给大家,也可点击阅读原文跳转至该链接:
http://202.112.194.56:8088/hsk/Login
本期责编:段段
往期回顾:
《语言规划学研究》| 董希骁 我国欧洲非通用语教育存在的问题和建议
《语言规划学研究》| 马喆 廖铁君 梁彦瑶 平面广告语言中针对负面状况的应对模式