查看原文
其他

【名家专题】张宝林——汉语中介语语料库的设计理念与功能

国际汉语名家讲坛 语通天下国际汉语教育科技 2020-03-13


名家专题五——张宝林教授


汉语中介语语料库的设计理念与功能






      为了让大家能更深入地了解汉语国际教育领域的专业知识,小编每周会以我们名家讲坛的一位主讲嘉宾为主题向大家介绍嘉宾的一系列研究成果。本周向大家介绍的主讲嘉宾是国际汉语教育名家讲坛全球直播第三场的主讲嘉宾——北京语言大学的张宝林教授。






张宝林

       北京语言大学汉语国际教育研究院研究员,博士研究生导师。西北师范大学兼职教授,福建师范大学客座教授,语言资源高精尖创新中心特聘研究员,中国语料库语言学研究会理事,中国语文现代化学会语言资源开发与应用专业委员会副理事长。主要研究方向为语言学及应用语言学,研究领域涉及现代汉语语法、对外汉语教学、语言测试、语料库建设、汉语句式习得、语言培训服务标准、世界各国语言政策与汉语国际传播策略等。著有《汉语教学参考语法》、《汉语语法的多层面考察》、《现状与对策——作为第二语言的汉语教学研究》,作为项目负责人合著《基于语料库的外国人汉语句式习得研究》、《语言培训服务国家标准研究》、《汉语中介语语料库标注规范研究》,参与主编第二届、第三届、第四届《汉语中介语语料库建设与应用国际学术讨论会论文选集》,合著教材、词典、工具书等多部。在《世界汉语教学》、《语言教学与研究》、《语言文字应用》等刊物及多种论文集中发表学术论文60多篇,主持或参与主持国家社科项目、教育部人文社科项目、北京市社科项目、北语校级项目10多项。





 张宝林教授于北京时间2019年6月21日进行了以“汉语中介语语料库的设计理念与功能”为题的国际汉语教育名家讲坛第三场全球直播。让我们从讲坛开始一起来了解一下汉语中介语语料库研究领域的一些具体研究成果吧!



全球直播现场照片










汉语中介语语料库的设计理念与功能





张教授首先从语料库的历史发展入手,详尽描述了语料库近20多年来的发展历程,从1995年北京语言大学开始建设汉语中介语语料库,到本世纪第二个十年语料库发展的百花齐放,语料库的发展进入到欣欣向荣的发展阶段,应用研究也日趋完善。






接着,张教授指出建设汉语中介语语料库的根本目的是为全世界的汉语教学与研究服务。从目前情况看,语料库建设应调整设计思想,重新定位设计理念,使语料库建设向精细化方向发展。进而,张教授分别从设计理念和功能作用两个方面展开,详细为我们描述了语料库的标记功能,已经可以实现字、词、短语、句式+句子成分、语篇、语体、语义、语用、修辞格、标点符号、口语和视频语料的语音、体态语的标记,另外还包括分版标注、自动标注和标注模式(偏误标注+基础标注)的详细介绍,为我们展现了语料库的强大功能。






最后,张教授重点提出了对目前现状的改善方案,首先要重视网络安全,确保语料库正常运转与开放;其次语料库功能应全面而强大,这样可以满足用户的多方面使用需求;最后在语料库界面方面,其界面应操作简便,响应迅捷,这样才能满足广大汉语学习者、教师、研究人员多方面的使用需求,发挥语料库应有的作用。






值得一提的是,语料库的思想是大数据的思想,语料库是大数据理论形成的基础之一,又是其在语言学领域的集中体现。所以我们应共同努力,改进语料库软件系统,增强其功能,扩展其效益,更好地满足用户的使用需求,并使语料库的功能与质量得到提升与优化,为汉语国际教学做出更多贡献。






想了解讲座的全部内容就扫描下方图片中的二维码进行收看吧~






张宝林教授的研究涉及到现代汉语语法、对外汉语教学、汉语测试、语料库建设、汉语句式习得研究等多个领域且都有丰硕的研究成果。本文主要向大家介绍张教授有关语料库建设方面研究成果。让我们一起学习张教授的相关论文,进而丰富、拓展我们的语料库知识吧!




 张宝林教授语料库建设研究成果 




  2004年   

1




      张宝林教授于2004年发表了题为《关于“HSK动态作文语料库”的建设构想》(共同作者崔希亮教授,任杰)一文,文章详细阐述了“HSK动态作文语料库”建设的意义、用途,语料库的主要内容、基本结构、建库原则,对一些可预见问题的处理方法,以及语料库的局限性。文中指出最大限度地降低乃至排除汉语水平考试中主观性试题评分的主观性,实现客观有效而又快捷迅速的作文评分计算机化,是研制“HSK动态作文语料库”的首要目的。并且“HSK动态作文语料库”可以填补国内汉语中介语语料库研制的一项空白,运用此语料库研究者可以进行多方面的研究,例如:汉语中介语研究、第二语言习得研究、对外汉语教学理论研究、对外汉语教材研究、汉语水平考试研究、汉外语言对比研究、汉语本体研究,等等。“HSK动态作文语料库”的建立标志着对考生作文答卷的管理开始向着规范化、科学化和现代化的方向迈进。如果想更细致地了解“HSK动态作文语料库”的主要内容、基本结构、建库原则以及对一些可预见问题的处理方法等内容可以详细研读此文。





  2009年   

2




张教授2009年发表了《“HSK动态作文语料库”的特色和功能》一文,文章比较全面、详细地介绍了“HSK动态作文语料库“的主要特点与基本功能,旨在帮助读者了解语料库,掌握语料库的使用方法。“HSK动态作文语料库”具有:语料典型,填补空白;规模较大,用途广泛;语料版本功能各异,标注全面细致科学;统计信息丰富,考生背景信息完备;界面友好,使用方便;免费开放,服务教学科研的特点。其功能也十分多样,包括:字符串检索、错句检索、错篇检索、全篇检索、查询条件的组合检索、属性设置、统计信息及相关检索、反馈、帮助。关于统计信息及相关检索功能,文章指出语料库设有“统计”栏目,内容包括: 概况、错误信息汇总、字汇总、词汇总、按年份统计字、按年份统计词、按国家统计、按级别统计、按标点统计。为了更详细地展示此功能,在按国家统计部分,文章举出缅甸考生的汉语使用情况表,如下:






2010年

3




张教授2010年发表于《语言文字学应用》期刊上的《汉语中介语语料库建设的现状与对策》一文中概括介绍了汉语中介语语料库建设的基本状况,分析了原因,并提出了解决问题的若干方法。文章指出经过10多年的发展,语料库建设已初具规模,并在对外汉语教学及相关研究领域发挥了重要的推动作用。但还存在着一些问题:数量较少,规模较小,语料不够全面;语料库建设没有统一标准,建库实践带有很强的随意性;功能不够完善,有些中介语现象检索不便,甚至无法检索;语料标注效率不高,标注质量存在一定问题;语料库资源尚不能充分共享。而产生这些问题的原因则是:语料库总体设计不周密,存在先天缺陷;语料及学习者背景信息收集困难;语料标注规范的两难选择;受技术水平的限制,语料标注尚无切实可行的自动处理方法。为应对这些问题,文章提出了相应的对策:在需求分析的基础上,确定恰当的建设目标;吸取先进的技术手段和权威标准,切实解决标注问题;多方合作,互利共赢,实现最充分的资源共享。在“吸取先进的技术手段和权威标准,切实解决标注问题”部分,文章强调:在标注方法上,“基础标注 + 偏误标注”应成为汉语中介语语料库语料标注的新模式;语料库建设中,要充分重视标注工具的功能,继续发挥其重要作用,并不断改进;在分词规范上,汉语中介语语料库建设应采用教育部、国家语言文字工作委员会组织研制的语言文字信息处理国家标准《信息处理用现代汉语词类标记规范》;在标注质量上应采取多种措施,保证标注质量。




同年,张教授还发表了题为《基础标注的内容与方法》的文章,文章探讨了基础标注的内容、方法与标注工具,以及与基础标注相关的其他一些问题,并提出了一些见解。文章指出目前中介语语料库特别重视对语料中各种偏误现象的标注,为偏误分析提供了很好的条件。中介语研究对象应是学习者语言的整体,只重视偏误分析容易夸大偏误的严重程度,使研究者形成不全面的认识。面对这样的问题,语料库除进行偏误标注之外,还应进行基础标注,便可以从各种角度对汉语中介语、对学生的汉语习得情况进行全方位的考察、对比与研究。因此文章强调“偏误标注+基础标注”应成为汉语中介语语料库语料标注的新模式。文章还详细介绍了基础标注的内容:分词及词类序列标注;断句和句子成分序列标注;句类、句型、句式类别标注;词、句的语体信息标注。基础标注的方法:机标人助、人标机助、标注工具。最后还对“标注代码的通用化和标准化 ”、“偏误标注与基础标注的分与合”和“尝试进行自动标注”这三个问题进行了探讨。如对上述内容感兴趣可下载全文进行详细研读。





  2011年   

4




      张教授2011年发表了题为《全球汉语学习者语料库建设方案》(共同作者崔希亮教授)一文,文章在对汉语中介语语料库建设情况进行较为全面、深入的考察的基础上,提出“全球汉语学习者语料库”的建设构想,还具体介绍了该语料库的内容、建设原则、建库方式与步骤和主要特点。该语料库的内容概括为:(一)关于语料:样本多、规模大、来源广、阶段全;(二)关于背景信息要包括学生及语料的相关信息;(三)关于标注,标注模式为偏误标注和基础标注相结合;(四)关于统计,包括:字信息统计、词信息统计、句信息统计、语篇信息统计、标点符号信息统计;(五)关于库结构,语料库包括 5 个子库:生语料库、熟语料库、统计信息库、相关信息库、母语者中小学生语料库;(六)关于成果形式,分为:网络版语料库和单机版语料库。建库的原则为:注重语料的真实性、注重语料的平衡性、注重语料的系统性、注重语料的动态性、注重语料库使用的便捷性。建库的方式采取的是多方合作,互利共赢的方式。建库的步骤共分为九步(具体参看全文)。语料库的主要特点为:语料规模空前、用途广泛、标注方式具有前沿性、采用“偏误标注 + 基础标注”的标注模式、语料库免费开放。文章还倡议学界共同努力,建设一个最大最好的汉语中介语语料库,实现最充分的资源共享,为全球的汉语教学与研究服务。




  2012年   

5




时至2012年,汉语中介语语料库的建设与应用引起了学界愈来愈多的关注,为了深化对汉语中介语语料库建设中一些关键性问题的认识,张教授2012年发表了《关于汉语中介语语料库建设的若干重要问题》的文章。文章对学界关于语料选取的原则、语料标注的内容与方法、语料的检索与呈现等问题进行了讨论。文章指出选取语料的基本原则为:语料应具有真实性、平衡性、随机性、系统性、动态性。语料标注的内容上应形成一种“偏误标注+基础标注”的加工处理模式。在语料标注的方法上,(一)应根据使用者的实际需要选取“只标不改”与“既标且改”中恰当的标注方式;(二)应根据不同性质与类型的偏误在“从大到小,一错一标 ”与“不分大小,一错多标”中选取恰当标注方式;(三)应总体上采用“人标机助”的标注方式,同时,在分词和词性标注层面使用“机标人助”的方法,并在“人助”环节上对机器的标注结果进行严格的审查与修正;(四)还应注意语料标注的全面性与科学性。关于“语料检索及其呈现方式”的内容,想做详细了解的同学可进行全文研读。





  2013年   

6




 在《全球汉语学习者语料库建设方案》一文的基础上,2013年张教授发表了《“全球汉语中介语语料库建设和研究”的设计理念》(共同作者崔希亮教授)一文,文章针对目前语料库建设存在的整体设计水平不高、发展不平衡、语料库建设的本体研究缺乏、缺乏语言学本体研究的有力支持、大多数语料库建成后并不对外开放未能充分发挥其应有的作用、现有的汉语中介语语料库不能满足汉语教学与相关研究的多方面需要这六方面的问题,提出了“全球汉语中介语语料库建设和研究”的课题,力图通过该课题的实施,进一步推动语料库的建设与发展。该课题的主要创新点是:(1)理念创新:建设最好最大的语料库,实现最充分的资源共享,全心全意地为全世界的汉语教学与研究服务; (2)内容创新:在建设语料库的过程中,进行汉语中介语语料库建设的本体研究,提高语料库建设水平;(3)方式创新:全球汉语学界携手共建,基于web的语料协同标注平台,以及“搭积木式”的动态建设策略等。



通用型汉语中介语语料库的标注模式问题一直是张宝林教授研究的重要内容,2011年《通用型汉语中介语语料库的标注模式》一文发表后,张教授又继续对汉语中介语语料标注问题进行深入研究,2013年发表了《关于通用型汉语中介语语料库标注模式的再认识》一文。文章指出了目前汉语中介语语料标注存在的主要问题:(一)语料标注内容差异很大,导致一些语料库的功能不完备;(二)标注只限于文字、词汇、语法层面,而没有语义、语用层面的标注;(三)对语篇、语体的标注仅见于个别语料库,且十分简单;(四)对同样的偏误现象认识不同,归类不同,采取的标注方式也不同;(五)标注代码各异,给用户造成了不必要的记忆负担与混乱,也不便于资源共享;(六)标注质量受标注方式制约,存在较大问题。在此基础上,文章集中探讨了语料标注模式问题,对“偏误标注 + 基础标注”模式做了新的概括与解释。在标注内容方面,主张进行语义标注和语用标注,深化语篇标注和语体标注; 在标注方法方面,倡导实行“有限的一错多标”; 阐述了把可扩展的置标语言XML应用于“偏误标注 + 基础标注”模式的优越性和可行性以及存在的问题。




  2015年   

7




经过20余年的探索与发展,汉语中介语语料库的价值已被越来越多的人所认识,其建设正跨入一个繁荣发展的重要时期。为了形成一套科学的语料库建设标准,促进语料库建设的规范化和进一步发展,张教授于2015年发表了名为《谈汉语中介语语料库的建设标准》(共同作者崔希亮教授)的文章。文章指出由于建库实践中存在的随意性,现有的语料库尚不能完全满足汉语教学与研究的使用需求。因此文章对汉语中介语语料库的建设标准的目的与原则、研究内容进行了探讨,从建设流程、语料收集与录用、语料标注、资源共享等角度提出一些见解。如对详细内容感兴趣可进行全文研读。




如对上面研究内容感兴趣,可以下载有关文章进行学习!





国际汉语教育名家讲坛

名家专题回顾



名家专题一:





郑艳群教授专题

郑艳群,北京语言大学教授,主要从事第二语言教育技术教学与研究工作,著有《计算机技术与世界汉语教学》、《汉语教学多媒体课件设计》等。

链接:【前沿研究】新技术与汉语国际教育


名家专题二:



袁芳远教授专题

袁芳远,美国海军学院语言文化系终身教授。研究方向为汉语第二语言习得研究、课堂任务教学法、教师行动研究、商业汉语教学等。曾出版专业书籍三部、汉语教材三部、研究论文二十余篇。

链接:【名家专题】在教学环境下的汉语二语习得研究


名家专题三:





周小兵教授专题

周小兵,中山大学教授,博导,国际汉语教材研发与培训基地主任,发表论文160多篇,出版专著11部教材6种主建全球汉语教材库,含教材1万多册/种。

链接:【名家专题】周小兵——国际汉语教材库建设与教材评估


名家专题四:


储诚志教授专题

储诚志,美国加州大学戴维斯分校中文部主任,语言学系博导,美国中文教师学会前任会长,加州中文教师协会前任会长。

链接:【名家专题】储诚志——屏幕电书时代汉字教学策略的再思考




小编:小真



让我们一起推动汉语国际教育事业的发展使汉语走向世界!


长按二维码关注我们



添加语通天下教研助理微信,

发送“姓名+地区+教学/研究方向”,可申请加入

“国际汉语教育互动交流群组”


长按二维码关注我们




THE

END



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存