“我来读文献—线上论坛”2015年度干货整理 | 第15期,语料库语言学
iResearch外语学术科研平台“我来读文献”活动自2013年上线至今,已成功举办21期,覆盖语言学、应用语言学、文学、翻译等各个研究方向和领域;自2015年4月第12期开始,“我来读文献”活动增加了“线上论坛”,邀请领读专家和文章作者与读者在线交流研讨。活动以国内外权威学术期刊最新发表的论文为载体,通过“专家导读——个人研读——专家同行互动交流”这一系列过程帮助读者加深对文献的理解和思考,帮助青年教师和科研新手提升学术研究能力,开拓学术视野。
时间不巧错过了之前可能感兴趣的活动?没关系,小编帮您进行2015年度各期活动“线上论坛”的干货整理!
外语教学是语料库的传统应用领域之一。例如,教师可以使用本族语者语料库来辅助课堂教学(如Tim Johns所做的Kibbitzers就是借助语料来解释词语用法),或者通过学习者语料库来发现学生语言使用的不足(即传统的CIA中介语对比研究)。教材和词典编纂者还可以使用语料库来编写 反映真实语言使用情况的外语教材和学习者词典(如Collins COBUILD词典)。本研究将语料库应用于外语教学的视角和目的略有不同。通过自建教材语料库并运用语料库相关词表技术,作者对现行四套大学英语教材中 的词汇进行了评估。研究结果及研究方法对教材编写和日常教学有一定启示。
点评文献:
点评嘉宾:
奥克兰大学张军教授
奥克兰大学/燕山大学刘艳红副教授
外交学院吉洁博士
刘艳红老师
词汇的研究内容比较多,具体涉及哪些方面要看自己的研究兴趣,也要看是什么领域的词汇研究。例如在教材领域,一般我们首先想到的是词汇量(vocabulary size)有多少,因为教材是为实现教学目标而服务的,那教材包含了多少大纲中的词汇,即涵盖率也是主要考察的;还有就是复现率。如果要考察阅读语篇中的词汇,就可能要主要考虑词汇密度,以及易读度(readability);还有像何安平等学者研究的深入些,考察教材词汇的广度和深度。像Stubbs (1996) 的Text and Corpus Analysis里考察教材的文化等,要研究的词汇内容都不一样。如果是翻译研究,依研究问题而定,如报道动词、名物化等等考察的方向和方式又有不同,很多情况下都需要对语料进行赋码。所以应该是由研究问题决定,想回答什么问题就朝词汇的哪个方面入手。
刘艳红老师
大概步骤就是先选材,这个比较重要。选材要有代表性,我选定这几个教材是考虑它们的使用范围,做了问卷调查,见文内。
吉洁老师
是的,在选教材时,两位老师非常全面地考虑了教材的代表性问题。
刘艳红老师
具体步骤:
1. 收集语料,即收集教材;
2. 把纸质教材扫描成照片;
3. 把教材照片用OCR识别软件转换成可编辑的word文档,得到的文档会有一些无法识别的乱码;
4. 对文档进行排噪,即把文档中的错字、乱码校对正确;
5. 把文档命名,放在指定文件夹下,这个文件夹就是个库。
刘艳红老师
或许是该文有不足之处,但并不是说基于语料库的研究就是缺乏理论的。在System and corpus: exploring connections (Thompson & Hunston, 2006)这本书里就谈到系统功能语言学和语料库的关系:Systemic Functional Linguistics (SFL) and Corpus Linguistics (CL): SFL is essentially a theory of language; CL is essentially a method for investigating language. Yet this dichotomy between theory and practice is too simplistic. […] SFL is increasingly concerned with methods of quantifying linguistic features, and CL is becoming more intent on developing theories to account for its findings.
但关于语料库到底是theory还是method的问题,我个人的理解是,语料库驱动的研究和基于语料库的研究是有一定差别的。语料库驱动的研究偏重于理论,通过对语料的研究揭示语言的规律,Corpus analysis: language structure and language use (Leistyna & Meyer, 2003)一书中的研究多类似于此。但像Michael Stubbs (1996)的Text and corpus analysis: computer-assisted studies of language and culture一书中多数研究都把语料库作为工具。
在本文的研究中,语料库是作为研究工具的,所以不涉及深层次的语料库理论,主要是根据语言教学、二语习得和教材研究理论指导下的研究,所以分析的时候用的理论多为词汇教学和语言教材理论。
吉洁老师
是的,关于语料库到底是一个theory还是一个method的问题,语料库界一直也是争论不休。基于语料库的研究,主要把语料库作为一个method,而不涉及语料库的深层理论,一般有自己的研究问题和理论基础,语料库作为一种实现工具。有兴趣的老师,可以读一下
http://ylyy.chinajournal.net.cn/WKD/WebPublication/index.aspx?mid=ylyy,这里有一篇文章中,卫乃兴教授和许家金教授专门就这两个范式进行了综述和评论。
吉洁老师
可以机器辅助。多媒体视频标注工具就可以,比如ELAN。音频也可以用ELAN标注,只不过有一些就难以描述,比如手势。音频可以标注停顿、笑声等。话语分析领域现在很多用多媒体语料库在做。ELAN下载地址:http://tla.mpi.nl/tools/tla-tools/elan/download。
吉洁老师
文学方面的语料库我关注的不多,但肯定是有的,我们这里有一个Dickens的小说库,可以试用一下:http://124.193.83.252/cqp/。
张军老师
国内有好几个学者把文学名著用语料库方法进行分析。艳红本人与现在河南大学的刘泽权老师一起发了好几篇这样的文章。
吉洁老师
是的,刘泽权老师的红楼梦语料库,大家也可以关注一下。
刘艳红老师
红楼梦的翻译研究,以及基于语料库的四大名著研究,都是刘泽权老师团队做的,两个国家社科项目,几个省基金,几十篇基于语料库的翻译研究,大家感兴趣可以检索下。
【声明】本文版权归iResearch所有。其他任何学术平台若有转载需要,可致电010-88819585或发送邮件至research@fltrp.com协商授权事宜,请勿擅自转载。(*封面图片来自网络)