查看原文
其他

“我来读文献—线上论坛”2015年度干货整理 | 第15期,语料库语言学

iResearch 外语学术科研网 2021-03-17
要年货,     更要“科研干货”!


iResearch外语学术科研平台“我来读文献”活动自2013年上线至今,已成功举办21期,覆盖语言学、应用语言学、文学、翻译等各个研究方向和领域;自2015年4月第12期开始,“我来读文献”活动增加了“线上论坛”,邀请领读专家和文章作者与读者在线交流研讨。活动以国内外权威学术期刊最新发表的论文为载体,通过“专家导读——个人研读——专家同行互动交流”这一系列过程帮助读者加深对文献的理解和思考,帮助青年教师和科研新手提升学术研究能力,开拓学术视野。


时间不巧错过了之前可能感兴趣的活动?没关系,小编帮您进行2015年度各期活动“线上论坛”的干货整理!


*温馨提示:由于微信平台功能所限,文中网络链接无法直接点击进入,请您将链接复制到浏览器中查看。
15期活动讨论主题:语料库语言学

外语教学是语料库的传统应用领域之一。例如,教师可以使用本族语者语料库来辅助课堂教学(如Tim Johns所做的Kibbitzers就是借助语料来解释词语用法),或者通过学习者语料库来发现学生语言使用的不足(即传统的CIA中介语对比研究)。教材和词典编纂者还可以使用语料库来编写 反映真实语言使用情况的外语教材和学习者词典(如Collins COBUILD词典)。本研究将语料库应用于外语教学的视角和目的略有不同。通过自建教材语料库并运用语料库相关词表技术,作者对现行四套大学英语教材中 的词汇进行了评估。研究结果及研究方法对教材编写和日常教学有一定启示。

点评文献:


刘艳红、张军,2015,基于语料库的通用大学英语教材词汇研究[J],《中国外语教育》,8(1):42-50。

点评嘉宾:

奥克兰大学张军教授

奥克兰大学/燕山大学刘艳红副教授

外交学院吉洁博士

Q
A
&
01词汇研究一般涉及到几个方面,词汇量、密度等吗?

刘艳红老师

词汇的研究内容比较多,具体涉及哪些方面要看自己的研究兴趣,也要看是什么领域的词汇研究。例如在教材领域,一般我们首先想到的是词汇量(vocabulary size)有多少,因为教材是为实现教学目标而服务的,那教材包含了多少大纲中的词汇,即涵盖率也是主要考察的;还有就是复现率。如果要考察阅读语篇中的词汇,就可能要主要考虑词汇密度,以及易读度(readability);还有像何安平等学者研究的深入些,考察教材词汇的广度和深度。像Stubbs (1996) 的Text and Corpus Analysis里考察教材的文化等,要研究的词汇内容都不一样。如果是翻译研究,依研究问题而定,如报道动词、名物化等等考察的方向和方式又有不同,很多情况下都需要对语料进行赋码。所以应该是由研究问题决定,想回答什么问题就朝词汇的哪个方面入手。

02通用大学英语教材语料库是如何建立的?请嘉宾老师说明一下较为详细的步骤。

刘艳红老师

大概步骤就是先选材,这个比较重要。选材要有代表性,我选定这几个教材是考虑它们的使用范围,做了问卷调查,见文内。


吉洁老师

是的,在选教材时,两位老师非常全面地考虑了教材的代表性问题。


刘艳红老师

具体步骤:

1. 收集语料,即收集教材;

2. 把纸质教材扫描成照片;

3. 把教材照片用OCR识别软件转换成可编辑的word文档,得到的文档会有一些无法识别的乱码;

4. 对文档进行排噪,即把文档中的错字、乱码校对正确;

5. 把文档命名,放在指定文件夹下,这个文件夹就是个库。

03作者开篇和最后都提到理论依据的问题,只不过我在看结果与分析的时候并没有看到多少理论指导。是不是语料库研究有点像语言测试研究那样,纯粹就是描述性研究,然后与以往研究发现进行比较?

刘艳红老师

或许是该文有不足之处,但并不是说基于语料库的研究就是缺乏理论的。在System and corpus: exploring connections (Thompson & Hunston, 2006)这本书里就谈到系统功能语言学和语料库的关系:Systemic Functional Linguistics (SFL) and Corpus Linguistics (CL): SFL is essentially a theory of language; CL is essentially a method for investigating language. Yet this dichotomy between theory and practice is too simplistic. […] SFL is increasingly concerned with methods of quantifying linguistic features, and CL is becoming more intent on developing theories to account for its findings. 


但关于语料库到底是theory还是method的问题,我个人的理解是,语料库驱动的研究和基于语料库的研究是有一定差别的。语料库驱动的研究偏重于理论,通过对语料的研究揭示语言的规律,Corpus analysis: language structure and language use (Leistyna & Meyer, 2003)一书中的研究多类似于此。但像Michael Stubbs (1996)的Text and corpus analysis: computer-assisted studies of language and culture一书中多数研究都把语料库作为工具。


在本文的研究中,语料库是作为研究工具的,所以不涉及深层次的语料库理论,主要是根据语言教学、二语习得和教材研究理论指导下的研究,所以分析的时候用的理论多为词汇教学和语言教材理论。


吉洁老师

是的,关于语料库到底是一个theory还是一个method的问题,语料库界一直也是争论不休。基于语料库的研究,主要把语料库作为一个method,而不涉及语料库的深层理论,一般有自己的研究问题和理论基础,语料库作为一种实现工具。有兴趣的老师,可以读一下

http://ylyy.chinajournal.net.cn/WKD/WebPublication/index.aspx?mid=ylyy,这里有一篇文章中,卫乃兴教授和许家金教授专门就这两个范式进行了综述和评论。

04对于课堂话语语料,如何进行标注呢?靠人工还是能靠机器辅助呢?标注的这些规则,比如停顿三秒,这些似乎好像有不同的转写规则,一般是采取哪种呢?

吉洁老师

可以机器辅助。多媒体视频标注工具就可以,比如ELAN。音频也可以用ELAN标注,只不过有一些就难以描述,比如手势。音频可以标注停顿、笑声等。话语分析领域现在很多用多媒体语料库在做。ELAN下载地址:http://tla.mpi.nl/tools/tla-tools/elan/download。

05国内有哪位老师做文学语料库研究比较有代表性可以学习参考呢?

吉洁老师

文学方面的语料库我关注的不多,但肯定是有的,我们这里有一个Dickens的小说库,可以试用一下:http://124.193.83.252/cqp/。


张军老师

国内有好几个学者把文学名著用语料库方法进行分析。艳红本人与现在河南大学的刘泽权老师一起发了好几篇这样的文章。


吉洁老师

是的,刘泽权老师的红楼梦语料库,大家也可以关注一下。


刘艳红老师

红楼梦的翻译研究,以及基于语料库的四大名著研究,都是刘泽权老师团队做的,两个国家社科项目,几个省基金,几十篇基于语料库的翻译研究,大家感兴趣可以检索下。

相关关阅读
“我来读文献”2015年度干货整理 | 第12期,综述性文章的阅读与写作  
“我来读文献”2015年度干货整理 | 第13期,二语习得研究
"我来读文献”2015年度干货整理 | 第14期,语言测试与评估

【声明】本文版权归iResearch所有。其他任何学术平台若有转载需要,可致电010-88819585或发送邮件至research@fltrp.com协商授权事宜,请勿擅自转载。(*封面图片来自网络)



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存