好书推荐|施雅倩、雷蕾《语言数字人文与R语言实践》(留言赠书)
好
书
推
荐
///
上海交通大学出版社
2023年
施雅倩 雷蕾 著
做语言数字人文,我们是认真的。《语言数字人文与R语言实践》从零基础语法入手,到数据与文本的处理与绘图,再到语言数字人文研究实例,形成从入门到实践的完整闭环。
/// 好书推荐
《语言数字人文与
R语言实践》
施雅倩 雷蕾 著
作者简介
施雅倩,博士,华中科技大学讲师。研究兴趣涉及语料库语言学、计量语言学、学术英语等领域。在System、Lingua、Journal of Quantitative Linguistics、English Today等SSCI期刊发表研究性论文多篇。担任Humanities and Social Sciences Communications、Journal of Language and Education、Heliyon等国际期刊审稿人。
雷蕾,博士,上海外国语大学教授、博士生导师。研究兴趣涉及语料库语言学、学术英语、计量语言学等领域。在剑桥大学出版社等出版专著5部,在Applied Linguistics、Language Teaching、Journal of English for Academic Purposes、International Journal of Corpus Linguistics 等SSCI期刊发表研究性论文近40篇、书评10余篇,其中两篇论文入选ESI高被引论文;在CSSCI期刊发表论文或书评10余篇。主持完成国家社科基金等项目多项。兼任Journal of English for Academic Purposes (SSCI) 等国内外期刊编委。
目录
前 言
随着计算机、信息网络等数字技术的发展和普及,语言知识的获取和存储方式发生了天翻地覆的变化。图书、报纸、杂志等语言人文知识都采用数字化方式存储和获取,人类社会逐渐进人数字化和大数据时代。语言研究者的主要研究对象之一是语言,具有长期观察、处理、研究语言的经历和经验,对语言数据拥有天然的亲近感,自然具有掌握数字技术以处理语言大数据的原动力。
早期语言学研究者常常在“花园”中观察语言,通过内省或者直觉来探究语言学及其相关问题。这种方式确实有助于我们了解语言这个系统,但是这些研究的发现往往只适用于某种特定情景,换一种情景或者面对真实的语言应用场景时可能就不适用了。造成该结果的其中一个原因可能是语言学研究者在“花园”中观察“精心挑选”过的语言材料难以揭示语言的本质和规律。事实上,语言规律来源于真实的语言使用,因此,语言研究亟需融入更多的数据。数字时代的来临正好提供了从“花园”走向人类语言“灌木丛”的契机。然而,传统语言学研究者习惯了在“花园”中漫步,突然走进人类语言“灌木丛”,面临海量真实的文本数据,难免会不知所措。最大的挑战可能是如何研究这片“灌木丛”。语言学研究者不能再用“花园”中研究语言的那套方法来研究“灌木从”,花费大量的时间和精力进行材料的整理和细读,然后依靠反思或者直觉总结语言规律。
数字人文,特别是语言数字人文的出现为语言学研究者提供了新的研究范式。语言数字人文指的是将计算机技术和数字技术应用于传统语言学研究领域,从而提出或者解决语言学以及相关学科问题的交叉学科领域。语言数字人文的出现深刻影响了语言学及其相关学科(比如心理学、社会学、传播学、文学、翻译等)的研究模式,为语言学等人文社科研究者提供了新的研究思路和方法。一批学者开始利用电脑技术和数字技术分析大规模真实语言和文本数据,从而探究人类语言的本质和规律。
在语言数字人文研究中,数字技术是关键。然而,传统人文学者大部分是纯文科背景出身,缺乏编程和数理基础。因此,技术问题可能是他们在语言数字人文研究中面临的最大挑战。文科出身的人文学者能否克服技术问题呢?他行应该如何跨越数字技术这道鸿沟?第一个问题的答案显然是肯定的。以我们自身以及研究团队其他成员的学习背景和历程来看,文科生同样可以掌握数字技术,进行数据驱动的语言研究。对于第二个问题,人文学者们虽然可以使用各种现成的本地或者在线工具进行文本分析,但是这些传统工具功能有限且固定,往往无法满足研究者的个性化研究需求,一定程度上限制了语言数字人文研究的创新和发展。因此,研究者们有必要掌握一定的编程知识,让计算机来做那些重复繁杂的任务。同时,研究者们通过编程可以实现个性化的、更为复杂的语言数字人文数据处理和分析,从而生产出语言数字人文新知识。
在众多编程语言中,R语言是人文学者可以首选学习的编程语言之一。一方面,R语言具有强大、灵活的交互式数据分析功能,能够一站式完成数据导人、数据准备、数据分析、数据可视化、数据输出等数据处理工作;另一方面,R语言语法简单、友好、易掌握,很适合没有编程和数理基础的人文研究者学习和使用。
为了更好地帮助人文学者学习编程知识,本书以语言数字人文研究实践为导向,向读者介绍如何利用R语言进行语言数字人文数据处理。首先,本书介绍语言数字人文的概念和R语言在语言数字人文数据处理中的应用。然后,本书详细介绍R语言的基本语法、数据结构和常用功能,比如数值、字符串、向量、矩阵、数据框、列表以及条件与循环。之后,本书介绍了R语言中数据处理的基本操作,包括数据导入、数据筛选、数据清理、数据转换、数据分析以及数据可视化。接着,本书详细介绍语言数字人文文本处理的基本操作,包括txt文本文件和xml文件的读取和处理以及文本的分词、词形还原、词性标注等预处理操作。最后,我们以三个具体的案例为导向,向读者介绍R语言在文献计量学、心理学、传播学等语言学及其相关学科领域中的实际应用。相信各位读者在阅读和学习本书内容后,能够了解R语言的基本编程知识,掌握R语言中语言数字人文数据处理的基本技能,并在此基础上不断扩大研究边界,提升研究实力和研究质量。
本书拋砖引玉,期望能给对语言数字人文研究感兴趣的读者一些启发。我行也期待更多语言学研究者加人语言数字人文研究,期待与读者诸君共同进步。最后,本书是我们对近期研究,特别是利用R语言处理数据的探索和总结,不足之处,请读者不吝批评指正。
留言赠书活动(第 51 期)
1. 关注“语言学心得”微信公众号;
2. 给本文留言,聊聊您对这本书的想法💡;
3. 截止日期:2023年10月20日(星期五)12:00,留言点赞数排名✨ 前两名✨为本次活动的幸运读者,将为其包邮(限国内)赠出一本《语言数字人文与R语言实践》(纸质版);
欢迎各位转发到微信朋友圈,为自己的优质评论集赞👍👍👍
(感谢上海交通大学出版社对本次活动的支持,为读者朋友们送上福利!)
欢迎转发扩散!
课程推荐
2023-10-11
2023-10-10
2023-10-09
2023-10-08
2023-10-07
2023-10-07
2023-10-05
2023-10-05
2023-10-03
2023-10-02
2023-10-01
请添加“心得君”入群请务必备注“学校+研究方向/专业”
今日小编: 墨色深
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd