查看原文
其他

语言科学研究的利器——R

吴诗玉教授 应用语言学研习 2022-06-09
感谢关注我们!加油,研习人!

欢迎关注我们,一站式分享海量语言学术资源

来源编辑:语言科学公众号

转载编辑:研习君



敬请星标应用语言学研习,喜欢请点赞,分享请转发




R作为一款免费、源代码开放的语言,有着发达、灵活的数据计算能力和数据可视化能力,在我们这个大数据时代,R的卓越表现为科研工作提供了更丰富的创造性和更多的便利性。目前,语言研究的对象也趋向于更多的样本、语料库、大数据,语言学研究者也更倾向于穷尽更多的语言现象来更准确地阐释语言的本质、语言和思维的关系,语言和教学的关系等等。R的出现,为语言学研究者提供了一个强大的数据工具。

上海交通大学外国语学院吴诗玉教授,很早就开始使用R进行语言研究,积累了丰富有效的经验,引导青年学者借助数据工具不断探索语言的奥秘。科学出版社诚邀吴诗玉教授,结合他多年语言研究的经验,写作并出版了这本《R在语言科学研究中的应用》,以飨读者。本书内容有如下精彩之处:


1.引入个案,偏重应用。这本书是在一个个研究个案中讲述R,不是简单地罗列各种R函数的功能。这本书偏重应用,更多关注R+语言研究的各种可能性,R如何匹配语言研究的需求,R计算的逻辑原理,语言研究设计如何使用不同的函数组合,规避可能出现的无效计算等等,都是实实在在的一手经验,旨在让读者在研究中理解R,在个案中理解语言实验设计的要领。可以说,这本书将R与语言研究做了精妙的结合。

2.系统完整,科学高效。本书对语言研究前的实验数据设计,研究中的数据计算和解析,以及实验结果的可视化,结合不同个案,都做了系统完整的阐述。大多数语言研究者对于数据科学的了解都比较入门,本书针对这种情况,对数据计算的内涵、偏差、结果检验等进行了深入浅出的讲述,旨在让读者高效学习,快速上手,在研究中不断增进对R和语言研究的理解。可以说,这本书可以让读者边学边做,边做边参考。

3.复杂内容,清晰解析。R+语言研究是一个庞杂的叙述对象,不可能在一本200多页的书里说尽道明。本书作者梳理了多年积累的语言实验经验,以语言实验的典型个案为主线,穿插讲述R和语言研究的关键要素,简单明了,易于理解。对于不同研究目的、出于不同实验阶段可能产生的问题,本书采取问题导向的方案,就问题讲述错误原因,就问题阐述解决方案。全书没有大篇幅难懂的内容,也没有旁枝末节的分散内容。面对R+语言研究内容的层峦叠嶂,读者可以获得“轻舟已过万重山”的阅读体验。

语言研究不断演进,新工具是重要的助推器。期待这本书能够帮助到更多语言研究者,通过R自由穿梭在语言研究的各个角落,探索更深入、更广阔的语言世界。


作者:吴诗玉教授
书号:9787030694119
出版社:科学出版社 
出版时间:2021-10-01
定价:88元


内容简介





R是天生的数据分析利器,因其在统计建模和数据可视化方面的优势,它被越来越多的语言学者熟知和使用,已经成为应用语言学、心理语言学、实验语音学等研究者青睐的重要研究工具。本书在语言学量化研究视域下主要介绍了四个方面内容:①“干净、整洁”的数据框的标准;②基于ggplot2的语言数据可视化;③NHST的原理,即如何在语言研究中实现从样本到总体;④统计推断的多种应用。本书从训练数据框操作能力入手,在介绍这四个方面内容时,首先着力解决一些关键概念的理解问题,然后提供大量实例,把关键概念付诸具体应用。比如,在介绍数据框操作时,既有语言研究中常用的问卷数据处理,也有大量的反应时行为数据(E-prime)处理,这些数据都是基于笔者真实的语言研究项目。每项研究都会涉及上述四个方面内容,因此形成了一些可供后续使用的经验。




本书目录

前言

本书使用说明
第 1 章 R 数据科学:数据框的操作 1
1.1 干净、整洁的数据框的标准2
1.2 熟练地使用数据框操作函数8
1.2.1 gather( )和 spread( )的用法8
1.2.2 separate( )和 unite( )的用法 13
1.3 一些基础正则表达式的知识 21
1.4 数据表合并 32
1.4.1 传统的变长或变宽的表格合并 32
1.4.2 生成新变量的表格合并 37
1.4.3 不生成新变量的表格合并 43
1.4.4 集操作46
1.5 数据框运算和操作的五个函数 49
第 2 章 数据框操作实例:问卷数据处理 56
2.1 案例一:汉语第三人称代词的可接受度判断实验56
2.1.1 背景56
2.1.2 材料56
2.1.3 程序58
2.1.4 数据清洁和整理 59
2.1.5 利用最终数据进行描述统计 67
2.2 案例二:英语第三人称代词的可接受度判断实验71
2.2.1 背景71
2.2.2 材料73
2.2.3 程序74
2.2.4 数据清洁和整理 75
2.2.5 利用最终数据进行描述统计 87
第 3 章 数据框操作实例:反应时行为数据处理 91
3.1 背景92
3.1.1 被试92
3.1.2 材料93
3.1.3 程序94
3.2 E-prime 数据清洁和整理 94
3.3 RStudio 数据清洁和整理99
3.4 总结 113
第 4 章 概率分布 114
4.1 介绍 114
4.2 离散变量分布 116
4.3 连续变量分布:正态分布, t 分布、 F 分布和χ2分布120
4.3.1 正态分布 120
4.3.2 t 分布、 F 分布和χ2分布 128
第 5 章 假设检验的原理 133
5.1 正态分布视域下的 NHST 134
5.2 t 分布、 F 分布以及χ2分布视域下的 NHST141
5.3 总结 148
第 6 章 ggplot2 作图151
6.1 与实验数据关联的作图知识152
6.1.1 基础图形语法 152
6.1.2 分页 164
6.1.3 着色 176
6.1.4 图例修改 183
6.2 实验数据之外的作图知识188
6.2.1 theme 系统189
6.2.2 坐标体系、注解和绘制函数198
第 7 章 实验设计、 t 检验、方差分析和回归模型 203
7.1 实验研究和实验设计203
7.1.1 描述性研究 203
7.1.2 相关研究 204
7.1.3 界定变量之间关系的研究206
7.1.4 实验设计 208
7.1.5 拉丁方实验设计 211
7.2 t 检验 214
7.2.1 单样本 t 检验214
7.2.2 独立样本 t 检验218
7.2.3 配对样本 t 检验220
7.2.4 t 检验的效应量 222
7.2.5 t 检验的统计假设的前提 226
7.3 方差分析 226
7.3.1 独立测量的单向方差分析227
7.3.2 重复测量的单向方差分析230
7.3.3 多自变量方差分析 235
7.4 统计模型 242
7.5 总结 245





作者简介




吴诗玉,上海交通大学外国语学院教授、博士生导师。主要研究方向为应用语言学(二语习得(认知心理过程,外语教学,第二语言加工(语音及篇章));心理语言学;擅长使用R进行数据处理( 数据可视化、统计建模和文本挖掘),多变量回归分析等。出版著作5部,在国内CSSCI以及国际SSCI期刊上共发表近40篇研究论文,主持国家社科基金项目等科研项目多项。







识别上方二维码购买

            



  

欢迎点击下方关注公众号,获取最新交流群二维码


选题宝国家社科申报线上培训

语言学专场

直播时间:12月5日


综合编辑:应用语言学研习

微信公众平台审核:梁国杰

科研助力

文献综述的目的及写作方法指南
申报2022年度国家社科项目,该如何准备?

2022年度教育部人文社科项目申报线上培训——语言学专场

教育部人文社科项目申报书填写+立项案例

线上课程 | 人文社科研究方法——质化、量化、混合研究方法

慕课资源 | 兰卡斯特大学:语料库语言学方法、分析与阐释


文献延伸阅读(研习人指引)

本平台友情整理相关文献索引链接

欢迎感兴趣的朋友按需选购





科研助力

扫码享限时特惠!


清华大学教授、博导主讲,限时特惠!

2022年度教育部人文社科项目申报线上培训——语言学专场
教育部人文社科项目申报书填写+立项案例
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点

友情推荐

点击左下方阅读原文,发现更多语言学好书!

出版社官方包邮直销!扫码查看详情

推荐阅读:
推荐 | 文献综述高分模版
2022年度教育部人文社科项目申报线上培训——语言学专场
干货 | 写文献综述的28个要点
直播预告 | “英华学者云上大讲堂”即将开幕!(共30讲,外语界领军学者系列讲座)
语言学、外国文学CSSCI来源期刊(含扩展版)(2021-2022)投稿方式汇总
申报2022年度国家级课题,该如何准备?
词汇合集 | 中国重要时政术语英译报告(2020年度)
新出!《外语教学与研究》2021年第5期目录
新出!《中国外语》2021年第5期目录
《外语教学》2021年第6期目录
李宇明 | 试论个人语言能力和国家语言能力
How to get 教育部人文社科基金项目
学术界经常接触的模糊概念subject, discipline, area, topics, problem, question,issue
新书推荐 |《当代西方修辞学之管窥》(30周年纪念版)
世界五大大学排行榜均已发布,2021年中国高校排名如何?
Noam Chomsky | Mind Your Language
Rod Ellis独家专访:任务型语言教学及其在中国的挑战(全文)
讲座 | 定性研究方法及论文写作(清华大学教授、博导主讲)
2021软科中国最好学科排名(中国语言文学 & 外国语言文学)
224本CSSCI期刊最新便捷投稿方式汇总(综合社科、高校学报类)
预告 | “北外英语讲堂”系列活动
文献综述 | 选文献、读文献、写综述的原则与方法
会议通知 | 第三届话语、认知和社会高层论坛
"我因多年的冷漠而无法入睡,都是因为我读了一点诺姆·乔姆斯基"
王定华:关于开展国别区域研究的若干思考
讲座专栏 | 教育部人文社科项目申报书填写+立项案例
国别区域相关×2021年度国家社科基金后期资助项目立项公示名单
资源|网络上那些轻松愉快的语言学课程(值得收藏)
推荐 | 一文讲清国家社科基金和教育部人文社科项目
最新 | 北京大学出版社语言学书单(附:即出新书预告)
近五年国家社科中华学术外译项目立项名单及2021年推荐选题目录
刊讯 |《现代外语》2022年第1期目录、摘要及稿约
课题研究方案、立项申报书、开题报告的联系和区别
讲座视频 | 认知语言学导论(9):认知语法
课程视频 | 认知语言学导论(6):概念整合
聚焦 | 国家社科基金:盲评、会评大揭秘
孔子语录英文版(理雅各 译),值得珍藏!
Google学术搜索使用方法及技巧Google学术来啦——最新免费镜像
2021年度国家社科基金项目公示(外国文学、语言学、翻译学)
我国区域与国别研究的现状和愿景(钱乘旦 汪诗明 张倩红)
《外语教学与研究》2021年第5期目录
“新文科”怎么搞?12所大学新文科建设典型案例汇总!
名单:C刊来源期刊目录(2021-2022),附快速查询通道!
于洋 姜飞:国际跨文化传播研究新特征和新趋势
最全3000个常见公共场所英语标示!(国家英文译写规范/收藏版)
CSSCI南大核心来源期刊目录(2021-2022) 学科分类版
学科分类版 | CSSCI扩展版来源期刊目录(2021-2022)
Michael Farrelly | 再论批评话语分析中的「互文性」
推荐 | 160个学术电子书下载数据库网站(部分网址已更新)
推荐 | 在家也能免费下载知网等文献的10种方法
莫言:翻译家功德无量
翻译要忠实于原文吗?这是个问题
冯全功 | 翻译忠实观:争议与反思
《外国语》2021年第4期目录、摘要
收藏 | 公文写作常见错误更正对照表!
复旦教授:人文社科类学生还是要老老实实读经典(外一篇)
特别推荐 | 语料库方法技术
2021第九版北大核心期刊目录(语言学、文学、综合性学报)
陆俭明:语言研究要与未来接轨
我国二语写作研究的若干重点问题 |《外语教学与研究》2021(4)
收藏 | 国内外好用的语料库资源汇总
C 刊中常用的 107种人文社科研究方法
王学典:何谓“新文科”?
郭英剑 | 新文科与外语专业建设
期刊《认知语言学》近20年数据简析(2000-2021)
王俊菊:新文科建设对外语专业意味着什么?
《现代外语》2021年第4-5期目录
胡钦谙 顾曰国 | 计算语言学研究70年
视频 | Tony McEnery:语料库与批评话语分析 前沿讲座
视频 | Paul Baker: 语料库与话语研究 前沿学术讲座
刘海涛:关于自然语言计算机处理的几点思考
人工智能的诗与远方,一文读懂NLP起源、流派和技术(外一篇)
关注人工智能时代的语言学研究(外一篇)| 中国社会科学网
原版引进 | 德古意特认知语言学研究丛书+应用丛书(13种
CSSCI来源期刊最新总目录(含扩展版,2021-2022),建议收藏!
陈平:语言学的一个核心概念“指称”问题研究
黄国文 | 新文科与外语教育——从“术”与“道”的 关系谈起
蔡基刚 | 学科交叉:新文科背景下的新外语构建和学科体系探索
陈平 | 话语的结构与意义及话语分析的应用
书讯 | Routledge Handbook of Cognitive Linguistics 文旭&Taylor主编
图解 | 语言研究的哲学基础与理论渊源
新文科建设的理路与设计
访谈视频 | Dan Jurafsky:AI 如何改变我们对语言的理解
徐赳赳 | 篇章语用研究70年
王文斌 柳鑫淼:关于我国外语教育研究与实践的若干问题
戴炜栋 胡壮麟 王初明等:新文科背景下的语言学跨学科发展
国外语言学学科眼动研究: 现状与前瞻( 1934-2020)
神经语言学国际热点与趋势的科学知识图谱分析

扫码关注↑↑↑ 即可获取最新入群二维码!

目前已有 4.6 万语言文学、区域国别与

跨文化传播学研习者关注本公号

欢迎加入交流群,分享学习,共同进步!

亲爱的研习人,

一起来点赞、在看、分享三连吧!

一个,点亮在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存