第一届数据科学与二语研究国际研讨会
求真、务实、共享
会议通知:受疫情影响,原定于2022年10月15日召开的“第一届数据科学与二语研究国际研讨会”将推迟至2022年11月18-20日在宁波财经学院召开。此次大会,我们将邀请国内外著名学者进行主旨发言,同时邀请各个领域的专家前来参会、交流。在大会正式开幕前,将召开国际期刊Journal of Second Language Studies“数据科学和二语研究专业委员会”筹委会会议。本次大会既会对数据科学与二语研究相结合的一般话题进行研讨(见后文),也将针对混合效应模型在二语研究中的应用、数字语言学习(DLL,digital language learning)以及文本挖掘与话语研究展开专题研讨。国际著名人文社科出版社John Benjamins将对本次会议进行资助,为最佳论文(研究)展示和最佳海报的获胜者提供免费订阅的机会,并颁发奖状和奖品。优秀稿件还将推荐至Journal of Second Language Studies发表。我们将邀请国内国际的专家作主旨发言,并主持专题研讨。已经确定参会专家有:Ping LiThe Hong Kong Polytechnic UniversityScott A. CrossleyGeorgia State UniversityLuke PlonskyNorthern Arizona UniversityClarence GreenFederation University Australia陈莹 南京理工大学
蔡金亭 上海财经大学
陈飞 湖南大学
邓耀臣 大连外国语大学
丁红卫 上海交通大学
龚箭 江苏科技大学
黄燕 南京大学
金檀 华南师范大学
雷蕾 上海外国语大学
卢春明 北京师范大学
王路明 浙江工业大学
王敏 浙江大学
王琦 宁波财经学院
吴燕京 宁波大学
吴诗玉 上海交通大学
徐晓东 南京师范大学
于翠红 烟台大学
姚剑鹏 宁波工程大学
张晓鹏 西安交通大学
欢迎大家积极投寄研究论文摘要和海报,本次会议将专辟海报呈现空间。投寄方式见后文。
1. 语料观测数据与二语研究,包括但不限于:
(1)语料库与二语研究;
(2)文本挖掘技术、自然语言处理与二语研究;
(3)计量语言学与二语研究;
(4)自然语言处理、翻译及话语研究。2. 实验数据与二语研究,包括但不限于:
(1)问卷与语言测试数据与二语(习得)研究;
(2)反应时行为数据与二语理解、加工研究;
(3)眼动行为数据与二语理解、加工研究;
(4)脑电数据与二语理解、加工研究;
(5)数据科学与二语语音学研究;
(6)眼动行为数据与口笔译加工研究;
(7)脑电数据与口译加工研究;
(8)脑成像与二语研究。
3. 数字化语言学习(DLL)及教学,包括但不限于:
(1)数字化语言学习和教学的理论构想及实践;
(2)现代信息技术和数字化语言学习;
(3)数字化语言学习的行为、认知和脑机制。
本次大会包括以下环节:
主旨发言
分组研讨
海报展示
圆桌论坛此外,我们还将根据议程的安排,在本次会议举办主编论坛,邀请国内外主编就数据科学及期刊责任等话题跟大家展开对话和互动。欢迎大家积极投寄研究摘要。同时,本次会议将专辟海报呈现空间,为海报呈现提供包括设计和打印等一切便利。
主办单位:Journal of Second Language Studies
承办单位:宁波财经学院协办单位:John Benjamins出版社科学出版社会议时间:2022年11月18-20日会议地点:宁波财经学院大会联系方式:张淑珍:13777098865王芳芳:15257896673投稿邮箱:56694196@qq.com
Journal of Second Language Studies
总主编:
Boping Yuan | University of Cambridge, UK
执行主编:
Shiyu Wu | Shanghai Jiao Tong University, China
Hui Chang | Shanghai Jiao Tong University, China
助理编辑:
Yanjiang Teng | Michigan State University, USA
The Journal Homepage:
https://benjamins.com/catalog/jsls
Submission Website:
https://www.editorialmanager.com/jl2s
Email: jsls2016@126.com
—— END ——
内容简介
R是天生的数据分析利器,因其在统计建模和数据可视化方面的优势,它被越来越多的语言学者熟知和使用,已经成为应用语言学、心理语言学、实验语音学等研究者青睐的重要研究工具。本书在语言学量化研究视域下主要介绍了四个方面内容:①“干净、整洁”的数据框的标准;②基于ggplot2的语言数据可视化;③NHST的原理,即如何在语言研究中实现从样本到总体;④统计推断的多种应用。本书从训练数据框操作能力入手,在介绍这四个方面内容时,首先着力解决一些关键概念的理解问题,然后提供大量实例,把关键概念付诸具体应用。比如,在介绍数据框操作时,既有语言研究中常用的问卷数据处理,也有大量的反应时行为数据(E-prime)处理,这些数据都是基于笔者真实的语言研究项目。每项研究都会涉及上述四个方面内容,因此形成了一些可供后续使用的经验。
本书目录
前言
本书使用说明
第 1 章 R 数据科学:数据框的操作 1
1.1 干净、整洁的数据框的标准2
1.2 熟练地使用数据框操作函数8
1.2.1 gather( )和 spread( )的用法8
1.2.2 separate( )和 unite( )的用法 13
1.3 一些基础正则表达式的知识 21
1.4 数据表合并 32
1.4.1 传统的变长或变宽的表格合并 32
1.4.2 生成新变量的表格合并 37
1.4.3 不生成新变量的表格合并 43
1.4.4 集操作46
1.5 数据框运算和操作的五个函数 49
第 2 章 数据框操作实例:问卷数据处理 56
2.1 案例一:汉语第三人称代词的可接受度判断实验56
2.1.1 背景56
2.1.2 材料56
2.1.3 程序58
2.1.4 数据清洁和整理 59
2.1.5 利用最终数据进行描述统计 67
2.2 案例二:英语第三人称代词的可接受度判断实验71
2.2.1 背景71
2.2.2 材料73
2.2.3 程序74
2.2.4 数据清洁和整理 75
2.2.5 利用最终数据进行描述统计 87
第 3 章 数据框操作实例:反应时行为数据处理 91
3.1 背景92
3.1.1 被试92
3.1.2 材料93
3.1.3 程序94
3.2 E-prime 数据清洁和整理 94
3.3 RStudio 数据清洁和整理99
3.4 总结 113
第 4 章 概率分布 114
4.1 介绍 114
4.2 离散变量分布 116
4.3 连续变量分布:正态分布, t 分布、 F 分布和χ2分布120
4.3.1 正态分布 120
4.3.2 t 分布、 F 分布和χ2分布 128
第 5 章 假设检验的原理 133
5.1 正态分布视域下的 NHST 134
5.2 t 分布、 F 分布以及χ2分布视域下的 NHST141
5.3 总结 148
第 6 章 ggplot2 作图151
6.1 与实验数据关联的作图知识152
6.1.1 基础图形语法 152
6.1.2 分页 164
6.1.3 着色 176
6.1.4 图例修改 183
6.2 实验数据之外的作图知识188
6.2.1 theme 系统189
6.2.2 坐标体系、注解和绘制函数198
第 7 章 实验设计、 t 检验、方差分析和回归模型 203
7.1 实验研究和实验设计203
7.1.1 描述性研究 203
7.1.2 相关研究 204
7.1.3 界定变量之间关系的研究206
7.1.4 实验设计 208
7.1.5 拉丁方实验设计 211
7.2 t 检验 214
7.2.1 单样本 t 检验214
7.2.2 独立样本 t 检验218
7.2.3 配对样本 t 检验220
7.2.4 t 检验的效应量 222
7.2.5 t 检验的统计假设的前提 226
7.3 方差分析 226
7.3.1 独立测量的单向方差分析227
7.3.2 重复测量的单向方差分析230
7.3.3 多自变量方差分析 235
7.4 统计模型 242
7.5 总结 245
作者简介
吴诗玉教授具有丰富的心理语言学以及二语习得实证研究经验,是ESCI检索期刊Journal of Second Language Studies的联合执行主编,在SSCI和CSSCI期刊上发表了许多心理语言学以及二语习得方面的实证研究论文。出版著作5部,在国内CSSCI以及国际SSCI期刊上共发表近50篇研究论文,主持国家社科基金项目等科研项目多项。
长按二维码
即刻购买本书
科学出版社
心理语言学线上论坛| Xingcheng Ma 博士、Cynthia Siew 教授讲座