查看原文
其他

学术观点|鲍贵:应用语言学数据分析贝叶斯转向

通讯君 语言学通讯 2021-05-15

点击蓝字关注我们


应用语言学数据分析贝叶斯转向

鲍贵 

南京工业大学外国语言文学学院  

摘 要:贝叶斯统计利用现有数据更新对模型参数先验分布的不确定性,推导更有确定性的参数后验分布,克服常规统计分析方法存在的局限。本文介绍贝叶斯统计基本原理和概念,指出贝叶斯统计与常规统计的主要区别。利用真实数据说明如何使用贝叶斯统计方法比较配对组样本和独立组样本,以及如何开展简单线性回归分析。本文建议应用语言学研究者更新统计思维方式,学会使用贝叶斯统计方法探索理论与实践问题。

关键词:贝叶斯统计方法; Gibbs抽样方法; 模型设置; 95%高密度区间; 实际对等域; 

作者简介::鲍贵,博士,教授。研究方向:应用语言学,应用统计学

学习文献:鲍贵.应用语言学数据分析贝叶斯转向[J].外语研究,2019(4):16-23.

鲍贵教授代表作《二语习得研究中的常用统计方法》扫码即可购买

专著推荐 | 如何做定量研究?手把手教你使用SPSS《二语习得研究中的常用统计方法》

《理解与评价应用语言学实验研究》扫码即可购买

专著推荐 | 鲍贵:《理解与评价应用语言学实验研究》

如需购买发票,请务必在每一笔订单的留言处备注抬头税号和email 否则无法收到电子发票

本文获得期刊独家授公众号推广

科研助力 | John Benjamins 出版社应用语言学国际期刊投稿及订阅方式

0

引言

统计方法是应用语言学研究方法论的重要组成部分。统计方法的恰当与否直接影响统计结论的效度。应用语言学研究一直以常规统计方法为主导,如t检验和方差分析。这些常规方法需要满足一些统计假设,如正态分布和方差齐性,而实际研究中的数据往往不能满足若干统计假设。有些研究者开始提倡和使用稳健(robust)统计方法(Larson-Hall 2012;鲍贵2017a, b)。稳健统计方法是对传统统计分析方法的改进,但是它们都是频率派(frequentist)方法,在统计分析的理念和程序上是一致的,如利用零假设显著性检验(the null hypothesis significance test, NHST)和p值。

近几年来,在应用语言学领域出现了一种新的统计思维动向,倡导和使用贝叶斯方法(Bayesian methods) (Gudmestad, House&Geeslin 2013;Sorensen, Hohenstein&Vasishth 2016;Morgan-Short et al.2018;Norouzian, de Miranda&Plonsky 2018, 2019)。贝叶斯统计学为我们提供不同于传统统计学的统计思维方式和数据分析方法,而且在很多方面都凸显出优势(Dienes 2011;Kruschke, Aguinis&Joo 2012;Kruschke 2013)。我国应用语言学研究者对贝叶斯统计学知之甚少,有必要了解甚至在未来研究中使用贝叶斯统计方法。本文重点介绍贝叶斯统计基本原理和概念,指出贝叶斯统计与传统统计存在的一些主要区别,通过实例说明如何使用贝叶斯方法开展应用语言学数据分析。

01

统计分析的贝叶斯方法

1.1 贝叶斯定理和参数后验分布

贝叶斯统计的目标是利用现有数据更新对模型参数先验(prior)分布的不确定性,推导更有确定性的参数后验(posterior)分布。贝叶斯推理依据贝叶斯定理(Bayes’Theorem, Bayes’Rule,又译作贝叶斯公式)。贝叶斯定理为:p(θ|D)=p (D|θ)p(θ)/p (D),其中“|”表示条件分布,p(θ|D)是后验分布,即在样本数据D已知的条件下参数θ的分布。p (D|θ)是似然函数(likelihood function),表示在先验分布参数θ已知的条件下D的分布。p(θ)是参数θ的先验分布,体现研究者在得到数据之前已有的信息。p (D)是数据的边缘似然(marginal likelihood)。如果变量是离散性的(discrete),则p (D)=∑θp (D|θ)p(θ),即在各个参数θ值上的累计p (D|θ)p(θ)值。如果变量是连续性的(continuous),则边缘似然值的计算由累计变为求积分,即p (D)=∫dθp (D|θ)p(θ)。p (D)又叫作规范化常数(normalizing constant),其作用是对后验密度(posterior density)进行尺度化(使密度积分为1)。因此,贝叶斯定理又可以简化为:p(θ|D)∝p (D|θ)p(θ),其中∝表示“与……成正比”。

利用贝叶斯简化公式,只要知道参数先验分布和似然函数,便可得到与后验分布呈正比的表达式。但是,如果要绘制后验分布图,就必须用到规范化常数,以确保密度曲线下的面积为1。如果先验分布为非共轭先验分布(nonconjugate prior distribution,指先验分布与后验分布不属于同一类参数分布),后验密度不属于可识别的分布族,则规范化常数必须通过积分得到(Cowles 2013:112)。在模型复杂的情况下,对于连续性参数进行分析式积分求解很难,甚至不可能。马尔可夫链蒙特卡罗(Markov chain Monte Carlo, MCMC)算法通过模拟接近参数后验分布,绕开直接计算积分的问题。当然,MCMC算法也可以用于近似计算积分。“蒙特卡罗”指随机抽样过程。“马尔可夫链”是一个随机过程(stochastic process,按照序列生成随机值),其属性是:在时间序列点t上向任何新的状态转移的概率只依赖于当前状态θ[t],因此在条件上独立于前期值:θ[0],θ[1],…,θ[t-1](Gill 2015:334)。当马尔可夫链的运行达到平稳状态的时候,便得到我们所需要的参数后验分布。

在近30年里,MCMC算法的快速发展催生出现代贝叶斯方法,使贝叶斯统计学臻于成熟。MCMC算法有多种,如Metropolis算法(the Metropolis algorithm)、Metropolis-Hastings算法(the Metropolis-Hastings algorithm;M-H算法)和Gibbs抽样方法(the Gibbs sampler) (Lynch2007;Ntzoufras 2009;Kruschke 2015)。M-H算法是Metropolis算法的推广,而Gibbs抽样方法可以看作是更一般性的M-H算法的一个变体。

1.2 贝叶斯统计与常规统计比较

贝叶斯统计与常规统计的主要区别之一是对总体参数和概率的看法。常规统计将观测数据视作随机变量值,参数(如总体平均数)视作一个固定值,采用频率派方法将概率定义为事件长期发生的相对频率。贝叶斯统计将观测数据视作固定值,参数视作随机变量,概率体现为主观上对事件的不确定性。在贝叶斯派看来,参数是否为固定值无关紧要,因为我们对其真实值抱有不确定性。赋予参数空间(parameter space)一个概率分布是合理的,因为它反映我们对参数真实值的不确定性(Lynch 2007:71)。

对总体参数和概率的不同看法引发另一个重要区别:95%置信区间(confidence interval, CI)和95%高密度区间(the highest density interval, HDI)。二者区别以总体平均数(参数)差异为例。在频率派方法中,95%置信区间从样本数据直接计算得到,提供总体平均数差异一个合理区间的两个端点,但是它不是概率分布,我们不知道哪个点更有可能是参数差异值。95%置信区间只是表明,通过反复开展同样研究得到的总体平均数差异95%置信区间中,大约有95%的置信区间包括总体平均数差异。针对一次研究得到的95%置信区间,它要么包括总体平均数差异,要么不包括总体平均数差异,因而不能将95%置信区间理解为包括总体平均数差异的概率是95%。在贝叶斯方法中,95%高密度区间由MCMC过程中的数千步(steps)或迭代(iterations)构建,每一次迭代生成一个总体参数或参数组合。95%高密度区间是概率分布,是可信区(credible region),区间内所有点(代表参数值)的概率密度(probability density)均大于区间外各点的概率密度,每个点都代表各个参数值的相对合理性或可信度。总体平均数差异的95%高密度区间表示该区间包括总体平均数差异的概率为95%。这正是我们想要的结果。相对于95%置信区间,95%高密度区间提供更多的参数(或参数差异)信息,提供更清晰的不确定性情形,结果的解释也更具有直接性。以上论述揭示两类区间的一个重要区别:95%置信区间是随机的,参数是固定的;而在观测数据已知的情况下,95%高密度区间是固定的,参数则是随机的。

第三个重要区别在于推理方法。贝叶斯统计提供完整的参数后验分布,因而能为统计决策提供丰富的信息。我们能够利用直方图和描述性统计量检查参数的整个后验分布,判断哪些范围内的参数值更有可能,哪些范围内的参数值不太可能(Stanton 2017:71)。常规统计利用零假设显著性检验对参数的点估计(point estimate)开展推理统计,依赖统计显著性概率(p)值得出结论。显著性概率的计算利用检验统计量(如t值)的理论抽样分布(如t分布)。确如Stanton (ibid.:83-84)所言,开展小样本研究的研究者都知道增加或去除几个观测值会使p值变为0.049或0.051。按常规,显著性水平α设为0.05, p=0.049导致拒绝零假设,p=0.051则导致不拒绝零假设。由于发表偏差(publication bias)的影响,得到p=0.049的研究可能会被发表,而得到p=0.051的研究可能会被扔进垃圾堆。Nuzzo (2014)指出学术研究p值黑客(篡改)现象(p-hacking)。从历时的角度来看,开展和发表科学研究的体制推动研究者去寻求统计显著性,而不是去深入理解数据揭示的意义;学术编辑和审稿者坚持p<0.05是魔数(magic number),于是研究者设计与开展研究,追求统计显著性这个目标(Stanton 2017:84)。在大数据时代,得到一个包括上千个观测值的样本越来越容易。在样本量很大时,即便比较组之间平均数差异很小,也几乎总是能够得到统计显著性结果。这意味着在大数据时代p值大大失去作用,也意味着效应量(effect size)的报告必不可少。

贝叶斯统计与常规统计的第四个主要区别在于如何利用先验信息。在常规的统计分析中,我们几乎总是忽略先验信息。譬如,在常规的平均数差异t检验中,即便理论或前期研究有证据表明,总体平均数存在差异,常规统计总是以总体平均值差异等于零为前提。贝叶斯统计更具有灵活性,尽可能利用先验信息。在贝叶斯统计中,先验分布有两种:无信息(non-informative)或模糊(vague)先验分布和有信息(informative)先验分布。当参数先验分布未知时,我们将先验分布设得很宽泛,使之对后验分布没有影响或影响很小。如果根据某个理论、研究经历或相关文献得到参数的若干信息,则可以借此设定更有意义的参数先验分布。不管先验分布为何种性质,贝叶斯分析均可对研究假设直接进行检验。在模型中包括先验信息是贝叶斯分析的一大优势,体现科学研究证据的累积性。关于这方面的例子,可参见Norouzian et al. (2018)。

在贝叶斯分析中,我们还可以利用实际对等域(region of practical equivalence, ROPE)做出切合实际的统计推论。实际对等域是指与零假设值实际对等的取值范围。在常规的t检验中,零假设显著性检验只能检验总体平均值差异正好为零的零假设。这种假设通常没有太大的意义,因而也是零假设显著性检验的一个缺陷,因为很少有两个总体的平均数恰好相同。在贝叶斯统计中,则可以围绕零值设定一个有意义的实际对等域,计算其中包含零假设之值的概率。譬如,如果我们认为两个任务条件下的词汇记忆效果相差在1分以内没有教学意义或实际意义,在开展贝叶斯分析时就可以限定一个实际对等域。对于非常重视研究成果应用价值的应用语言学研究来说,实际对等域比常规的零假设检验更有利于决策。

02

贝叶斯统计方法在应用语言学研究中的应

本节利用真实数据介绍贝叶斯分析方法在应用语言学中的应用。第一小节利用简单的Gibbs抽样方法估计正态分布平均数μ和标准差σ的后验分布。后两节介绍两个独立组比较和简单线性回归分析稳健贝叶斯估计方法。稳健贝叶斯估计方法的依据是Kruschke (2015),参考数据包为DBDA2Eprograms。利用统计软件R 3.5.2 (R Core Team 2018)生成后验分布MCMC样本使用的数据包为rjags(程序为Just Another Gibbs Sampler, JAGS)。

2.1 配对样本平均数差异和标准差贝叶斯估计

Gibbs抽样方法为多元分布问题而设计。在参数条件分布已知但是联合分布(joint distributions)未知的情况下,这种抽样方法尤其有用。我们利用参数条件分布构造马尔可夫链。参数μ的先验分布为正态分布,记作N(μ0,σ02)。σ2的先验分布为逆伽马分布(inverse gamma distribution),记作IG(α0,β0),其中α0和β0分别是形状和比率参数。我们需要计算Gibbs抽样所需的条件分布f(μ|σ2, y)和f(σ2|μ,y)。根据Ntzoufras (2009:73),参数μ的后验条件分布为,其中“~”表示某个值随机抽样自一个分布,为样本平均数,n是样本量,权重值

笔者收集的英语学习者(n=35)口语和书面语文本句法长度(操作定义为每个T单位包括的词数)差异测量结果如下:

本例模拟样本量(即迭代数)设为50000,包括预烧期(burn-in period)迭代数。使用预烧期的目的是避免初始参数值对后验参数分布的影响。预烧期生成的样本从最终生成的代表性后验样本中剔除出去。在贝叶斯分析中,确定先验分布至关重要。结合本例,我们没有先验理由认为英语学习者口语和书面语文本句法长度存在系统差异,因而选择μ0=0。我们对μ的先验分布很不确定,将σ0设为一个异常大值(如样本标准差的100倍)。σ2的先验分布采用无信息先验分布,将α0和β0均设为一个异常小值(如α0=β0=0.001)。我们有意将Gibbs抽样过程中的初始值σ[0]设成大值(如σ[0]=10),检查MCMC算法的收敛(convergence)速度。

根据Gibbs抽样方法、先验参数值和初始值,利用R软件执行程序编码,得到μ和σ的后验分布样本。图1显示参数初始值σ0和每次迭代生成的μ值和σ值。

图1是后验参数值轨迹图(trace plots)。除初始值σ0外,两个分图像肥胖的毛毛虫,黑色越深的区域表示参数值越集中,最具有代表性的差异平均数在-1左右,最有代表性的标准差在2左右。图1表明,Gibbs算法迅速收敛到参数后验分布。尽管初始值σ0值很大,但是在第一次迭代后σ值就已接近平稳状态。

图2是根据后期25, 000次迭代得到的参数后验分布直方图。如图所示,差异平均数和差异标准差最有代表性的参数值分别为众数(modes)-0.80和2.08。从这两个值来看,学习者口语文本的句法长度略低于书面语文本的句法长度,句法长度差异在学习者之间存在一定程度的变化性。每个分图中的两条竖直虚线涵盖的区间为95%高密度区间。虽然总体平均数差异95%高密度区间不包括零值,但是下限值(-0.08)接近零值,至少说明总体平均数差异不够明显。

2.2 两个独立组比较贝叶斯推理

本节以两个独立组(观测值为连续性变量值)比较为例简要介绍贝叶斯推理方法。笔者将60名被试随机分配到包括14个目标词(生词)的英语短文阅读附带词汇学习任务中。生词音标、词类和释义在阅读短文中给出。一个任务组为翻译组(translation group),在阅读短文后,完成句子英译汉任务。这些句子为短文中出现的、包括目标词的原句。另一个任务组为造句组(sentence writing group),在阅读同一篇短文后,仿照短文中出现的、包括目标词的原句用目标词造句。两组在同样时间内完成各自的任务后,接受生词知识(包括拼写辨认和汉语释义)即时测试,卷面满分为28分。测试结果如表1所示。

我们的研究目的是调查翻译和造句任务在促进词汇知识习得方面是否存在差异。按照常规的统计思维,我们会采用独立样本t检验比较翻译组和造句组所在总体的平均数是否有差异。这一统计检验方法是我们所熟知的零假设显著性检验。本例的零假设是两个任务组所在的总体平均数(μ1和μ2)没有差异,即μ1=μ2。备择假设是两个任务组来自的总体平均数不同,即μ1≠μ2。常规的独立样本t检验发现,翻译任务(M=13.78, SD=4.19)在促进词汇知识习得方面显著不及造句任务(M=16.33, SD=4.58) , t (58)=-2.25, p=0.028<0.05, Cohen’s d=0.58(中等效应)。

利用MCMC算法开展贝叶斯分析的关键是模型设置(model specification)。图3显示两个独立组比较的一种模型,其中的各个图形提示各个参数对应的先验分布形状。

图3最底端的yi|j表示第j组(j=1, 2)第i个观测值。模型假设每个组观测值服从t分布,允许数据分布有少量异常值(outliers)。参数v是我们常见的t分布的自由度。同正态分布相比,自由度v较小时,t分布有较多的极端值;v值较大时(如30以上),t分布近似正态分布。因此,模型中的参数v用作正态性参数(normality parameter),以便更可靠地估计每组观测值的正态性。参数值为K的指数分布(exponential distribution)能够满足自由度v的分布要求。先验分布中的所有参数都必须设定。参数v的初始值设定为5。参数K的先验值设为1/30,指数分布的平均数即为30。模型设定每组观测值t分布的平均数(μj)服从平均数为M、标准差为S的先验正态分布。由于对先验参数分布很不确定,我们设定参数μj服从先验平均数M为合并组样本平均数(作为初始值),标准差S为合并组样本标准差×100的正态分布。先验参数σj服从下限值(L)为合并组样本标准差÷1000,上限值(H)为合并组样本标准差×1000的均匀分布(uniform distribution)。均匀分布呈扁平状,分布区间内所有先验参数值的概率密度相同(图3右上方显示为一个矩形),因而先验分布对后验分布没有影响或有很小的影响。设置很宽的均匀分布区间同样是为了表明我们对先验参数σj的不确定性。以上模型的设置允许各组观测值分布中有异常值存在,分布的标准差可以不同,因而利用本模型开展的贝叶斯分析具有稳健性。

贝叶斯模型实施(model implementation)通过MCMC算法从模型的后验分布中生成一个代表性的参数值大样本。根据这一样本,我们能够概括和推断参数分布的性质。为了避免初始设定的参数值对后验参数分布的影响,马尔可夫链的运行包括一个预烧期,预烧步数设为1000(也可以是其他值),将其结果从最终生成的代表性后验样本中剔除出去。本例翻译和造句任务比较贝叶斯统计分析的结果如图4所示。

图4上方两幅分图显示翻译和造句任务平均数联合后验分布。这两个分布近似呈正态分布,95%高密度区间有部分重合。翻译任务的众数(13.8)小于造句任务的众数(16.3)。图4左下图显示两个任务平均数差异分布的众数(2.66)、95%高密度区间(0.27-4.9)和实际对等域。本研究中两个任务平均数差异分布95%高密度区间不包括零值,说明造句任务在促进词汇知识习得方面好于翻译任务,与常规t检验得出的结论相同。需要提醒的是,不是在所有的情况下贝叶斯分析与常规分析得出的结论都会相同(Kruschke2013;Norouzian et al.2019)。

应用语言学研究,特别是二语习得研究,不仅强调研究发现的理论价值,而且还重视其应用价值。针对本例,如果我们打算在教学实践中应用以上发现,则需要考虑造句任务相对于翻译任务的优势是否不限于统计显著性,是否造句任务的优势足以让我们觉得更值得经常使用这类任务。实际对等域为我们提供了很好的决策依据。如图4左下图所示,在我们将两个任务条件下词汇习得的平均数差异在±1范围内作为实际对等域时,造句任务平均数与翻译任务平均数差异在±1之间的概率为8.6%。95%高密度区间内的部分参数值落在平均数差异实际对等域之内,部分参数值落在其外,因而在实际意义上不能得出确定性结论,即不能得出造句任务明显优于翻译任务的结论(决策方法参见Kruschke 2018:272)。右下图显示,本例效应值δ(计算公式如图下方所示)在0.05-1.14之间的概率为95%,最有代表性的效应量为δ=0.63,但是95%高密度区间较大,最小效应量值接近零值。效应量实际对等域为±0.1,包括2.9%的效应量分布。95%高密度区间内的大部分参数值落在效应量实际对等域之外,小部分参数值落在其内。因此,从实际意义出发,以上结果同样说明造句任务优于翻译任务的证据不足。注意,实际对等域因研究实际而定。两个总体平均数比较Cohen’sδ=0.2表示效应量小。在没有其他证据的情况下,不妨将Cohen’sδ=±0.1作为效应量零值的实际对等域。

2.3 简单线性回归分析的贝叶斯推理

本节简要介绍包括一个预测变量(X,连续性自变量)和一个效标变量(Y,连续性因变量)的简单线性回归贝叶斯分析。简单线性回归描述效标变量值随预测变量值变化的线性趋势。贝叶斯分析的一种建模方式如图5所示。

简单线性回归贝叶斯分析模型与两个独立组比较贝叶斯分析模型相似。图5显示,模型假设效标变量Y的观测值yi服从t分布,允许数据分布有少量异常值。t分布中的先验参数v服从先验参数值为K的指数分布。先验参数μi为回归模型预测值,μi=β0+β1Xi,其中β0是常数项(即截距项),β1是回归系数,Xi是预测变量X的第i个观测值。β0和β1的先验分布均为正态分布。先验参数σ的分布设定为均匀分布。

在运行马尔可夫链之前,将样本数据值标准化,使预测变量X和效标变量Y的平均值为0,标准差为1。在无信息先验分布情况下,参数v的初始值设定为5,参数K的先验值设为1/30。β0和β1的先验分布均设定为平均值为0 (M0和M1)、标准差为100 (S0和S1)的正态分布。设定如此大的标准差是为了体现对先验参数值的不确定性。尺度参数σ的先验分布是下限值(L)为1/1000、上限值(H)为1000的均匀分布。设置如此宽的均匀分布同样是为了体现对先验参数值的不确定性。

下面利用图5所示的贝叶斯模型分析笔者收集的数据。76名英语专业大学二年级学生参加全国英语专业四级测试和限时命题议论文写作。作文中的词汇复杂度操作定义为文中包含的常用2000词以外的低频词数与作文长度的比率(%)。这批学生的英语水平(用专业四级成绩代表)和词汇复杂度的测量结果如表2所示:

这项研究的主要目的是推断英语水平是否能够预测词汇复杂度。运行马尔可夫链得到截距项和回归系数联合后验分布样本。图6显示后验预测分布和95%高密度区间。

图6中的圆圈代表学习者英语水平和作文词汇复杂度测量数据,30条斜线为可信的回归线(regression lines)。各个观测点在回归线周围大致呈均匀分布,说明词汇复杂度分布较匀称,也说明本研究设定的模型是恰当的。各条回归线均正向倾斜,说明英语水平对词汇复杂度有预测力。回归线的变化显示,越是远离英语水平观测值,各条线之间的伸展度就越大,我们对作文词汇复杂度的预测值就越不确定。

图6中垂直绘制的噪音分布(noise distributions)为t分布。对于每个英语水平值,噪音分布提供各个可靠的预测值区间(即95%高密度区间)。据图显示,除个别观测值之外,绝大多数英语水平值都能够可靠地预测词汇复杂度值。

截距项和斜率参数后验分布如图7所示。图7左图为截距项后验分布,最有代表性的截距项估计为-4.56,但是95%高密度区间(-9.94-0.75)较大,且包括零值,说明截距项在回归中可能没有作用。右图为斜率后验分布,最有代表性的斜率估计值为0.2, 95%高密度区间不包括零值,有95%的斜率估计值介于0.12-0.27之间,说明英语水平对作文词汇复杂度有可信的预测力。我们设定的斜率实际对等域为±0.1。斜率估计95%高密度区间位于实际对等域之外,因而拒绝零假设之值(β1=0),表明英语水平对作文词汇复杂度有实际意义上的预测力。

03

结语

初次接触贝叶斯统计的研究者可能会认为贝叶斯统计分析繁琐,不如常规统计分析那样简单和易操作。尽管如此,我们应该认识到贝叶斯统计方法在探索理论问题和实际问题方面拥有的独特优势,如提供后验参数的整个分布和实际对等域。贝叶斯统计也迫使我们提出有意义的研究假设和参数先验分布,充分考虑统计分析中的模型设置,更直观、更有效地回答研究问题。

我们提倡更新统计思维方式,从贝叶斯视角提出并解决研究问题。这并不是要研究者完全放弃常规统计分析方法,而是希望研究者意识到常规统计分析方法存在的局限性。我们不反对采用常规统计分析方法的研究者将统计显著性作为研究发现有实际意义的最低标准,注重报告置信区间和效应量,但是我们更加鼓励使用贝叶斯统计方法,或者将贝叶斯和常规统计分析方法结合起来使用,多视角探索应用语言学理论与实践课题。

SPSS训练营

2019/10/24



2020年10月15日开营啦!

详情点击 科研助力 | 文科生也能学会SPSS! 第四期训练营等你来

专著推荐 | 张威《语料库口译研究》(外语学科核心话题前沿研究文库)

专著推荐 | 应用语言学研习丛书(13种)

专著推荐 |  “牛津社会语言学丛书” 9种

专著推荐 | 德古意特认知语言学研究丛书(13种)

专著推荐 | 国际知名学者 Langacker,Talmy,Geeraerts《国际认知语言学经典论丛》

专著推荐 |  商务英语教师学养丛书(15种)

专著推荐 |  外语教师教育与发展系列

专著推荐 | 新世纪英语语言文学界面研究丛书(6种)

专著推荐 | 《我们赖以生存的隐喻》中译本

专著推荐 | 张威《语料库口译研究》(外语学科核心话题前沿研究文库)

专著推荐| 刘迪麟《词汇和语法的描述与教学:基于当代语言学理论的学术研究与教学实践》

专著推荐 | 语料库+外语教学该怎么玩?

专著推荐 | 语料库+认知(隐喻)应该怎么玩?

专著推荐 | 语料库+语用学(话语分析)应该怎么玩?

专著推荐 | 语料库+翻译《技术与全球冲突时代背景下的翻译研究:Mona Baker文集》

专著推荐 |语料库+系统功能语言学:《基于语料库的语法、媒体和健康话语研究》

专著推荐 | 许家金 《语料库与中国英语学习者英语口语研究》

专著推荐 | 基于语料库的中国理工科大学生英语写作能力研究

扫码进入语言学通讯外文书店,可以购买国内外优秀学术著作。支持对公转账、可以开具电子或者纸质发票。如需人工客服请联系孙老师 18321711365 电话同微信

编者按

参考文献略,欢迎查阅《外语研究》2019年第4期纸质原文。

本文编辑:上海理工大学 孙雨

本文审核:吉林大学  王峰

郑重声明:本公众号推送的文章不能代表本公众号立场。本公众号推送的学术会议、博士招生不负责对接解释。有任何疑问请按照推送内容的官方联系方式对接!如果学术会议、博士招生有任何官方调整,责任不在我方。我们优先推广免费的学术会议、讲座、研修等项目。收费项目与商务合作需支持劳务费,请联系dianzishu@126.com 商谈。

欢迎加入语言学通讯读者群,添加时请自报实名,单位和研究方向

语言学及应用语言学加群联系人:sflsy0803 孙老师

继续为各位提供有益的学术资讯

长按二维码赞赏语言学通讯

9万学者关注了

语言学通讯

科研助力|学术观点|专著推荐|期刊动态|教师研修|招贤纳士|博士招生|读书小札

请留下你指尖的温度

让太阳拥抱你

记得这是一个有情怀的公众号

球分享

球点赞

球在看

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存