由iResearch微信公众号发起的“定量研究线上读书活动”于2016年3月18日正式启动,至今活动已全部结束。活动中,领读专家提炼章节精华,化繁为简,为读者答疑解惑;读者细细品读,乐学勤思,努力从读中获益,学有所成。
您是否曾为错过这次宝贵的学习机会而感到遗憾?没关系!小编为您倾情整理分享本次活动三个阶段的全部干货,包括每一阶段的专家导读及精彩问答等。本期为您分享的是第三阶段的阅读思考题及线上交流问答整理。前两阶段干货整理请见文后链接。
1. 研究假设与研究问题的关系是什么?备择假设与虚无假设有哪些特征?研究假设就是对研究问题的尝试性回答或预期答案。因此,在定量研究中,应先提出研究问题,以疑问句形式呈现,然后给出研究假设,以陈述句形式呈现。研究假设包括备择假设和虚无假设。一般说来,我们需要统计检验的是虚无假设,备择假设难以检验。通过对虚无假设的检验结果,并结合数据的描述统计结果,来推断数据是否接受某个备择假设。在验证性研究中,必须明确提出数量不等的备择假设,备择假设又分为单向和双向两种。单尾检验与双尾检验的区别主要有两点:1)单尾检验是对正向或反向假设进行检验的方法,因此当我们有把握认为另一个方向的效应可以忽略不计,不检验它不会有严重后果时,才可以使用;而双尾检验则是不区分方向的检验方法,使用频率较高;2)单尾检验在效应探测方面比双尾检验更强大,即双尾检验方法更保守,单尾检验结果比双尾检验结果更容易达到显著性水平。 3. 什么是概率水平?如何理解概率水平?选择概率水平需要注意什么?概率水平(probability level)也称显著性水平(significance level)或称alpha水平。选择概率水平就是研究者在假设检验中确定愿意犯第一类错误或第二类错误的风险程度。统计学及社会科学研究中,概率水平有0.10、0.05、0.01、0.001之分。在这四类概率水平中,0.05和0.01较为常用。当我们选择0.05的概率水平时,说明我们只愿意容忍5%的第一类错误,即研究结果有95%的概率是正确的。选择概率水平需要注意以下两点:1)在进行假设检验时,必须事先确定概率水平,而不是事后根据统计结果选择概率水平;2)选读某个概率水平时最好明确说明其理由。 4. 请根据数据类型和分析目的这两项内容,列表说明需要选择的具体差异检验方法和联系检验方法。统计检验方法很多,根据研究目的可以分为两大类。一类是探讨数据组或变量之间的差异(difference),另一类是探讨变量之间的联系(association)。下面列表说明如何根据数据类型和分析目的这两项内容,来选择具体的检验方法。 1.关于数据转换,非正态数据本来的面貌就是这样,经过幂转换后使它呈正态分布,这样做的意义是什么?难道就是为了满足参数检验方法的要求?数据分布都改变了再去分析还有意义吗?将非正态分布的数据转换为正态分布,这样做的意义就是为了满足参数检验要求。数据分布改变了,再去分析还有意义吗?这要看怎么分析。如果用这个数据做描述性统计分析,就没有意义,也就是说转换过的数据不能汇报描述性结果,即均值,标准差等。如果是用来分析变量间的联系和差异,是有意义的,因为转换过的数据能够满足参数检验的要求,如果数据不呈正态分布,还要使用参数检验,这样做会导致研究结果没有效度。 2.“幂转换后的结果是解释数据的难度往往会增加,因为分析结果发生了很大的变化。……只有当我们认为确有必要,而且能够对转换了的变量给出合理的解释,才可使用数据转换方式。”什么时候才有必要呢?如果想让自己的研究结果推广至总体当中,就需要将非正态分布的数据转换为正态分布,以满足参数检验的要求。一般情况下,不建议对数据进行转换。国内外语界发表的学术文章很少对数据进行转换。非正态分布的数据,我们一般采用非参数检验方法就可以解决。 3.进行单尾检验的前提是有足够的理由预测变量间的关系的方向。如果研究者预测的方向不正确,即本来应该是反方向的作用,是不是单尾检验就无法检测出效应?研究者对研究假设的预测是基于前人研究结果而得出的。如果研究者有足够的理由对变量间的关系做出正向或反向的预测,例如:学习策略可促进英语学习成绩(正向)。就可以使用单尾检验,看样本统计量是否落在关键区域内,就可以拒绝虚无假设。如果研究者没有足够的理由对变量间的关系做出正向或反向的预测,例如:语言焦虑影响外语学习成绩(双向,包括正面影响和负面影响)。那就可以使用双尾检验。如果研究者预测的方向是错的,单尾检验还是可以告诉我们是否该拒绝虚无假设。因为定量研究检验的都是虚无假设,不是备择假设。备择假设就是研究者预测的变量间关系的方向。 4.怎样区分双尾检验的结果效应是正向影响还是负向影响?双尾检验本身不分正向和负向。双尾检验是针对备择假设的,如果备择假设是双向的,例如一项研究有两个备择假设:1)语言焦虑促进外语学习成绩(正向);2)语言焦虑抑制外语学习成绩(反向)。我们就选择双尾检验。选择双尾检验的目的就是看样本统计量是否落在关键区域内,就可以做出是否拒绝虚无假设的判断。如果落在阴影部分,那就拒绝虚无假设;如果没有,就接受。至于研究结果是正向的还是负向的,这个要看相关系数,如果系数为正值表明正相关,负值表明负相关。 5.检验力和效应量应该先确定哪个?在计算样本量大小和检验力的时候设定的效应量是实验希望达到的效应量吗?关于检验力和效应量,我们应该先设定检验力,也就是能够探测到变量间实际存在的差异或联系的显著统计结果的概率,也就是要先设定好能够容忍犯第二类错误的概率。在使用G*Power软件计算一项研究所需样本量时,需要给出效应量、检验力以及显著性水平。这里的效应量是根据前人相关研究结果所设定的。如果前人研究结果的效应量为小,我们也相应设为小,如果前人得出的效应量为中,我们就设为中。 6.α可以通过t检验算出来,β要通过什么计算出来?α水平(P值)可以从各种推断性统计中获得,β值的计算需要用1减去检验力,检验力又是怎么来的呢?我们可以通过G*Power软件计算出来,输入α水平、效应量、样本量,程序会自动运算出来。 7.独立样本t检验和配对样本t检验的区别在哪里?进行组间比较t检验的时候,如果两组样本人数相等、正态分布、均值相等,是不是就是用配对样本t检验,否则就用独立样本t检验?独立样本t检验是检验两个样本是否来自两个平均数相同的总体,也就是比较两组的平均值。换句话说,如果比较两个不同的样本(即独立样本)在某个变量上的差异时就使用独立样本t检验,例如探讨高班和低班的学习动机差异,就可以使用。如果需要比较同一个样本在两个变量上的差异时,就使用配对样本t检验,例如高班学生在第一学期和第四学期的学习动机差异。关于这个问题,如果还是不太理解,建议参考秦晓晴教授的《外语教学研究中的定量数据分析》(2003)一书,里面对独立样本t检验和配对样本t检验讲解得很详细。 8. P223页最上面White“对前测成绩和后测成绩进行Wilcoxon配对符号秩次方法分析,以检验差异是否达到显著性水平。”看到这里有些糊涂:使用试卷获得的数据应该是定距或定比数据(P221 倒数第二行),而Wilcoxon配对符号秩次方法要求是定序数据(P222 L4),怎么能用此方法来分析检验呢?White的研究案例中,对前测成绩和后测成绩使用Wilcoxon配对符号秩次方法检验,是正确的做法,因为在此之前,研究者对前测成绩和后测成绩做了检验,发现数据不呈正态分布。非正态分布的数据适合非参数检验,Wilcoxon配对符号秩次方法属于非参数检验。试卷获得的数据一般来说是定距或定比数据,这个没错,但必须达到正态分布,才能使用各种t检验或方差分析。White的研究中也出现了试卷的分数,但该分数不呈正态分布,只好使用Wilcoxon配对符号秩次方法了。这里并不是说Wilcoxon配对符号秩次方法只能用于定序数据,而是范围更广,定距数据和定比数据都可,主要针对的是非正态分布的数据,因为它是一种非参数检验。 9.我刚发现马蓉教授和秦晓晴教授在《外语界》2016年第1期发表的《二语词汇学习的动机策略发展研究——动机的动态视角》一文,如果方便的话,能否请马教授以该研究为例,教我们如何应用第6章的假设检验?首先感谢这位读者对本文的关注。《二语词汇学习的动机策略发展研究——动机的动态视角》一文,探讨的是二语词汇学习的动机策略发展及与词汇知识之间的关系。这是一项实证的定量研究,统计方法较为复杂,同时使用了SPSS和SEM(结构方程模型)。
本文的研究问题有三个:1)一年级和二年级在二语词汇学习的行动前、行动中和行动后三个阶段的动机策略特征如何?2)一年级和二年级的动机策略特征是否受年级、专业和性别的影响?3)一年级和二年级的动机策略特征与词汇知识之间存在何种关系?这种关系是否也受年级、专业和性别的影响?
本项研究的假设检验过程如下:
期刊论文因受版面和字数限制,一般不会明确表述虚无假设,个别时候表述备择假设。但一定要明确用疑问句的形式提出本项研究具体要解决的问题。本文虽没有明确指出虚无假设和备择假设,但通过研究问题,读者可以清楚:虚无假设就是:1)一年级和二年级的动机策略特征与年级、专业和性别没有关系;2)一年级和二年级的动机策略特征与词汇知识之间没有关系。备择假设有很多,如:1)一年级和二年级的动机策略特征与年级、专业和性别有正向关系,2)一年级和二年级的动机策略特征与年级、专业和性别有负向关系;3)一年级和二年级的动机策略特征促进词汇知识的掌握;4)一年级和二年级的动机策略特征阻碍词汇知识的掌握。
本研究采用双尾检验。大家可以看到,本文并没有汇报双尾检验的结果。主要还是因受版面和字数限制,表3涵盖的内容实在太多,放不下了,所以只汇报了t值和显著性水平。除了双尾检验,显著性水平也能准确说明是否该拒绝还是接受虚无假设。
一般应该在文章的“研究设计”部分里的“数据处理与分析”小节中提出。文本因为需要在这一小节汇报问卷的信度,KMO值,因子分析的结果等等,版面有限,所以在这里未提出p值设为0.05。不过在后面的独立样本t检验结果的表格底下说明了p值水平。
关于这一点,本文在“数据处理”小节专门用一段来说明。即“分析完问卷的信度和结构效度后,我们首先通过描述统计了解二语词汇学习的动机策略特征;然后采用独立样本t检验探讨不同年级、专业和性别的受试者在动机策略方面是否存在差异;最后使用AMOS多群组结构方程模型方法综合检验不同年级、专业和性别在动机策略与词汇知识之间的关系”。
本文没有做此项分析,因为本研究是一项replication study(验证性研究或复制研究),样本量需要与原创研究,即Tseng和Schmitt(2008)的研究保持一致或大约相等。我们知道进行先验性检验力分析的目的就是要确认一项研究所需的样本量。
本文首先汇报了KMO值,为.859,说明数据适合做因子分析。然后汇报了动机策略的偏态值和峰度值,数据显示为正态分布。说明可以采用参数检验,因此t检验是合适的。
本文的推断性检验结果为:1)词汇学习的行动前、中、后三个阶段的动机策略特征主要受年级因素的影响,而不太受专业和性别的影响;在学习焦虑、任务控制、情感控制、自我超越、强化策略和社会策略等6个变量上二年级显著低于一年级。2)词汇学习的初始评价通过自我调控、策略学习和策略使用对词汇知识产生积极影响,词汇知识又通过事后评价对初始评价产生积极影响,而且这种循环关系不受年级、专业和性别因素的影响。
因受版面和字数限制,本文未汇报后验性检验力分析,这也是一个遗憾。我的另一篇文章“二语写作互文应用能力研究”[J]. 福建师范大学学报2015(6).[CSSCI]中,使用G*Power计算了检验力,并在文中明确汇报了先验性检验力分析和后验性检验力分析的结果,感兴趣的读者可以查阅。《外语教学定量研究方法及数据分析》读书活动第一阶段干货分享
第一阶段线上交流问答整理
《外语教学定量研究方法及数据分析》读书活动第二阶段干货分享