科研助力 | 质性数据分析工具在中国社会科学研究的应用——以Nvivo为例
随着质性数据分析工具的不断开发及其应用推广,如何有效运用质性数据分析工具处理非结构化数据开展科学的质性研究引起国内外学者的广泛关注。作者以Nvivo为例,采用内容分析法对样本文献逐篇编码,分析质性数据分析工具在中国社会科学研究的应用。
作者:潘虹 唐莉
来源《 数据分析与知识发现》2020年第1期
图文编辑:质化研究 (ID:zhihuayanjiu)
本文推广:语言学通讯 (ID: LingForum)
【目的】在大数据时代,海量非结构化数据大规模兴起,有效运用质性数据分析工具的重要性日益凸显,本文系统综述Nvivo在中国社会科学研究的应用。【文献范围】以“Nvivo”为主题词在CNKI数据库全文检索,人工核校构建2008-2018年327篇样本文献数据库。【方法】采用内容分析法对样本文献逐篇编码,分析质性数据分析工具在中国社会科学研究的应用。【结果】(1)应用主体。近10年来,Nvivo应用主体以高校科研人员为主,跨校间科研合作薄弱。(2)应用过程。方法数据大多以内容分析法分析二手数据与访谈法收集访谈资料为主,Nvivo应用过程包括资料编码、编码检验、编码分析与理论建模四步骤,规范应用四步骤的研究占比远不足一成。(3)应用客体。研究热点聚焦于扎根理论、质性研究与内容分析法,研究前沿从理论层面向应用层面拓展呈现多元化趋势,其中公共管理学、图书情报学、新闻传播学是新兴应用学科。【局限】Nvivo应用研究在科研合作、步骤规范性、方法多样性、数据多源化等方面有待完善。【结论】未来质性数据分析工具将凭借其强大的数据编码、理论构建功能成为研究者开展混合研究的重要分析工具。
质性数据分析; 社会科学研究; Nvivo;
引言
适用于通则式解释的定量研究最早可以追溯到19世纪,当时以孔德、穆勒和斯宾塞为代表的实证主义哲学家呼吁将社会科学研究从宗教中分离出来,主张通过检验假设来实现理论解释[1]。此后,定量数据分析特别是实证研究中的因果推断在西方社会科学研究中一直方兴未艾,在某些学科甚至长期占据主导地位[2,3,4]。质性研究(Qualitative Analysis被译为定性分析或质性分析,在本文中两者未加以区分)在社会科学理论构建中有着不可替代的作用与位置[5,6]。大数据时代,海量非结构化数据逐步成为重要的研究资料,一些质性数据分析工具也应运发展起来,目前国际上研发比较成熟的质性数据分析工具有Nvivo、Atlas.ti、QDA Miner、Qualrus、RQDA等。
随着质性数据分析工具的不断开发及其应用推广,如何有效运用质性数据分析工具处理非结构化数据开展科学的质性研究引起国内外学者的广泛关注[7,8,9]。一些学者首肯质性数据分析工具优势显著,指出其具有超越人工局限(beyond the feasible manual limits)的数据编码能力[10],可以更加高效精准地检索、分析与编码数据[11],有助于在质性研究中构建理论命题和提出待检验假设[12]。对诸如图形、声音与视频等较难依靠人工编码的数据形式亦提供编码与分析的可能性[13,14]。但也有一些学者对质性数据分析工具可能制约质性研究的发展表达了担忧。他们认为质性分析软件的固有程序会给质性研究活动加上方法论上的“直夹克”(straight jacket)[15]。如果研究人员的分析围绕软件功能[16],遵从程序要求[17],或囿于软件参数设定而使用某种分析技术,可能会限制研究人员根据实际问题设计和执行质性分析的能力[18]。
遗憾的是,目前国内外鲜有研究系统分析质性数据分析工具的应用情况[19,20,21,22]。为填补该领域可能的研究空白,本文以Nvivo为例,采用内容分析法对中国学术期刊出版总库数据库(简称CNKI)中所收录的期刊文献逐篇编码,分析质性数据分析工具在中国社会科学领域研究的应用,并对其应用前景提出展望。
2.1 研究对象
在诸多质性数据分析工具中,本文选择Nvivo软件进行分析,原因如下:
(1)澳大利亚QSR公司开发的质性分析软件Nvivo凭借其对非结构化数据的强大数据编码和理论模型构建功能在各学科领域研究中得到广泛应用[23]。
(2)在Web of Science(WoS)核心合集数据库和CNKI数据库中分别以质性数据分析工具名称作为检索词进行主题检索,结果均表明在中外论文数据库中,Nvivo软件应用研究比其他软件应用研究相加之和还多1。
鉴于此,本文以Nvivo为例探索质性数据分析工具在中国社会科学领域的应用。
2.2 数据来源
主要分析数据来源于CNKI数据库。在期刊板块高级检索模式下,选择“Nvivo”作为主题词进行全文检索,期刊来源类别设置为“CSSCI”,文献分类目录设置为“哲学与人文科学”、“社会科学I辑”、“社会科学II辑”、“经济与管理科学”,时间指定期限为CNKI起始年度开始至2018年(检索日期为2019年1月9日)。上述检索式返回351篇文献。对上述文献全文下载并逐篇仔细阅读,剔除重复类及与主题不符类文献后,剩余327篇文献构成本文的研究样本,对其采取全计数法(Whole Counting)2进行文献计量分析。
2.3 研究方法
采用内容分析法[24]对327篇样本文献逐篇编码。现有内容分析法研究一般采用两种编码方式:完全开放式编码和按照已有理论框架设定编码变量,后者被认为更加有效和现实[25]。从应有主体、应用过程与应用客体三个维度制定编码框架,对“谁在应用”、“如何应用”以及“用于什么”三个研究视角进行初探。Nvivo在社会科学领域应用研究分析框架如图1所示,同时借鉴Woods等[21]的研究,结合上述研究视角制定样本文献编码说明表如表1所示。
图1 Nvivo在社会科学领域应用研究分析框架
Fig.1 An Analysis Framework of Nvivo-applied Research in Chinese Social Science
表1 样本文献编码说明表
Table 1 Descriptions of Sample Literature Coding
(注:编码规则:(1)文献编码以年份-编号组成,如2017-01为2017年编号为1的样本文献;(2)标题、年份、期刊、作者、机构根据文献题录填写,学科则依据文献期刊在《CSSCI来源期刊目录》划分类别填写;(3)研究方法、数据来源根据文献内容进行开放式编码,如研究方法为半结构式访谈法,数据来源为访谈资料;(4)研究过程援引Woods等[21]对质性分析工具应用过程的划分,编码设定为:(1)资料编码;(2)编码检验;(3)编码分析;(4)理论建模4个步骤;(5)研究结论根据扎根理论研究目的,编码选项设定为:(1)构建理论框架;(2)描述研究现象;(6)研究主题根据文献标题、摘要、关键词提炼,进行开放式编码。)
3.1 基本概况:发展趋势
Nvivo在社会科学领域应用研究发文量如图2所示,过去十年质性数据分析工具Nvivo应用研究呈现增长态势。李献云等在2008年最早发表的一文,比WoS上收录的第一篇Nvivo文献晚了整整10年3。Nvivo应用研究可分为两个阶段:2008-2013年,CNKI收录Nvivo的研究共计66篇,年均增速24.6%,学科分布主要聚焦于教育学(36.4%)、社会学(16.7%)、管理学(10.6%)与体育学(10.6%)。2014-2018年间发文量共计261篇,年均增速高达35.8%,呈急剧增长态势。探究学科结构动态变化趋势发现,教育学与体育学占比下降,管理学占比上升,图书馆、情报与文献学是新出现应用较多的学科。
3.2 应用主体:谁在应用
(1)作者
2008-2018年间,全国共有278名学者应用Nvivo发表论文,其中发文量5篇以上的作者包括安徽大学张帅、王文韬(9篇)、安徽大学李晶(7篇)与华南理工大学文宏(6篇)。利用CiteSpace软件对Nvivo在社会科学领域应用研究的作者进行共现分析,得到作者合作网络图谱如图3所示,节点越大,作者发文量越多,节点连线与网络密度则反映作者之间合作强度。结果显示,网络节点数量为33,连线数量为27,网络密度为0.051 1。可以看出,作者节点普遍较小且分布较为分散,作者群之间联系较少;节点相对集中的分别是以张帅与王文韬为中心、以文宏为中心、以魏钧为中心的高校科研团队。
Fig.2 Publications of Nvivo-applied Research in Chinese Social Science(2008-2018)
Fig.3 Author Cooperative Networks of Nvivo-applied Research in Chinese Social Science
(2)机构
2008-2018年间,Nvivo在社会科学领域应用研究分布于144所科研机构,其中兰州大学管理学院、安徽大学管理学院均以10篇文献量位居榜首。利用CiteSpace软件对Nvivo在社会科学领域应用研究的发文机构进行共现分析,得到发文机构合作网络图谱如图4所示,节点越大,机构发文量越多,节点连线与网络密度反映机构之间合作强度。
结果显示,网络节点数量为24,连线数量为7,网络密度为0.025 4。从图谱中可以看出,发文机构节点小且分散,连接较少,发文机构之间合作薄弱。
Fig.4 Institution Cooperative Networks of Nvivo-applied Research in Chinese Social Science
3.3 应用过程:如何应用
(1)方法数据
按照研究主体在研究过程中是否介入研究对象与研究情境,将研究类型划分为介入性研究与非介入性研究[26],与之对应的数据来源分为一手数据与二手数据。
通过分析327篇样本文献研究方法与数据来源,得到Nvivo在社会科学领域应用研究方法类型如表2所示,Nvivo在社会科学领域应用研究数据来源如表3所示。
表2 Nvivo在社会科学领域应用研究方法类型
从研究方法来看,绝大多数文献使用一种研究方法,占总样本比例84.4%。其中非介入性研究内容分析法占据约一半,这与政府数据的公开、开放数据的可获得性以及学术界数据共享机制的不断发展息息相关。此外,也不乏学者通过介入性研究开展质性分析,较多地采用访谈法包括半结构式访谈与深度访谈。小部分文献采用问卷调查法与实地调研法进行质性研究。使用两类及以上研究方法的文献占总样本比例15.6%。其中混合使用介入性与非介入性研究的文献以访谈法和内容分析法为主,综合使用两种及以上介入性研究的文献以访谈法和问卷法或实地调研法为主,也有研究使用两种访谈法,譬如个人深度访谈与焦点团体访谈[27,28]。
从数据来源来看,绝大多数文献使用单一数据来源,占总样本比例85.0%。二手数据来源位列前三分别是网络文本(17.6%)、政府文件(14.4%)、文献资料(10.1%)。一手数据来源最多的是访谈资料占比42.8%。随着三角互证的兴起,多源研究资料间的相互验证是质性研究中信度的重要保障[29],少量文献使用两种及以上数据来源,占总样本比例15.0%。有学者使用访谈资料、观察资料抑或问卷资料作为一手数据,辅之以二手资料作为补充进行理论饱和度检验,也有学者综合使用两种以上的一手数据,譬如访谈资料与问卷资料[30,31],尽可能充分还原质性研究对象情境全貌。
(2)过程结论
援引Woods等[21]对质性数据分析工具应用过程的划分,并结合样本文献应用实际,创新性地提出Nvivo在社会科学领域应用逻辑路线如图5所示。第一步,资料编码。研读导入Nvivo中的资料,提炼概念,采用新的方式将概念进行整合,进行开放式、主轴式与选择式编码。第二步,编码检验。核校编码节点内容的信度效度以及理论充分性,包括编码一致性分析与理论饱和度检验。第三步,编码分析。对编码节点内容所呈现现象特征进行勾勒描述与可视化分析,包括节点频次、比例、覆盖率以及节点云图、聚类图谱等。第四步,理论建模。在分析编码节点之间的内在关系的基础上构建理论模型。
Nvivo在社会科学领域应用研究过程如表4所示,327篇样本文献均使用Nvivo“资料编码”功能,仅使用“资料编码”这一步骤的文献占比17.4%。实施两项步骤的文献占比58.4%,其中实施“资料编码”与“编码分析”这两项步骤的最多占比47.7%。实施三项步骤的文献占比21.4%,其中实施“资料编码”、“编码检验”与“编码分析”这三项步骤的最多占比15.6%。规范使用Nvivo应用四步骤的文献仅有9篇,占比2.8%,远不足总样本文献之一成。
Nvivo在社会科学领域应用研究结论如表5所示,描述类与模型类分别占比52.3%与47.7%。若前文有理论基础或通过文献综述提出理论框架,研究结论则遵循一定范式并根据Nvivo编码分析对其修正补充,反之则根据Nvivo编码分析来开放式描述研究现象或重新构建理论模型。研究发现,绝大部分样本文献的结论以“新描式”或“新构式”呈现,这也符合扎根理论构建相关理论的研究目的[32]。
3.4 应用客体:
用于什么
(1)研究热点
运用CiteSpace软件对Nvivo在社会科学领域应用研究热点进行共现分析,得到关键词共现图谱如图6所示。节点代表关键词,连线代表关键词共现程度,中介中心度表示节点在知识图谱中的媒介能力。图谱中共有节点47个,连线65条,网络密度为0.060 1。节点越大,说明该关键词出现频次越高,其研究热度也越高;连线越粗,表征关键词之间共现相关性越强;中介中心度越强,说明其占据节点的位置越多,控制关键词之间的信息流越大,在整个图谱中发挥的枢纽作用也越强[33]。Nvivo在社会科学领域应用研究高频关键词如表6所示,位列前三的关键词依次是“扎根理论”、“质性研究”、“影响因素”,中介中心度位列前三的关键词分别是“扎根理论”、“质性研究”、“内容分析”。
基于关键词共现图谱,Nvivo应用研究热点分析如下:
(1)Nvivo在社会科学研究的理论基础是扎根理论。作为一种自下而上构建理论的方法,扎根理论由Glaser等[32]在1967年提出,旨在系统收集资料的基础上,寻找反映社会现象的核心概念,在概念之间建立联系形成理论[34]。Nvivo是依据扎根理论设计的质性分析软件,通过资料编码与查询等功能,探索概念与构建理论,是扎根理论的重要应用工具。
(2)Nvivo在社会科学研究的类型是质性研究。质性研究强调研究对象在社会情境中的整体性,重视研究现象中人、事、物、情境之间的互动,产生大量原始研究资料[35]。对于需要处理大量原始资料的质性研究而言,质性数据分析工具的运用一定程度上有利于提高资料处理与分析的效率。Nvivo作为国际上主流的质性分析软件,能够有效地分析非结构化资料,其应用过程符合质性研究范式。
(3)Nvivo在社会科学研究的方法是内容分析法。作为一种通过对文献内容进行客观系统分析得出有效推论的方法[36],内容分析法试图以经验理论界定分类范畴和分析单元,以人工编码来分配资料,将文献中的内容加以量化分析,得到有社会科学意义的研究结果[37]。研究者在对研究资料的内容进行分析时应用Nvivo设置节点(自由节点/树状节点)实施编码,可见使用内容分析法与应用Nvivo相辅相成。
(2)研究前沿
在CiteSpace关键词共现分析的基础上,选择Timezone功能,得到Nvivo在社会科学领域应用研究关键词的时区图谱,如图7所示:
图7 Nvivo在社会科学领域应用研究关键词时区图谱
Fig.7 Keywords Time Zone Maps of Nvivo-applied Research in Chinese Social Science
(1)从理论层面向应用层面转变。2008-2013年期间,Nvivo应用研究的关键词聚焦“扎根理论”、“质性研究”等内容,主要涉及理论基础、研究类型理论层面的探讨。2014年之后尤其在近几年,Nvivo应用研究的关键词集中在“政策文本”、“信息偶遇”、“社交媒体”等内容,更多涉及管理学、图书情报学、新闻传播学等领域的具象应用研究。
(2)应用领域呈多元化的趋势。2008-2013年期间,Nvivo应用领域的关键词有“网络教育”、“课堂教学”等,主要涉及教育学领域,学界从不同视角开展微观研究,如大学教育[38]、网络教学[39]、英语教学[40]等。2014年以来,Nvivo应用领域的关键词有“政策文本”、“政策工具”、“信息回避”、“社交媒体”、“微信”等,新兴涉及的应用学科有公共管理学[41,42]、图书情报学[43,44]、新闻传播学[45,46]等。
4.1 研究结论
本文以Nvivo为例使用内容分析法对CNKI数据库中所收录的327篇期刊文献逐篇编码,分析质性数据分析工具在中国社会科学领域研究的应用现状及动态发展趋势,从“谁在应用”、“如何应用”、“用于什么”三个视角进行初探,研究发现:
(1)从应用主体来看,过去十年,Nvivo在中国社会科学研究中呈加速增长态势,教育学是该领域主力军学科,近年来管理学、图书情报学应用逐渐增多。Nvivo应用研究的主体以高校科研人员为主,科研团队之间、跨校机构之间科研合作薄弱,科研合作有待加强。
(2)从方法数据来看,已有研究绝大多数采用单类研究方法,如非介入性研究采用内容分析法、介入性研究较多采用访谈法。数据来源以网络文本、政府文件、文献资料以及访谈资料为主。综合使用多样性研究方法和多源化数据的研究较少。
(3)从过程结论来看,尽管所有样本文献均使用Nvivo资料编码的强大功能,但规范应用质性数据分析工具四步骤即资料编码、编码检验、编码分析与理论建模的研究占比远不足一成。应用结论以“新描式”描述研究现象与“新构式”构建理论模型为主。
(4)从应用客体来看,Nvivo在中国社会科学领域应用研究热点表现为理论基础是扎根理论、研究类型是质性研究、研究方法是内容分析法。Nvivo应用研究从理论层面向应用层面转变,应用领域呈多元化趋势,其中公共管理学、图书情报学、新闻传播学是新兴应用学科。
4.2 未来展望
综上所述,虽然质性数据分析工具Nvivo在中国社会科学领域的应用研究在近年来取得的进步有目共睹,但未来在加强研究团队之间、机构之间科研合作,规范应用Nvivo分析四步骤,力争研究方法多样性、数据来源多元化等方面还有长足进步空间。本文不足之处是样本数据仅限于CNKI收录的中文期刊论文,因此上述发现是中国研究的特色还是全球运用Nvivo进行质性研究的普遍特征,尚且无法得知。质性数据分析工具在国外应用研究中,24%研究使用两种数据来源、9%研究使用三种及以上数据来源4,应用领域聚焦于健康科学、通信和信息系统、工程和应用科学等,应用类型包括定性研究与混合研究[21]。随着社会科学中定性与定量研究相结合的呼声高涨[47,48,49,50],未来质性数据分析工具将凭借其强大的数据编码、理论构建功能成为研究者开展混合研究的重要分析工具。
参考文献略
质性研究方法视频网课
扫码学习
专著推荐 | 如何做定量研究?手把手教你使用SPSS《二语习得研究中的常用统计方法》
专著推荐 | 德古意特认知语言学研究丛书+应用丛书(13种)
科研助力 | John Benjamins 翻译学国际期刊投稿及订阅方式
科研助力 | John Benjamins 话语分析及语用学国际期刊投稿及订阅方式