竞赛资料 | 用文本分析告诉你为什么微博总是充斥着负面情绪?
什么?微博数据可以做研究?
微博评论能够判断群体情绪?
人文社科也能用微博大数据发论文?
没错!
各位瓜友们还记得几年前沸沸扬扬的“鹿晗关晓彤”公开事件吗?场面之壮观可谓微博重要事件!
但是!同样是明星,同样公开恋情,为什么鹿晗评论清一色祝福,而关晓彤评论下面确实骂声一片?
鹿晗微博评论词云
关晓彤微博评论词云
其实词云已经是最简单的文本大数据情感分析工具啦!想要对这些评论做进一步的科研挖掘,你应该学会更多文本分析方法!人文社科再也不用拘泥于问卷、访谈、统计数据、计量模型啦!做有趣的研究,发更高质量的论文!
让小科康康是哪个社科er还不会文本分析法?(是小科本科了……)
“文本分析法”是人文社科类学术领域中的一种常用的研究方法,也逐渐被应用于多个跨学科的社会领域中,不过,其相对来说比较复杂,使用起来也有一定门槛。但社科er们想要写出高质量的科研论文,文本分析法就必不可少!那么在本期,大家就准备好小本本,来和小科一起了解一下何为“文本分析法”吧!
基本概念
在具体了解文本分析法之前,我们首先需要对其中的关键词——“文本”(Text)进行基础性的认知。从狭义来看,“文本”指经由具像化的过程所呈现的内容物,此内容可以来自文件、图像、声音等等。从广义来看,前苏联文化符号学家尤里•洛特曼认为“文本”为“整体符号(intergral sign)”,即文化上有意义的符号组合,具有信息传递功能、信息生成功能和信息记忆功能。
围绕“文本”展开的分析方法,我们称之为“文本分析法”。从具体定义上来说,“文本分析法”是一种基于定性研究的量化分析方法,是基于社会科学目的,任何用于文本(或者其他符号材料)上的方法学上的度量,能对文本内容作系统、客观的定量和定性分析,从而揭示文本的变化与特征。
主要类型
从研究取向来看,文本分析法中比较有代表性的具体方法有以下三种:
1. 修辞分析法(“新批评”细读法)
“细读法”是新批评创造的一种具体的批评方法,它建立在对文本语义的细致分析的基础上,要求运用隐喻、含混、反讽、悖论等概念、理论和方法,对文本的语言和结构要素做尽可能详尽的分析和解释。修辞分析法的基本分析流程包括了解并分析词义、感受并理解语境、把握修辞特点。
从分析对象的层面来分析的话,修辞分析法所围绕的中心是文本的句法和语义单元、文本的意象和隐喻,以及对象征和象征系统的仔细阅读和分析。
2. “符号学”分析法
“符号学”是研究符号与符号运作的学问,主要研究领域包括符号本身、组成符号所依据的符号系统,以及符号运作所依存的文化。因此,“符号学”的分析视角要求我们首先尽可能多地列举文本中的有效符号,再分析符号的组合形式和组合手法,最后剖析其中的文化内涵及思想逻辑。
3. “叙述学”分析法
“叙述学”分析法又称“叙事学”分析法,主要围绕着“叙述内容”和“叙述方式”两大主题展开,其所阐述的内容全面深入,包括叙述行为、叙述者及分化、叙述层次、叙述时间、叙述体态、叙述语式。在此推荐两部关于“叙述学”分析法的具有代表性的学术著作:《叙事学》(胡亚敏);《中国现代经典短篇小说文本分析》(刘俐俐)。
4. 文本功能分析框架(纽马克)
英国实践型翻译理论家彼特•纽马克将文本类型划分为三类:表达型文本、信息型文本以及呼唤型文本。与此同时,他指出,对文本类型的划分并不是一成不变的,大多数文本具有两种及两种以上的功能,只是其中一种占据主导地位,并主张依据不同类型的文本,采取不同种类的分析方法。
从分析(编码)方式来看,文本分析法包括以下几种具体形式:
1. 人工编码(属于质性分析的范畴)
首先是对文本内容意义的解读。在横向层面上,注重分析不同文本之间的差异、联系及互动性影响;在纵向层面上,注重对文本的深层缘由(社会、历史等因素)、思想内涵和发展影响的深入探索。
其次是对形式意义的解读。主要侧重于对文本的呈现形式、所处位置(语境)、功能作用的分析解读。
2. 计算机辅助编码
指的是在人工分析过程中借助简单的电脑文书软件(如Word)进行图表制作及说明性文字阐述。
3. 计算机自动编码(属于定量分析的范畴)
包括对有效文本数据进行筛选、抽样统计以及编码归纳,并在此基础上对普遍的规律进行概括总结。常见的计算机文本分析软件有以下几种:
◆AnSWR 6.4
◆ATLAS.ti 5.2
◆EZ-Text
◆MAXqda 2
◆NUDIST 6
在文本分析法的范畴内,还有一些常见且实用的文本分析技术及软件:
1. 主题分析(Thematic analysis)
Nvivo,ATLAS. ti
2. 内容分析(Content analysis)
LIWC,DICTION
3. 基于词典的方法(Dictionary analysis)
4. 词袋法(文本向量化)(Bag-of--words)
(1)监督算法,如SVM、 Bayes和 Regression
(2)无监督算法,如LDA话题模型
5. 自然语言处理(Natural Language Processing)
具体分析步骤
1. 选择研究主题
2. 搜集及分析资料
3. 归类(按照对象、主题、情境或综合标准)
4. 确定具有代表性的样本目标
(1)整体抽样。制作抽样框,将框中的每项文本数据按照顺序编号,并统一采取随机抽样、系统抽样等的整体抽样方法。
(2)多阶段分组抽样。首先将文本数据分为不同组别,从中随机取出一组进行完整分析,或再从中随机抽样。
5. 找出高频关键词,确定分析单位或类别
分析单位包括物理单位、句法单位、语义单位、语用单位等等,涵义特征层面如社会特征、心理特征和身体特征;颜色形象层面如眼睛的颜色、头发的颜色、衣着的颜色。
6. 制定测量图表
7. 对文本单元进行具体的描述、说明和分析
(1)图表法。利用python, gephi等软件运行关系图。
(2)文字阐述法。在文案编辑软件中对文本单元进行说明与阐释。
★注意事项
1. 应按照分析单位的特征,尽量用量化的方式记录研究对象在各个层面的信息数据。
2. 最好采用事先设计好的、易于标准化统计分析的评判记录表。
3. 相同分析维度的评判必须有两个以上的评判员分别作出记录(数字形式)。
4. 根据类别(或关键词)出现频数进行记录、判断和分析时还要重视基数的大小。
基本特点
1. 非介入性
整个研究过程围绕的是现成的文本信息,不存在研究者干扰研究对象的情况。
2. 相对主观性
受研究者自身价值观念、政治立场、认知体验和知识结构等主观因素影响较大。
3. 超时空性
文本分析的研究范围广,可以通过线上或线下的资料收集而跨时空进行研究。与此同时,研究的时长也是可持续的,对研究对象及研究结果无干扰。
4. 综合性
文本分析既包括主观因素较多的定性研究,也包括科学性强的、需要充足客观事实支撑的定量研究。
5. 低成本性
与其他研究方法相比,文本分析法对时间、精力和经费等资源的消耗相对较少,对研究条件的要求较低。
6. 可证实性
需要有学术经验或客观科学的证据的支撑,并应经过系统化的调查取样。
7. 归纳性
文本分析法不是研究者自己事先对假设的演绎与阐释,而是对现有文本材料的归纳分析,强调多维度地深入文本材料,自下而上地浓缩、建构出一套理论框架。
意义价值
1. 从文本中搜寻多元化意义
一方面,我们可以探寻单个文本自身存在的因素和意义,另一方面还可以发掘出多个文本之间的互补性影响与作用。与此同时,研究者经过观察与研究所给予文本的意义也应被考虑在内。
2. 使文本内容与现实社会得以更加紧密的联系
就文本自身而言,我们通过分析可以探求文本的社会性、历史性因素;就文本与社会的关系而言,我们可以将从文本中浓缩出的理论应用于社会实践中去,更好地实现其现实价值。
3. 更好地描述文本内容的结构与功能
文本内容的结构既包含句法、语义单位之间的表层联系与结构,还包括各级单位之间经过互动所形成的整体性语义与语用结构(体现作者的思想观点、创作意图、个性态度)。通过分析,我们都能搜寻到这些结构都在不同层面上的不同功能,并将其应用到其他现实问题和研究课题中。
4. 透彻了解文本产生的前因后果
我们既要了解影响文本产生的相关变量和关键词,又要借助一些具有强客观性和权威性的文本,将其作为评判参考的标准。
有待进一步思考的问题
1. 文本分析中质性研究与定量研究的比重应如何权衡?
2. 文本分析与话语分析、内容分析之间的联系与区别?
3. 文本分析的局限性怎样弥补?
(文本分析的局限性包括研究对象的规模小、代表性低、相对主观性强等等)
4. 文本分析中数据处理的细节应如何完善?
(词语规范化、筛选掉无效数据、修正非标准化的文本)
资料包里有什么?
资源示例
其他示例
篇幅有限以上仅展示部分
参考文献:
[1]NEUENDORF K A. The content analysis guidebook [M], London: SAGE Publications Asia -Pacific Pte. Ltd, 2016.
[2]Lotman,Yury. Analysis of the Poetic Text[M], Edited &translated by D.Barton Johnson. Ann Arbor(Mich): Ardis Publishers, 1976.
[3]Content Analysis: An Introduction to Its Methodology. Krippendorff, Klaus. Sage . 2004.
[4]伍多·库卡茨, 质性文本分析[M], 重庆:重庆大学出版社, 2017.
今日推荐
科研竞赛一本通
科研工具百宝书 | 计算机一本通 |
专利申请一本通 |
竞赛资料包
PPT模板
“盐系”PPT | |
教程资源
证书考级
论文辅导课程
想掌握更多竞赛、科研、论文写作的一手资讯