查看原文
其他

科研工具 | 社科+计算机经典组合! 超全文本分析资料包免费领!

小博 考博岛 2022-08-27


什么?微博数据可以做研究?

微博评论能够判断群体情绪?

人文社科也能用微博大数据发论文?


没错!


各位瓜友们还记得几年前沸沸扬扬的“鹿晗关晓彤”公开事件吗?场面之壮观可谓微博重要事件!


但是!同样是明星,同样公开恋情,为什么鹿晗评论清一色祝福,而关晓彤评论下面确实骂声一片?


鹿晗微博评论词云


关晓彤微博评论词云


其实词云已经是最简单的文本大数据情感分析工具啦!想要对这些评论做进一步的科研挖掘,你应该学会更多文本分析方法!人文社科再也不用拘泥于问卷、访谈、统计数据、计量模型啦!做有趣的研究,发更高质量的论文!


让小科康康是哪个社科er还不会文本分析法?(是小科本科了……)


“文本分析法”是人文社科类学术领域中的一种常用的研究方法,也逐渐被应用于多个跨学科的社会领域中,不过,其相对来说比较复杂,使用起来也有一定门槛。但社科er们想要写出高质量的科研论文,文本分析法就必不可少!那么在本期,大家就准备好小本本,来和小科一起了解一下何为“文本分析法”吧!


赶紧关注下方公众号
回复【文本分析】按提示完成相关操作
即可免费领取【超全文本分析法学习资料包】!




基本概念




在具体了解文本分析法之前,我们首先需要对其中的关键词——“文本”(Text)进行基础性的认知。从狭义来看,“文本”指经由具像化的过程所呈现的内容物,此内容可以来自文件、图像、声音等等。从广义来看,前苏联文化符号学家尤里•洛特曼认为文本”为“整体符号(intergral sign)”,即文化上有意义的符号组合,具有信息传递功能、信息生成功能和信息记忆功能。


围绕“文本”展开的分析方法,我们称之为“文本分析法”。从具体定义上来说,“文本分析法”是一种基于定性研究的量化分析方法,是基于社会科学目的,任何用于文本(或者其他符号材料)上的方法学上的度量,能对文本内容作系统、客观的定量和定性分析,从而揭示文本的变化与特征。




主要类型




从研究取向来看,文本分析法中比较有代表性的具体方法有以下三种:


1. 修辞分析法(“新批评”细读法)

“细读法”是新批评创造的一种具体的批评方法,它建立在对文本语义的细致分析的基础上,要求运用隐喻、含混、反讽、悖论等概念、理论和方法,对文本的语言和结构要素做尽可能详尽的分析和解释。修辞分析法的基本分析流程包括了解并分析词义、感受并理解语境、把握修辞特点。


从分析对象的层面来分析的话,修辞分析法所围绕的中心是文本的句法和语义单元、文本的意象和隐喻,以及对象征和象征系统的仔细阅读和分析。


2. “符号学”分析法

“符号学”是研究符号与符号运作的学问,主要研究领域包括符号本身、组成符号所依据的符号系统,以及符号运作所依存的文化。因此,“符号学”的分析视角要求我们首先尽可能多地列举文本中的有效符号,再分析符号的组合形式和组合手法,最后剖析其中的文化内涵及思想逻辑。


3. “叙述学”分析法

“叙述学”分析法又称“叙事学”分析法,主要围绕着“叙述内容”和“叙述方式”两大主题展开,其所阐述的内容全面深入,包括叙述行为、叙述者及分化、叙述层次、叙述时间、叙述体态、叙述语式。在此推荐两部关于“叙述学”分析法的具有代表性的学术著作:《叙事学》(胡亚敏);《中国现代经典短篇小说文本分析》(刘俐俐)。


4. 文本功能分析框架(纽马克)

英国实践型翻译理论家彼特•纽马克将文本类型划分为三类:表达型文本、信息型文本以及呼唤型文本。与此同时,他指出,对文本类型的划分并不是一成不变的,大多数文本具有两种及两种以上的功能,只是其中一种占据主导地位,并主张依据不同类型的文本,采取不同种类的分析方法。


从分析(编码)方式来看,文本分析法包括以下几种具体形式:


1. 人工编码(属于质性分析的范畴)

首先是对文本内容意义的解读。在横向层面上,注重分析不同文本之间的差异、联系及互动性影响;在纵向层面上,注重对文本的深层缘由(社会、历史等因素)、思想内涵和发展影响的深入探索。


其次是对形式意义的解读。主要侧重于对文本的呈现形式、所处位置(语境)、功能作用的分析解读。


2. 计算机辅助编码

指的是在人工分析过程中借助简单的电脑文书软件(如Word)进行图表制作及说明性文字阐述。


3. 计算机自动编码(属于定量分析的范畴)

包括对有效文本数据进行筛选、抽样统计以及编码归纳,并在此基础上对普遍的规律进行概括总结。常见的计算机文本分析软件有以下几种:

 ◆AnSWR 6.4

 ◆ATLAS.ti 5.2

 ◆EZ-Text

 ◆MAXqda 2

 ◆NUDIST 6


在文本分析法的范畴内,还有一些常见且实用的文本分析技术及软件:


1. 主题分析(Thematic analysis)

Nvivo,ATLAS. ti


2. 内容分析(Content analysis)

LIWC,DICTION


3. 基于词典的方法(Dictionary analysis)


4. 词袋法(文本向量化)(Bag-of--words)

(1)监督算法,如SVM、 Bayes和 Regression

(2)无监督算法,如LDA话题模型


5. 自然语言处理(Natural Language Processing)




具体分析步骤




1. 选择研究主题


2. 搜集及分析资料


3. 归类(按照对象、主题、情境或综合标准)


4. 确定具有代表性的样本目标

(1)整体抽样。制作抽样框,将框中的每项文本数据按照顺序编号,并统一采取随机抽样、系统抽样等的整体抽样方法。


(2)多阶段分组抽样。首先将文本数据分为不同组别,从中随机取出一组进行完整分析,或再从中随机抽样。


5. 找出高频关键词,确定分析单位或类别

分析单位包括物理单位、句法单位、语义单位、语用单位等等,涵义特征层面如社会特征、心理特征和身体特征;颜色形象层面如眼睛的颜色、头发的颜色、衣着的颜色。


6. 制定测量图表


7. 对文本单元进行具体的描述、说明和分析

(1)图表法。利用python, gephi等软件运行关系图。

(2)文字阐述法。在文案编辑软件中对文本单元进行说明与阐释。


★注意事项

1. 应按照分析单位的特征,尽量用量化的方式记录研究对象在各个层面的信息数据。


2. 最好采用事先设计好的、易于标准化统计分析的评判记录表。


3. 相同分析维度的评判必须有两个以上的评判员分别作出记录(数字形式)。


4. 根据类别(或关键词)出现频数进行记录、判断和分析时还要重视基数的大小。




基本特点




1. 非介入性

整个研究过程围绕的是现成的文本信息,不存在研究者干扰研究对象的情况。


2. 相对主观性

受研究者自身价值观念、政治立场、认知体验和知识结构等主观因素影响较大。


3. 超时空性

文本分析的研究范围广,可以通过线上或线下的资料收集而跨时空进行研究。与此同时,研究的时长也是可持续的,对研究对象及研究结果无干扰。


4. 综合性

文本分析既包括主观因素较多的定性研究,也包括科学性强的、需要充足客观事实支撑的定量研究。


5. 低成本性

与其他研究方法相比,文本分析法对时间、精力和经费等资源的消耗相对较少,对研究条件的要求较低。


6. 可证实性

需要有学术经验或客观科学的证据的支撑,并应经过系统化的调查取样。


7. 归纳性

文本分析法不是研究者自己事先对假设的演绎与阐释,而是对现有文本材料的归纳分析,强调多维度地深入文本材料,自下而上地浓缩、建构出一套理论框架。




意义价值




1. 从文本中搜寻多元化意义

一方面,我们可以探寻单个文本自身存在的因素和意义,另一方面还可以发掘出多个文本之间的互补性影响与作用。与此同时,研究者经过观察与研究所给予文本的意义也应被考虑在内。


2. 使文本内容与现实社会得以更加紧密的联系

就文本自身而言,我们通过分析可以探求文本的社会性、历史性因素;就文本与社会的关系而言,我们可以将从文本中浓缩出的理论应用于社会实践中去,更好地实现其现实价值。


3. 更好地描述文本内容的结构与功能

文本内容的结构既包含句法、语义单位之间的表层联系与结构,还包括各级单位之间经过互动所形成的整体性语义与语用结构(体现作者的思想观点、创作意图、个性态度)。通过分析,我们都能搜寻到这些结构都在不同层面上的不同功能,并将其应用到其他现实问题和研究课题中。


4. 透彻了解文本产生的前因后果

我们既要了解影响文本产生的相关变量和关键词,又要借助一些具有强客观性和权威性的文本,将其作为评判参考的标准。




有待进一步思考的问题




1. 文本分析中质性研究与定量研究的比重应如何权衡?


2. 文本分析与话语分析、内容分析之间的联系与区别?


3. 文本分析的局限性怎样弥补?

(文本分析的局限性包括研究对象的规模小、代表性低、相对主观性强等等)


4. 文本分析中数据处理的细节应如何完善?

(词语规范化、筛选掉无效数据、修正非标准化的文本)





什么?看完这些干货只懂了理论不懂操作?别担心,小科可是有备而来!今天小科特意为大家准备了超全文本分析法学习资料包!

赶紧关注下方公众号回复【文本分析】按提示完成相关操作
即可免费领取【超全文本分析法学习资料包】!


   资料包里有什么? 


   资源示例  


   其他示例  

篇幅有限以上仅展示部分


赶紧关注下方公众号回复【文本分析】
按提示完成相关操作
即可免费领取【超全文本分析法学习资料包】!


参考文献:

[1]NEUENDORF K A. The content analysis guidebook [M], London: SAGE Publications Asia -Pacific Pte. Ltd, 2016.

[2]Lotman,Yury. Analysis of the Poetic Text[M], Edited &translated by D.Barton Johnson. Ann Arbor(Mich): Ardis Publishers, 1976.

[3]Content Analysis: An Introduction to Its Methodology. Krippendorff, Klaus. Sage . 2004.

[4]伍多·库卡茨, 质性文本分析[M], 重庆:重庆大学出版社, 2017.


END


单院校真题

  北大经济学                       北大政管                       北大社会学
  北大教育学                       北大法学                       北大光华
  北大哲学                      人大经济学               复旦国关
  上交国际                    南大法学                      厦大国际法 
考博文书模板
  考博资料包                      研究计划                      考博简历

个人陈述                           套磁


考博视频课


 考博考情分析                    SCI投稿                     考博模拟申请
文献综述
科研软件
  ImageJ一本通            Origin软件
论文写作
  论文写作大礼包         经管科研一本通    计算机科研一本通



扫码添加学术顾问

回复【考博群】加入【考博资讯通知】群一手资讯抢先知,海量资料免费领!



想掌握更多考博 & 申博一手资讯、干货点下方关注我们哦~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存