查看原文
其他

当期荐读 2021年第1期 | 突发事件舆情观点识别与分析研究评述(内含视频摘要)

王晓、李纲等 图书情报知识 2022-04-25

     ISSN 1003-2797

     CN 42-1085/G2

     双月刊

     同行评审期刊



王晓①  李纲②  毛进②  叶光辉①

①华中师范大学信息管理学院,武汉,430079

②武汉大学信息资源研究中心,武汉,430072


目的/意义

突发事件情境下,及时有效地回应舆论关切成为舆情管理中的重要议题,梳理总结突发事件舆情观点研究现状与发展趋势有助于该领域研究开展与实践指导。

研究设计/方法

采集国内外有关突发事件舆情观点的科学文献,从信息分析过程角度出发,分为舆情观点识别、舆情观点组织和舆情观点分析三个方面进行综述。

结论/发现

随着知识图谱等技术优化与应用的不断推进,舆情观点研究可从识别细粒化、组织结构化、分析系统化等方面加以深化,在构建层次化舆情观点信息组织架构及图谱原型的基础上,建立系统化舆情观点多维演化分析框架与应用范式。

创新/价值

从信息分析过程的角度对突发事件舆情观点研究进行总结评述,为突发事件情境下舆情观点与知识图谱的深入融合应用提供参考。

关键词 

舆情观点 观点挖掘 信息组织 观点演化 舆情知识图谱 突发事件




1

引言

突发事件所具有的突发性和危机性,使该情境下的舆情信息呈现出全时段、全空间、由点到面、循环往复的病毒式传播态势。受网络放大效应和次生灾害叠加效应影响,事件及其相关舆情间关系结构的复杂性加剧,结合社交媒体平台中用户生成内容碎片化等特征,突发事件舆情易引发社会恐慌情绪、危害社会稳定,甚至掣肘政府施政。如何快速且有针对性地回应舆论关切,“将公众‘欲知’与官方‘告知’有效结合”[1],以有效地疏导公众负面情绪、维护社会安定团结、辅助政府应急管理工作有序开展,已成为当前突发事件情境下舆情管理工作的焦点议题。


社交媒体中,用户围绕突发事件舆情发表的意见文本包含了用户对事件整体或部分进行主观解读的认知表达和对事件本身及相关事物抒发主观评价的情感表达。伴随着舆情观点的认知表达和情感表达,观点持有者之间因互动行为或相似看法形成显性或隐性交流关系。然而此类文本数据具有书写随意化、内容分散化、关系结构复杂化等特征,极大地阻碍了及时、准确地辨识公众意见与态度,也就难以满足舆情回应内容的针对性、系统性和时效性要求。


目前有关突发事件舆情研究主题的综述大多集中于舆情传播[2-3]、演变[4-5]等机理研究和监测[6]、预警[7]、治理[8]、引导[9]等应用研究,以及舆情的基础理论[10]、特定方法[11-12]、特定主体[13]和特定情境[14-15]等现状梳理,尚未从信息分析过程的角度对突发事件舆情观点识别、组织、分析研究进行总结评述,一定程度上阻碍了突发事件舆情观点研究。通过整合与完善舆情观点识别、组织与分析三方面的现有研究,可以实现突发事件情境下舆情研究的协同优化。鉴于此,本文将从信息分析过程角度出发,系统梳理突发事件情境下舆情观点识别、组织、分析的研究成果,并从知识图谱深入应用于突发事件舆情信息组织与分析的角度展望未来研究趋势。



2

突发事件舆情观点识别研究

社交媒体为用户提供了意见表达的无限空间,围绕突发事件的讨论中,用户生成内容的含义模糊、指代省略、跳转随意等特点愈发凸显。现有社交媒体用户观点识别研究中,观点通常被划分为主题级和特征级两个维度,所采用的代表性方法如图1所示。突发事件情境下舆情观点识别主要采用文本主题进行表示,一定程度上限制了其中错综复杂的结构关系的挖掘与呈现,亟待引入研究丰富但在突发事件情境中应用较少的特征级观点识别方法,深入挖掘突发事件舆情观点内容,进而通过关联化的观点组织服务于结构化观点分析。


2.1

主题级观点识别

当前突发事件舆情观点识别通常以文本主题挖掘结果表示观点内容,主要方法如图1所示,采用主题模型的研究居多,共现分析、超网络、浅层机器学习等方法次之。具体而言,LDA主题模型频繁地被用于挖掘文本主题,以实现舆情观点的多维度识别[16],进而探索观点传播过程中的主题结构脉络[17]。基于共现分析的识别方法,通过词频加权计算优化主题词间相似性度量,从关键词聚类结果中提取核心主题,一定程度上提升了舆情信息精炼效率[18]。由社交、观点、情感、时序四层子网构成的舆情主题发现超网络模型[19],则通过多维度剖析舆情形成过程,利用超边分析挖掘舆情主题。此外,有监督机器学习方法综合了人类编码的有效性和计算机快速分析大量数据的高效性优势[20],显著提升了文本挖掘的可靠性和效率。四种常用方法具有如下不足:LDA在短文本信息稀疏的条件下表现乏力,需通过大规模数据并行挖掘优化精度;共现网络无法完整刻画突发事件中舆情观点复杂的多层面形成过程;浅层机器学习方法简单且易实现但数据依赖性强;超网络模型可以实现舆情观点的多维度识别,但在结果可读性方面有待优化。


主题级舆情观点识别研究存在难以准确解析和呈现舆情观点的固有局限,需借鉴特征级观点挖掘研究成果,辨析深度学习等方法技术在突发事件舆情观点识别中的适用性和有效性,为舆情观点的深层语义挖掘提供支持。


2.2

特征级观点识别

特征级观点识别研究重点关注由观点评价对象、该对象被评价的方面等构成的事件描述要素的识别,通常采用元组形式进行观点表示[21-22]。相较于主题级观点识别,特征级观点识别可围绕突发事件提供更细致的观点描述信息,进而藉由聚合与分解的观点组织呈现出更丰富的、多维度、层次化的观点分析结果。早期研究多围绕在线产品评论,后逐渐应用于网络舆情等场景;研究主题侧重算法优化,主要方法如图1所示,具体如下。


基于规则的特征级观点识别,主要包含基于规则/模板和基于词典等方法。其中,规则构建主要依据词性、句法等语言学特征,早期研究中多将高频名词或名词短语作为观点评价对象,将形容词或动词作为观点评价词[23-24],而忽略了低频词所代表的评价对象;改进研究中采用依存句法分析[25-26]、启发式回指分析[27]、语法分析与浅层语义分析相结合[28]等方法弥补早期方法的不足,但仍存在泛化能力不足的缺憾。基于词典的方法,操作简单但极其依赖词典质量[29],自动扩充词典时仍需以人工标注数据为基础[30]。整体而言,基于规则的方法简单且操作性强,但过于依赖预定义规则或选用词典的质量,难以应对突发事件中关系复杂和文本口语化等特点,极大地影响了观点抽取的准确性。


基于浅层机器学习的特征级观点识别,通常使用隐马尔科夫(HMM)[31]、条件随机场(CRFs)、最大熵、支持向量机(SVM)、决策树等模型。其中,CRFs因全局化考虑上下文信息,在评价对象抽取中备受青睐[32-33]。部分改进研究中将词性、词距离、句法关系等特征引入CRFs[34-35],藉由评价对象和评价词之间关系的识别优化观点抽取效果。但此类方法受到人工选择特征的限制,在模型效率和识别精度上仍无法满足突发事件海量数据中快速、准确识别舆情观点的任务要求。


随着深度学习方法的发展,相关学者也期望借助其强大的特征学习能力和自动高效的特征构造过程[36],实现特征级观点识别的突破性改进。研究主要采用不同深度神经网络模型[37-38],将文本表示为低维、密集的实值向量再进行观点挖掘。代表性研究采用7层深度卷积神经网络模型(CNNs)集成词嵌入模型和词性标注构建分类器[39],实现观点属性的有效提取。进一步研究中通过模型改进与组合应用[40-42],实现中文文本观点抽取精度提升[43]和处理可变长度输入语句的优化[44-45]。相较基于规则和浅层机器学习的识别方法,深度学习方法在特征级观点识别任务中具有明显优势[46-47],可在关系复杂、表述随意的突发事件舆情数据中更加高效、准确地提取观点。


综上所述,采用文本主题表征的舆情观点由于分析粒度的限制难以厘清突发事件中错综复杂的结构关系,需在方法层面上借鉴特征级观点识别研究。特征级观点识别的方法研究较为丰富,但在突发事件舆情中的应用有限,且基于规则和基于浅层机器学习的方法无法满足突发事件情境下的观点识别需求,深度学习方法可深入挖掘文本语义特征,相较于其他方法具有明显优势。



3

突发事件舆情观点组织研究

基于舆情观点由多元要素构成和多元主体参与的特点[48],现有研究多采用网络形式解析和存储多维度观点信息,以实现舆情信息的动态化、关联化、结构化组织。具体而言,一方面,依据构成舆情观点的多元要素,构建多维度、多层次的观点结构网络;另一方面,依据与突发事件有关的多元主体及其间关系,建立基于不同类型的主体或关系的观点交流网络。藉由网络形式对舆情观点进行组织,可为结构化舆情观点分析奠定基础。


3.1

舆情观点层次结构

相关研究主要从四个方面划分观点层次结构,如图2所示。前期采用扎根理论译码归纳,描述受众自信息源接收信息后,基于事件认知和情绪感知的舆情观点形成与异化过程[49]。其中,事件认知包含片面认知和全面认知,情绪感知由感知水平与期待水平对比产生。其后引入场论解构舆情观点,采用信息受众、情绪感知和应事实体[50]三类元素建构舆情观点的形式概念和呈现框架;情绪感知由情感极性及其强度衡量,应事实体用于表述相关事件认知和表达情感指向。同样基于场论,将受众范围进一步区分为个体、群体、整体三个维度[51],体现舆情观点的微观、中观、宏观三个层次之间的递进与包含关系。

互联网环境中,个体借助社交媒体围绕舆情信息展开的交流,对信息传播、个体或群体观点变化,乃至突发事件及相关舆情的发展均产生了不容忽视的影响[52]。网络中关键节点对于信息发布速度和规模的控制[53],也吸引了针对舆情观点交流关系展开的丰富研究。


3.2

舆情观点交流关系

舆情观点与其持有者,以及观点持有者所处群体环境之间存在极为紧密的关联,因此大量研究从舆情主体划分及其产生的影响,和舆情主体之间关系划分及其产生的影响两方面展开,如图3所示,具体内容如下。

一方面,社会系统的舆情信息传播过程中,突发事件的各利益相关者均参与其中,并根据其身份背景、对事件持有的态度和对舆情信息的理解程度进行判断和交流[54]。舆情主体的划分中,政府部门、媒体中介及信息受众是否属于突发事件利益相关者尚存在争论[55-56]。但由多主体推动的网络舆情显然存在不同主体之间的相互作用,现有研究主要从情感倾向和强度测度各类主题对舆情产生的影响[57],为突发事件及其舆情发展变化与管理引导提供参考[58]


另一方面,舆情主体之间的多重关系主要被划分为两类,即显性交流关系(如关注、转发、评论)和隐性交流关系(通常潜藏于共同的兴趣偏好中)。基于用户对自身持有观点与所处群体持有观点之间保持平衡的心理需要,研究探析了主体之间社交关系对用户舆情观点表达的影响[59]。同时,考虑各类舆情主体在讨论过程中各不相同的交流状态影响,研究探讨了突发事件舆情信息与持有观点之间转移的差异性[60],或与公共议程设置之间产生双向影响,进而改变公共议程设置模式[61]等内容。


综上所述,突发事件舆情观点组织分别围绕观点层次结构、舆情主体和舆情主体关系展开,研究相对分散,缺乏从整体角度对突发事件舆情观点内容、持有者及其间关系的综合分析。同时,观点的事件认知中,应事实体仅作为观点描述框架中的一类元素,未能深入解析观点实体、属性及其间关系,需与特征级观点识别方法结合,通过理论分析和数据实验细致解构突发事件舆情观点信息。此外,当前有关各类主体在舆情讨论过程中的相互影响主要集中于观点情感方面,可通过结合观点内容、交流关系等全面解析舆论传播中的影响机制。



4

突发事件舆情观点分析研究

现有突发事件舆情观点演化分析研究侧重于采用观点情感及其与主题内容、互动行为、参与主体的组合作为切入点,直观呈现突发事件中的舆情演变情况、发现舆情观点演变规律[62],如图4所示。为加强突发事件舆情系统性分析,刻画舆情观点多层次内容、多元主体之间关系,部分研究引入知识图谱技术,基于舆情主体、话题内容、情感立场等构建多维度舆情图谱,支持层次化、结构化的演化分析进而对舆情热点监测等进行优化。


4.1

舆情观点演化分析

早期舆情观点分析侧重宏观层面,多采用广泛的民意调查或准实验设计等方法,以情感倾向为表征分析政治、社会等领域中的个人或群体意见[63]。随着互联网技术发展,基于社交媒体平台提供真实、客观记录的舆情信息,研究使用情感词典、机器学习等方法[64],实现针对特定突发事件的公众舆论监测[65-66]。进而从深入发掘观点情感演化特征与波动规律[67]、拓展情感演化分析维度[68]和将分析结果应用于灾难应急响应优化[69]等多个方面,推进舆情观点情感演化研究。


舆情中的情感态度往往与观点内容、观点持有者等紧密相关。因此,越来越多的研究将观点情感分别与观点内容、参与主体、用户行为等要素结合展开分析,探究其间相互作用下的突发事件舆情观点演化。


从舆情观点内容角度出发,相关研究多以发文的标签、高频关键词或文本主题为表征[70-71],通过分析突发事件舆情中特定内容及关联情感的动态变化情况,探查公众对不同观点内容的情感响应[72],解析公众关注的焦点议题[73-74],结合生命周期理论分析不同类型突发事件中舆情观点主题与情感的演化规律[75-77],揭示主题和情感相互作用下的舆情演化[78]。从舆情传播角度出发,研究重点关注用户转发行为,探讨突发事件中观点情感的传播蔓延[79]、舆情情感与主题和传播环境之间的互动演化机制[80],以及观点情感表达对舆情信息发布与传播产生的影响[81]。从主体类型划分角度出发,相关研究通过建模探究突发事件中政府、媒体、民众的观点情感在时空演变中的相互作用[82],或基于利益相关者理论区分舆情主体角色[83],揭示各类利益相关者在突发事件中的关注焦点和情感状态[56,84]


4.2

舆情知识图谱分析

知识图谱由Google率先提出,以三元组为基本组成单位,描述实体之间关系和实体的固有特性[85],可用于表达丰富的语义信息。当前研究中,国外学者侧重技术层面的改进,例如解决因数据结构差异导致的匹配问题[86-87],或优化知识的有效表示[88]、推荐过程和结果的可解释性[89]等;国内学者注重以知识图谱为基础架构的实践应用,例如围绕教育、医疗等领域,对个性化学习资源推荐[90-91]、精准导医系统构建[92]等展开研究。


大数据和人工智能技术的蓬勃发展为知识图谱提供丰富且开放的知识资源,赋予其跨领域集成和强大知识计算的能力。引入知识图谱技术的突发事件舆情管理,可藉由文本语义扩展、多源异构信息整合及其间关系梳理揭示,实现观点组织分析的结构化和系统化。当前,相关研究呈现明显增长态势,主要探讨突发事件情境下基于知识图谱的舆情知识组织、舆情演化分析、舆情热点监测等。


得益于丰富的语义信息表示,舆情知识组织研究中运用知识图谱技术,通过扩展文本表示向量,优化了微博短文本的主题分类效果[93];整合多源且跨语言的舆情信息[94],细节化展现和扩充突发事件相关知识,提升了动态舆情信息研判的准确性;从多模态舆情信息中抽取评价对象[95]、人物关系[96]、事件及其评论信息[97]等,基于其中观点信息结构进行融合,进而自动构建相应舆情知识图谱,实现舆情实体及其关联信息的结构化组织。


以结构化的舆情知识组织为基础,舆情观点分析通过构建舆情情感或主题图谱,强化了突发事件中事件信息、观点内容、观点情感及观点持有者之间的关联性,实现了更具系统性的多维度演化分析,有助于更加全面且细致地揭示突发事件舆情观点演变过程。其中,舆情主题图谱以突发事件评论文本的主题内容与热度[98]为基础,细分舆情事件的实体类型,从主题内容“故事线”和事件发展“时间线”两方面展开分析[99],或构建以用户为实体、认证信息为属性、互动关系为连边的意见领袖主题图谱[100]研究意见领袖传播能力。舆情情感图谱通常基于观点持有者的转发或评论关系[101],结合生命周期理论、文本主题[102]、利益相关者[83]等,分析舆情观点内容、情感的变化趋势及不同类型主体的情感状态分布与传播路径。此外,舆情监测研究通过引入知识图谱,基于突发词项的语义扩展构建突发话题图[103],从全面性和准确性两方面优化话题检测。


综上所述,一方面,突发事件舆情观点分析关注观点情感及其与不同观点要素结合的演化态势,并对更细粒度地探索和更全面系统地揭示观点与用户之间的多元关系提出要求。然而以主题为表征的舆情观点无法有效解析突发事件中的复杂结构关系,难以全面梳理舆情观点的时空演化模式,且目前观点情感与其他维度的联合分析相对割裂,亟待探索系统化剖析与层次化呈现的方式方法。另一方面,知识图谱技术研究成果较为丰富,应用于突发事件舆情研究中尚处于发展阶段,有待探究深入结合应用方式以满足突发事件情境下舆情观点的结构化组织与系统化分析需求。以知识图谱的通用组织架构为基础,结合突发事件及舆情的领域知识特征,可从识别细粒化、组织结构化、分析系统化等方面整合推进突发事件舆情观点研究。



5

结语与展望

分析发现,基于上述研究的深入融合,寻求细粒度、结构化的舆情观点识别与组织,并由此系统性分析舆情观点演化的研究较为缺乏,但信息分析过程核心步骤的协调优化正是推进突发事件情境下舆情观点分析的有效途径。从这一角度出发,未来研究趋势包含但不限于以下方面。


(1)构建系统完整的舆情观点信息组织架构与图谱原型。社交媒体中的用户生成内容具有明显的随意性,致使观点信息难以被有效组织,同时突发事件中信息的病毒式传播和边界模糊,进一步加剧了舆论中观点表达的碎片化,极大地阻碍了舆情管理的现状研判和发展预测。目前有关研究主要集中于舆情主题和情感的识别、组织与分析,对于更细粒度的舆情观点评价对象、评价方面等缺乏关注。相应地,围绕着舆情观点及其持有者之间的多重信息,如观点持有者对评价对象间关系的主观认知和有关特定评价对象或其方面的情感表达、评价对象所属基础概念类别、不同观点之间相似或对立的关系等,也亟需通过更为完善的描述框架和图谱原型被有效地、系统化地组织起来。


(2)建立立体全面的舆情观点多维演化分析框架与应用范式。舆情观点多维演化是丰富立体的舆论认知视图,是明晰舆论焦点的重要依据,也是预测舆情发展方向的关键基础。目前舆情观点演化研究还存在一定局限,且尚未有效融入到突发事件舆情情报支持体系中,亟待形成成熟的舆情观点多维演化分析框架与应用范式,主要体现为:①舆情观点分面与协同演化分析。基于舆情观点图谱的结构化信息组织,在分面拓展舆情观点演化分析之外,还应关注到其中不同维度之间的协同演化,基于此探究舆论演变的主导模式和关键节点;②舆情观点演化不只是对舆论演变的回溯性调研,还应在总结归纳不同主导模式之下的舆论演变规律和作用机制的基础上,为舆论焦点预警、应对方案备选和舆情回应发布路径选择等提供情报支持。


突发事件情境下,舆情观点识别与分析是舆情管理研究的前沿热点,准确快速地明晰舆论发展态势也已是舆情管理工作的焦点议题。鉴于此,构建系统完整的舆情观点信息组织架构与图谱原型,建立立体全面的舆情观点多维演化分析框架,挖掘舆论演变的主导模式和关键节点,总结不同主导模式之下的舆论演变规律和作用机制,将为实现对社交媒体舆情的准确掌握与预测,遵循舆情发展规律制定舆情导控策略,助推更具针对性舆情回应,为把握舆论引导“时、度、效”的智能舆情应对模式的形成提供支持。




作者贡献说明

王晓:文献调研分析,论文撰写与修改; 

李纲:提出研究思路与框架; 

毛进:论文修改与最终版本修订; 

叶光辉:论文修改。




参考文献


*本文原载于《图书情报知识》2021年第1期93-102

版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。

制版编辑 | 卢慧质


--END--


当期荐读 2021年第2期 | 卷首语 预见学科之美:学科主题预测研究

当期目录 | 2021年第2期

当期荐读 2021年第1期 | 学术代表作时间周期、首发载体及题材类型特征研究 ——以图灵奖为例(内含视频摘要)

当期荐读 2021年第1期 | 任务驱动下的学术数据库新手心智模型演进及学习模式研究(内含视频摘要)

当期荐读 2021年第1期 | 图书馆在国际文化交流中的作用与地位


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存