巢乃鹏 吴兴桐等 | 计算传播学研究现状与前沿议题
原文刊载于《全球传媒学刊》2022年第1期“2021 年新闻传播理论与前沿”专栏。
作
者
巢乃鹏:深圳大学传播学院教授。
吴兴桐:深圳大学传播学院博士研究生。
黄文森:深圳大学传播学院助理教授。
李梦雨:深圳大学传播学院博士研究生。
概
要
【摘 要】伴随着大数据和计算社会科学的兴起,计算传播学在一定程度上代表了传播学在数字化时代学科范式的转型。计算传播学的学科渊源主要来自于数据科学、网络科学以及传播学。本研究从5W的视角对计算传播学的研究文献进行了综述,并在CNKI中以“计算传播”和“计算传播学”作为中文关键词进行检索,在Web of Science中以“Computational Communication”和“Computational Communication Research”为英文关键词进行检索,对检索所得文献进行主题建模分析,试图更全面地呈现计算传播学研究的版图。本研究还进一步探讨了计算传播学未来研究需要关注的重点议题,除了需要对计算传播学的元理论进行深入思考外,也特别建议研究者在采用计算传播视角开展研究时立足于中国社会的具体语境探究重大现实议题。
【关键词】计算传播学;大数据;主题建模
一、计算传播学的兴起
“计算传播学”(Computational Communication Research),可以被理解为一种正在兴起的数据驱动的研究取向,是基于人类传播行为的数字足迹,采用文本挖掘、情感分析、社会网络分析等带有显著计算特征的数据分析方法以探究人类传播行为的表现模式和内在逻辑(巢乃鹏,2019);大规模数据集、可计算、可建模成为计算传播学有别于传统传播学的显著特征。也因此计算传播学带有浓厚的方法和工具的属性特征,所以计算传播学也被研究者(在之前的一段时间中,乃至于有可能在以后的一段时间中)普遍认为是研究方法的转型,而非传播学范式的转型。然而随着整个人类社会都在迈向数字化,(新生代)人类的传播行为大多依赖于数字化平台来实现,即便是在现实空间的传播与交流行为,也因为各种技术的突破可以被数字化记录和存储,因此传播学所探究的人类传播行为自身已经显现出显著的数字式倾向。传播学关注的对象是数字化,其研究范式不可避免地也需要有数字化的转型。因此我们认为计算传播学并不仅仅是一系列研究方法和工具的集合,它更有可能是整个传播学在数字化时代的学科范式的转型。
计算传播学的起源来自于整个计算社会科学的兴起。2007年,邓肯·瓦茨(Duncan Watts)在《自然》杂志上发表了《二十一世纪的科学》一文(Watts,2007),指出社会科学是21世纪最重要的科学,现代社会所面临的绝大多数问题是社会科学研究的问题,而基于互联网传播产生的数据和互动性将会变革我们对于人类集体行为的认识。2009年,拉泽(Lazer)和彭特兰(Pentland)等社会科学家与计算机学者阿达米克(Adamic)、网络科学家巴拉巴西(Barabási)等16位学者在《自然》杂志上发表了一篇题为《计算社会科学》的论文(Lazer et al.,2009),标志着“计算社会科学”这一新兴学科的建立。他们指出,随着用于研究的数据不断增多以及人类计算能力的不断增强,采用计算作为研究的基础手段的社会科学业已形成。在这之后,几乎各个社会学科都涌现出了计算导向的新的学科范式:计算法学(钱宁峰,2017)、计算政治学(杨阳等,2017)、计算社会学(罗玮、罗教讲,2015)、计算传播学(王成军,2016)等等。具体到计算传播学本身而言,香港城市大学的祝建华教授团队是计算传播学最早的倡导者,也是最重要的倡导者之一,其学生王成军博士是最早在国内提出了“计算传播学”概念的研究者。就计算传播学学科渊源而言,我们认为主要受到三个学科发展的重要影响:数据科学、网络科学以及传播学,其相互之间的关系和关联如图1所示。
毫无疑问,大数据时代为科学研究带来了新的机遇,也从根本上促使了科学研究的认识论和研究范式的转变。2007年,Gray将科学研究分为四种范式——实验科学、理论科学、计算科学和数据密集型科学发现,并指出人类社会正在转向第四范式——数据密集型科学发现(吉姆·格雷,2010)。这种转变显然得益于大数据时代的海量数据,以及来自于计算机科学(深度学习)领域数据分析工具的进步和易用性的提升。对包括新闻传播学在内的社会科学而言,数据科学一方面有助于在海量数据甚至于全样本层面检验已有理论,另一方面,通过使用数据来提出假设以进行检验的探索性数据分析(exploratory data analysis)方法的提出改变了以描述性分析和验证性分析为主的传统统计学,也意味着基于数据科学的理论发现模式成为可能(朝乐门等,2022)。
计算传播学另一个重要学科来源就是网络科学(Network Science)。传统传播学从诞生之际就与社会网络研究紧密相关,从心理场与社会计量学继承而来的理论和研究工具,为传播网络理论的形成奠定了基础。大数据时代,互联网和社会化媒体的传播逻辑与网络社会的结构性变化相契合,网络化的传播模式和生态展现出前所未有的复杂性和多样性特征。网络科学正是在这样的背景下日益发展成为专门研究复杂网络系统的定性和定量规律的崭新的交叉科学,研究涉及复杂网络的各种拓扑结构及其性质、与动力学特性(或功能)之间相互关系、网络上各种动力学行为和信息的传播、预测与控制,以及社会实践所涉及的网络原理研究等(方锦清等,2007)。如果说数据科学的视角为计算传播学提供了应对大数据处理和应用的技术和手段,那么网络科学就为计算传播学提供了分析网络传播行为和系统复杂性的理论和工具,巩固和提升了计算传播学的科学性和实用性。
网络科学和数据科学为计算传播学的发展提供了新的研究思路和工具方法,但这些工具方法的使用其根本目的是在于发现人类传播行为和传播现象的新模式,并探究隐藏在这些模式之后的原理和机制;此外也可以对原有新闻传播理论进行大数据的检验,回应在有限样本下的已有理论的准确性(巢乃鹏,2019)。人类传播行为(线上线下)和传播现象是计算传播研究的对象,是研究的基础,新闻传播学的经典理论同样也应该是计算传播学的理论基础和研究出发点。
从学术共同体和学科建制的角度来看,计算传播学发展速度非常迅速。2016年祝建华、彭泰权和梁海等人在国际传播学会(ICA)建立一个“计算方法”(computational methods)的兴趣小组。2018年4月,由祝建华、巢乃鹏、王成军等发起成立了中国新闻史学会计算传播学研究委员会。这些学术组织的成立很快团结了一大批新闻传播学、计算机科学、网络科学等多个学科的学者,虽然对于计算传播学的共识仍有待于凝聚,但学术共同体正在逐步形成。值得指出的是,中文语境下的计算传播学与国际范围的计算传播学之间的发展几乎是同步和相互推动的,这种情形在传播学其他分支中是罕见的(祝建华等,2018)。这种现象的出现有其独特因素,即作为计算传播学引领者的祝建华教授本身就是一位融通中西的知名传播学者,而其团队也是国内外计算传播学的中坚力量。除了学术共同体之外,伴随着计算传播学影响力的显现,国内外众多高校诸如加州大学戴维斯分校、斯坦福大学、南京大学、北京师范大学、暨南大学和深圳大学等纷纷建立计算传播研究机构;复旦大学、南京大学、北京师范大学、深圳大学等国内新闻院校开始招收计算传播方向的博士研究生;2019年国家社会科学基金重大项目“大数据时代计算传播学的理论、方法与应用研究”获批立项。上述种种迹象表明,计算传播学也正在迈入学科建制体系中。
二、计算传播学研究现状
计算传播学的发展时间虽然并不长,但是伴随着大数据时代整个社会科学计算化的转型,计算传播学的相关研究已经非常丰富。更主要的是,作为一个典型的交叉学科领域,来自于不同学科(不仅仅是社会学、政治学、心理学等传统意义上新闻传播学的肇始学科;还包括物理学、数学、计算机科学、网络科学、医学等众多跨大学科门类的学科)的研究者纷纷将人类(线上线下)传播行为和传播现象作为研究对象,寻找研究问题。海量(人类传播)数据的存在和层出不穷的传播现象也使得越来越多的研究者驻留在传播研究的领域中。从这个角度上来说,(计算)传播学正在成为一个平台性的学科,而不是“十字路口”(巢乃鹏,2019)。但正因为此,计算传播学的研究文献非常多元化,且分布在不同学科领域中,难以进行全样本的分析。本文将计算传播学研究的现状分成两个部分介绍,第一部分站在传播学经典的5W视角对相关研究文献做简单介绍,第二部分分别以“计算传播”和“计算传播学”作为中文关键词对CNKI数据库进行检索;以“computational communication”和“computational communication research”为关键词对WoS(Web of Science)数据库进行检索,对检索所得文献进行主题建模分析。
(一)计算传播学的研究领域:以5W划分
5W是传播学研究历来的核心,作为传播学研究一个新的研究取向,计算传播学研究的主要问题仍然以5W为核心(祝建华等,2014),即关注“谁(传播者),通过什么(渠道),对谁(受众),说了什么(内容),并产生了什么影响(效果)”这五个领域的问题。但同时,计算传播的新方法为传统传播学研究提供了新的研究视角,让过去一些难以被观察、量化的研究对象成为可能,带来了许多新的发现。
1. 传播者研究
对传播者的研究主要是针对传播过程中主要信源的分析,如政府新闻发言人、媒体人员,以及在互联网时代发布信息、表达观点的广大网民。在社会化媒体时代,传播者成为了弥散在网络各个角落的存在,传统的传播学研究只能触及到零散的部分人群,而无法对该群体做一个整体的描述和分析,但计算传播学在观察、描述大规模不同类型网络传播者的传播行为及其在传播结构中所处的地位方面具有独特的优势。
不少计算传播取向的研究对社交网络中不同类型传播者的传播行为进行了刻画和分析。例如,有研究者在研究2012年美国大选期间的推特内容时,将传播者分为“媒体”“政党”“专业博客”三类,并分别计算其对普通用户在“选举”“经济”“国际”等六大类议题上的影响力,进而采取“川流式”(Rivertheme)可视化系统展示了三类传播者在不同议题和不同时间上的竞争关系(Sun et al.,2014)。
最近,社交媒体生态中的多元传播主体的交互行为和协同演化,也成为了一个重要的研究议题。如研究者在一项关注新冠肺炎疫情下不同舆论主体的传播行为的研究中,使用时间序列的动态回归模型(dynamic regression model)方法,对新浪微博中五类传播主体的舆论声量时变数据进行分析,研究表明以政务微博与新闻媒体为代表的官方话语空间,以及以个人用户为代表所形成的民间话语空间内部都出现了一定程度的融合,然而两个话语空间之间在舆论时序模式和相互影响上却出现了明显的分化趋势(汪翩翩等,2020)。
在政治传播领域,卢樱丹等人(Lu & Pan,2021)在结合民族志的基础上,采用主题建模、自然语言处理、大规模人工编码等方法对213个中国市级政府微信公众号的197303篇宣传推文进行内容和结构分析,实证评估中国政府是否采用“标题党”(Clickbait)策略来获取点击量以提高政治宣传的可见性、点赞量,广泛使用该策略的微信号是否更有可能拥有高的曝光度和传播范围。
2. 受众研究
在网络时代,随着意见表达门槛的降低,传播意义上的传播者和受众之间的界限逐渐模糊,但这并不意味着受众身份就此不复存在;在各类社交媒体中除了积极进行意见表达的群体之外,还有很大一部分从不发帖或转发内容的“围观者”。部分计算传播学的研究就关注到了这部分“沉默”的群体,通过用户的行为数据去寻找、确定广大“围观”人群,估算这类群体在社交媒体用户中的比例(祝建华等,2014)。
Benevenuto等(2009)收集了37024名用户12天内在四个流行的社交网站(Orkut、MySpace、Hi5和LinkedIn)上详细的点击数据,通过第一手数据直接比较用户在社会化媒体上创造与消费信息行为。
受众的阅读浏览行为同样引起了计算传播研究的关注。刘钰森等(2019)根据在2016年搜狐新闻客户端的服务器日志中提取的190万条新闻浏览数据,利用小批量k均值(MiniBatchK-Means)分类法、决策树机器学习算法以及逻辑回归分析等方法,从时间演化层面探究移动媒体时代用户新闻消费时间模式及其影响因素。
此外,还有研究者根据荷兰两家报纸在线渠道的新闻用户的“点击流数据”(clickstream data)的特点,使用轨迹聚类分析(trajectory-based clustering analysis)的计算方法检测,基于时间和内容的用户与新闻消费行为之间的交互模式,以揭示用户在新闻阅读过程中如何在主题之间切换(Makhortykhetal.,2020)。
在品牌消费研究方面,为了检验消费者对“黑命贵”(Black Lives Matter,BLM)运动中品牌传播的反应,研究者结合人工方法和机器学习算法对社交媒体Instagram上110个帖子的32702条评论进行计算、定性和定量分析。结果显示,黑人影响者(influencer)发布的BLM内容比非黑人影响者和品牌的帖子更能提高消费者的参与度(Yang et al.,2021)。
3. 效果研究
效果研究在传统传播学研究中占据重要地位,在计算传播研究中同样是十分重要的研究方向。传统的传播学研究通常是借助对用户态度、行为的改变来评估传播效果,而计算方法能让研究者获取和观察到大规模的用户行为数据,通过这些行为痕迹能更精准地把握用户的态度和情绪。
在计算传播研究中,研究者通常将文本或视频等多媒体内容与用户的行为结合起来分析其对用户认知、态度和行为所产生的影响。研究者通过减少脸书信息流中情绪化内容的数量来研究其对用户行为的影响(Kramer et al.,2014)。
张伦等(2017)分析了“冰桶挑战”运动在优酷网上的传播特征以及传播效果。利用文本挖掘方法呈现了参与“冰桶挑战”的用户对于“渐冻症”疾病的认知度以及情感态度的演化。进而将用户对于“渐冻症”疾病信息的认知度以及对媒介信息的评价作为传播效果变量,利用“分层线性模型”对视频信息“诉诸事实”策略以及“诉诸情感”策略的传播效果进行分析,验证了说服理论在社会化媒体平台的适用性。
社交媒体不断提供政治传播内容曝光的可能,造成个体的态度和情感两极分化,例如有研究者采用计算方法探索社交平台Reddit上的政治讨论对情感极化(affective polarization)的影响,使用贝叶斯估计方法来识别用户的意识形态倾向,并使用VADER分析框架计算评论文本的情感得分。经过多层模型分析实证了在线对话内容及其发生的群体语境是情感极化的重要决定因素(Marchal,2021)。
在更宏观的社会效果层面,新闻媒体对流行病的报道被认为可能会影响公众的认知和行为模式,研究者(Ophir et al.,2021)使用了一种整合归纳和演绎方法优点的主题模型网络分析(analysis of topic model networks)的计算方法分析意大利新冠肺炎疫情的媒体报道,并将其与谷歌的社区移动数据相结合,经过基于向量自回归模型的时间序列分析表明,随着时间的推移,不同媒体框架的重要性与人口流动模式的变化有关。
4. 内容研究
传播学中的内容研究重在分析各大传播主体所发布信息内容的主题和特点,过去多集中在报纸、电视等媒体机构发布的新闻。但在网络时代,尤其是诸多社会化媒体的出现极大地改变了传媒生态,网民在社会化媒体上发布的各类信息大大丰富了内容研究的研究对象。例如党明辉(2017)通过对网易新闻5周时间内7700篇新闻及300多万在线新闻评论的跟踪和情绪分析发现,在线新闻评论中的负面情绪化表达较为普遍,其中最突出的情绪是愤怒,同时悲情叙述也较为普遍,焦虑情绪表达则相对较少。
韩纲等(2017)爬取了推特(Twitter)上16天内包含与癌症相关的关键词的269万余条推文,并创建了包含223条关键词的分类法对爬取内容进行过滤,从发送频率、周期、同步出现和情感4个方面对过滤后的113万余条推文进行了语义分析和可视化呈现。
内容研究的一个重要的类型是虚假新闻研究/谣言传播研究。Chatfield等(2017)研究了2016年美国总统大选中网络媒体报道中有关特朗普的假新闻,采用文本挖掘和情感计算的方法进行分析。结果显示,针对特朗普的负面报道框架远超过针对希拉里的。
文本的情感计算是自动化内容分析(automated content analysis)的一个重点应用领域,目前已经被计算传播研究者广泛应用于分析在线文本或表征概念所反映的态度和情绪表现。例如最近一项关注机器人技术的线上讨论的研究以“robot”“AI”“automation”“bot”“intelligent agent”和“software agent”等术语为关键词在社交平台Reddit上采集了大规模的评论文本,使用VADER和LIWC文本分析工具对评论进行情感分析,并进行logistic回归模型分析。结果揭示了上下文和术语如何影响关涉机器人技术讨论中的情绪(Savela et al.,2021)。
随着计算机视觉技术的发展,视觉内容的计算分析近年来日渐成为新的热点领域。例如,政治人物的视觉形象被认为在网络政治传播中扮演着重要的角色,研究者研究了欧洲议会选举期间新闻媒体或政客自己通过社交网站呈现的候选人形象,结合计算视觉分析工具(Face++)和人工核验方法,对79500张人物照片(涉及28个欧洲成员国的13811个候选人)进行内容分析。研究结果显示,社交网络上的自我描绘表现出更多的“微笑”(smiling),而新闻机构的照片则倾向于使用更多广角和特写镜头(Haim & Jungblut,2021)。
5. 渠道研究
渠道研究系统地连接了新闻传播学研究的各分支(如传播者、信息内容、传播效果),并衍生出众多的研究传统(如新闻扩散、创新的扩散)和研究视角(如传播网络分析)(祝建华等,2014)。计算传播的大数据挖掘和处理在这一研究领域作用尤其突出,让很多过去传统传播学研究中难以观察分析的传播网络结构、信息扩散特征等较宏观的传播议题得到关注,涌现了大量新的研究成果。
社交媒体中的信息扩散模式是其中一个重要的研究议题,不少计算传播研究选取一个或多个特定事件的传播内容以追踪其扩散网络特征及影响因素。李彪(2011)以40个影响力较大的网络事件为研究样本,选取其传播初期的前三个信息节点,运用社会网络分析方法,分析了网络事件空间传播结构在中心度、中介性、密度和子群等方面的基本特征。
张伦等(2016)利用语义建模、情感分析等方法探讨了“禽流感”这一微博信息传播案例中网络信息结构性扩散度的分布特征及其影响因素。研究发现,结构性扩散度的分布与传播广度相比,其分布更趋向于正态分布。
从关系网络结构分析传播个体或组织的交互作用和动态关系,成为国内计算传播研究者关注的一个重要面向。例如,有研究者基于新浪微博的文本和关系数据构建了新闻媒体官方账号的转发和引用网络,采用社会网络分析方法和指数随机图模型媒体传播关系生成的影响机制(黄文森、廖圣清,2021)。
在信息扩散研究方面,宋韵雅等应用计算方法分析了大规模的新浪微博“谩骂”文本的语料库,重构了谩骂与非谩骂推文的级联网络(cascade networks),并基于转发深度、宽度和层间宽度比等结构指标评估扩散的生成过程(Song et al.,2021)。
(二)对计算传播学研究文献的文本分析
为了能更清晰地呈现计算传播学研究的现状,本研究还将CNKI中国学术期刊网络出版总库的社会科学学术期刊论文库作为数据来源,以“计算传播”和“计算传播学”为关键词,通过主题模糊检索+精准检索的方式,获取2011—2021年共11年间所有与计算传播学研究相关的论文。在剔除会议、广告、报纸、学位论文、图书等数据类型以及非传播学期刊发表的论文后,得到81篇中文期刊论文;又将科学网(Web of Science,WoS)核心数据集,以“computational communication”和“computational communication research”为关键词,通过主题模糊检索+精准检索的方式,剔除掉书评和编辑部文章后,得到2011—2021年共52篇英文期刊论文。当然,需要说明的是,这种文献检索方法以及所检索出的133篇中英文文献远远无法反映计算传播学的研究现状。因为大量的计算传播学的研究文献并不会以“计算传播”“计算传播学”“computational communication”和“computational communication research”作为论文关键词。
从图2中可以看出,计算传播学研究文献一直保持稳定增长,特别是2018年以来,增长的速度尤其明显。图3是关于检索获得的相关文献中计算传播研究方法采用的情况,可以看出计算传播研究方法与传统社会科学的量化与质化的研究方法有着根本差异,这是计算传播学最显著的一个特点。在各种研究方法的采用中,社会网络分析、文本挖掘、机器学习是中外研究文献中采用最多的方法,但是在中文文献中采用较多的主题模型和仿真模拟的方法在英文文献中却相对较少。这很大程度上是因为文献检索没有能覆盖更多计算传播研究文献所导致的。
对CNKI和WoS上的计算传播学期刊论文的引文信息(标题和摘要),本研究使用自动化文本分析方法,从常用的LDA主题建模方法(latent dirichlet allocation)来进行主题划分。其中,为了强化主题词的准确度,我们使用关键词作为用户自定义的分词词典。由于论文数量和摘要词语数量有限,我们设置LDA模型迭代次数为2000次;为了提升主题词的有效性,本文设置LDA模型的最小主题词语长度为2。
本研究使用困惑度(perplexity)作为确定主题数目的评价指标,并分别得到CNKI和WoS下的计算传播学论文的LDA模型困惑度变化情况。当困惑度下降达到趋势拐点时,此时的主题数目为最优主题数。在本研究中,CNKI和WoS对应模型困惑度拐点,主题数目均为7(见图4)。
经过LDA模型训练和主题抽取,最终分别选取CNKI和WoS中的7个最优主题。抽取各主题下高概率的词项,通过文献查询和专家咨询,得到主题、词项分布情况,如表1所示。
本研究进一步根据文档、主题概率分布,得到每篇文档从属于不同主题的概率,加总得到每个主题的强度。CNKI和WoS的主题及其强度如表2所示。
总体而言,除了一个主题外(国内学术界对计算传播人才培养较为关注,而国际学术界则对政治传播议题较为关注),在其他主题方面国内文献与国际研究基本保持一致,但是中外学术界在计算传播学研究的具体主题强度上还是有一定的差异。国际学术界最为关注的是健康传播议题,其次是计算方法,再次是计算范式;而国内学术界最为关注的是计算范式,其次是研究特征,再次是计算方法。
1. 计算范式与计算方法
随着计算传播学的不断深入发展,关于计算传播学的科学范式和计算意识的思考,成为计算传播学实践和研究中的热门主题。提到计算范式往往包括对计算方法的描述,因此本研究将两个主题放在一起讨论。郭小平、张小芸(2018)认为短视频推荐要实现和用户需求的数字联结与精准匹配,需要运用场景洞察、情感计算及用户需求挖掘等计算传播手段。王成军等(2019)在考察双重意见气候作为研究“沉默的螺旋”(spiral of silence)的框架时,提出使用多主体建模(Multi-agent Model)的计算传播学手段,将参考群体重新引入对沉默的螺旋的研究当中。巢乃鹏(2019)指出人工智能将大大提高计算传播学的计算能力,与无监督和监督学习方法相结合,使用自动化内容分析、情感分析和社会网络分析等方法为计算传播学研究提供了数据处理、整合和分析的研究策略和经验。Huffaker等(2011)认为沟通语言能够用于增强多党谈判中联盟的团结感,通过语言趋同和赞同会增加潜在联盟伙伴之间的一致性,而负面情绪词的表达会降低一致性。
2. 理论研究
计算传播学作为一种新兴的研究取向,从学科发展的角度来说,还处于起步阶段,因此面临研究理论、方法和实践等层面的发展困境,巢乃鹏、黄文森(2020)指出需要从理论意识、方法意识、数据意识、问题意识和伦理意识出发,构筑大数据和新媒体技术环境下计算传播学的理论基石和方法论体系。张伦等(2020)以《延禧攻略》为典型案例,使用文本挖掘等计算手段探究中国影视剧海外社会化媒体传播模式。Huskey等(2020)借鉴DavidMarr的生物学三级解释框架(Marr's Tri-Level Framework),将其应用在传播科学的受众研究、说服和社会比较三个研究领域。该研究为自然科学领域的经典研究模型和框架进入社会科学和传播学研究提供了从科学意识到人文意识转换的典型案例。当下国内外对于计算传播学中的方法论体系应用相对较多,并且具有较强的问题意识和方法意识,但是对于计算传播学自身理论基石的探讨还有待提升。
3. 研究实践
新闻传播是一个与实践结合非常紧密的学科,来自于实践的第一手数据是发现新闻传播机制的重要基础。基于大数据的计算传播赋予传播研究在数据获取和处理方面的优势,也理所当然地成为计算传播研究的一个重要领域。吴晔等(2021)在对主流媒体短视频人格化的传播效果考察过程中,采用计算视觉技术与人工编码相结合的方法,对抖音《主播说联播》栏目进行视觉内容分析。周葆华、钟媛(2021)在探究李文亮微博社交媒体下的用户评论时,通过文本挖掘和情感分析,分析并阐释社交媒体时代对公众人物的网络集体悼念,并扩展提出“延展性情感空间”概念。Graves等(2016)通过对Twitter中2012年超级碗与2013年棒球世界大赛的相关事件分析,将文本的上下文概念转化为一个社会技术场所,提出信息基础理论和第三方理论来解释其中出现的子语境状况,并使用定性分析和理论为未来事件检测算法的设计提供信息。Hopp等(2020)指出框架和事件序列中间存在包含不同道德框架和事件关系的“隐藏状态”(hidden states),通过隐马尔可夫模型识别得到这些“隐藏状态”,可以预测未来的新闻框架和事件,由此构建一条跨多个研究领域的新闻事件周期综合研究之路。
4. 健康传播
新冠肺炎疫情在世界范围内引发一场大流行的公共健康危机。作为社会科学的计算传播学,不能在现实层面消灭新冠病毒,但是却可以为健康传播提供一份计算能力。王袁欣、刘德寰(2020)以《纽约时报》和《卫报》为例,采用LDA主题模型对海量新闻文本数据进行分析,解释两者在媒体框架选择上的区别,勾勒出西方主流媒体的报道重点。Kee等(2016)通过将简单的社会聚集模型(Simplicial Model of Social Aggregation)与现有的意见领导和扩散网络研究相结合,对社区卫生干预的简单扩散者进行计算模拟。Britt等(2021)通过考察r/COVID-19社区参与者表达的信息,进行计算内容分析以确定r/COVID-19上用户交流的主要主题,同时使用逐步分段回归评估用户贡献量的纵向变化。健康传播研究人们通过传播媒介渠道制作、传递和分享健康信息的过程,这其中产生大量的数字踪迹使得计算传播学能够为其提供更多的计算范式的帮助。
5. 研究特征
作为跨学科的新兴学科,计算传播学借助智能化、数字化的计算方法分析和诠释数字时代下传统传播学理论对于数字人群及其数字生存状态的理解、转变和影响力,并以可视化的方式进行展示和呈现。王成军(2016)使用“新闻地图”研究项目以可视化的方式呈现了新闻事件的时空分布,讨论了计算传播学研究中存在的从数据到模式、再从模式到机制的研究思路。冯鑫等(2018)以中捷友好交流报道为研究对象,多方面对报道内容进行量化研究与可视化展现,并对《人民日报》历年中捷友好交流的报道进行时间序列分析,从计算传播视角完成了静态的量化评价和动态的演化分析。Maireder & Schlogl(2014)在对关于德国日常性别歧视的社会政治讨论研究中,讨论了网络公共建设中社会行为、社会网络和相互关联的数字对象之间的关系,将计算研究方法和传统的内容分析应用于大量推特数据。
6. 人才培养
巢乃鹏、黄文森(2020)认为计算传播学存在成为替代传播学定量研究的主流范式之一,即其具有成为新兴学科的潜质。刘庆振等(2019)提出计算传播学丰富着传播学的经典理论,重构着传播学的学科知识,有助于培养传播学的创新人才。喻国明(2020)从发展计算传播学、新技术革命的挑战以及以人为本的角度深入思考了智能时代传播学科建设的若干问题。周葆华(2020)则指出作为“常规科学”的传播学亟待学科突破与范式创新,为计算传播的兴起提供了新的想象与机会。
7. 政治传播
社交媒体的快速发展,使得政治参与和传播行为从线下转移到线上,为开展计算传播提供了必要的数据基础。Popiel(2020)结合计算文本分析和定性文件分析联邦通信委员会(FCC)委员20多年来的7500多篇演讲和声明,以研究政治和行业对政策制定的影响如何在话语中体现,揭示了监管机构、政党关系等如何通过影响议程设置过程来对IRA产生影响。有研究者使用计算传播学方法以细粒度的方式跟踪政治对话,结合不同算法来捕捉在线政治谈话的动态互动结构和内容,分析数字领域的政治极化问题,并指出社交媒体的政治极化存在显著的跨平台差异(Yarchi et al.,2021)。Haim等基于早期关于非语言行为、上下文特征和结构特征都会对在线政治传播(尤其在竞选期间)产生特殊影响的研究,并使用逻辑回归模型用于估计非言语行为、上下文特征和结构特征(Haim & Jungblut,2021)。
三、未来计算传播学应关注的重点问题
(一)计算传播学需要在理论研究层面有所突破
如果我们认可Lazer等(2009)所提出的标志着大数据环境下整个社会科学范式转型的“计算社会科学”这一概念,那么就不能简单地从方法和工具的角度去理解这一新的学科范式。换而言之,我们需要从科学研究的基础、从认识论的角度去思考和理解计算传播学(计算社会科学),或者说需要去探究计算传播学(计算社会科学)的元理论。
对于计算传播学而言,一个认识论层面的思考是围绕着“传播”展开。当代人类社会呈现出多元价值观与情感意见极化的高度矛盾结构,数字技术的介入或者说可供性显然是一个重要因素,发端于传统稳定社会结构、发展于战争时期的传播学在哲学基础上是否能契合和阐释当代这种高度矛盾又极富张力的社会结构?有没有更为合理的概念和认识论层面的理论框架来替代“传播”?黄旦教授近些年来所关注的“沟通”研究,可能就是在一定程度上试图去回答这一问题。对于计算传播学而言,另一个认识论层面的思考则是围绕着“计算”展开。换句话说,作为认识论的“计算”该怎么理解呢?计算长期以来被视作是一种科学工具,可计算性则被视作为一种方法论取向,它们似乎都不能为当前数据化社会(以及由此兴起的计算社会科学)提供一种认识论的本质理解。那么能揭示计算传播学(计算社会科学)内在本质的认识论该如何理解,这个问题的回答在一定程度上是计算传播学到底能不能立足的根本。
除了计算传播学的元理论需要进一步思考和研究外,计算传播学对人类知识的贡献还能体现在哪里?除了面向微观层面具体研究问题引入计算方法和工具外,另一个可能的视角是计算传播是否能为社会科学宏大理论建构提供支持。就宏大理论本身而言,无论是自然科学家还是人文社会科学家都试图发展出大一统的宏大理论。从自然科学的角度来说,杰出的科学家如牛顿、麦克斯韦、爱因斯坦、玻尔等人,无不致力于探寻一个抽象性极高的统一理论,物理学家Saulson(2011)指出,对于终极理论的出现,理论物理学家都抱着积极态度,“他们希望发现‘终极理论’,它能包容并衍生出我们迄今为止知道的所有定律”。人文社会科学同样如此,力图发展宏大理论统摄人类社会的发展规律,但人类社会活动的整体性、异质性、能动性或意向性妨碍我们对宏观社会的普遍规律的把握(刘林平等,2016)。然而,大数据对社会科学,特别是传播学研究带来了革命性的变革,乃至提高了构建宏大理论的可能性。在大数据基础上发展壮大的计算传播学的三个特点有助于弥补这一不足,推动宏大理论的建构。第一,基于大数据的计算传播学使得认识社会整体成为可能。互联网中人类传播行为的“数字痕迹”,为计算传播学研究提供了认知总体社会的经验基础,能让我们完整地看到马克斯·韦伯所认为的“社会全貌”。第二,计算传播学研究将为认识社会提供结构性视角和解决方案。计算传播学研究本质上依托于对复杂网络的挖掘和分析,能够发现已有传统量化研究所忽视的及受技术方法制约无法完成的大量网络特征及相关性,从而为社会科学理论提供全新的研究视角。第三,基于大数据的计算传播学有助于克服社会现象的异质性。在大数据时代,计算传播学为检验异质性假设提供了可能性。而对异质性假设的证实或证伪,将有助于揭示人类传播行为和现象的一般规律性或同质性特征。
(二)计算传播学需要回应社会发展的现实
传播学属于典型的实践性学科,其形成与发展不仅仅取决于自身的学理性条件,还在很大程度上受到社会情境和实践需求的影响与驱动。新实践不断重塑着新的传播主体和传播关系,并不断提出新的实践需求与实践课题;同时,传播学的研究逻辑也需要对不断融入的多元理论传统进行相应调适乃至重设。相比较于基础研究所承担的任务——拓宽学术领域、深化认识层面、填补研究空白、推翻原有结论。应用研究担负的任务是:回答实际困惑、解决重大问题、创新运行机制、改换操作方法(童兵,2006)。计算传播学同样面临理论、方法与实践的循环论证问题。计算传播学的理论和方法若不能回应、指导和规范实践问题,学科的合法性就会踩空。因此,未来计算传播学的研究也应该要面向人类社会,特别是中国社会面临的重大现实问题。
从传播学的视角来看,舆论舆情研究,尤其是互联网舆论治理问题显然是当代中国必须直面的重大社会现实问题之一。基于中国社会的舆论议题,以及伴随数字时代来临的网络舆情和舆情治理等议题,应具有非常鲜明的中国社会的烙印,即有的舆论研究的相关理论框架仍需要放置于中国社会、中国文化场景中去检验和拓展。如果这一视角已经被众多研究者所关注,那么计算传播学所能给予的贡献就是基于大数据跨学科的舆论、舆情研究,而更为重要的应该是这两者的结合。王成军(2017)提出计算传播学在理论建构上的抽象阶梯,即一个好的研究必须是由重大的社会问题驱动的,并且能够找到好的数据作为支撑(第一个阶梯);能够从数据中挖掘出行为的模式(第二个阶段);最好可以阐明模式背后对应的机制(第三个阶段);并尝试理解背后的基本原理(第四个阶段,往往难以企及)。计算传播视野下的舆论舆情研究是这一抽象阶梯的最好注释,在第一、第二阶段中充分发挥计算传播学的方法和工具的优势,在第三和第四阶段中就需要落到具体的中国社会语境中去寻找机制和原理。
此外,基于计算视角的国际传播研究也应是关注的一个重点。众多的研究者和实践者也都围绕着国际传播展开理论研究和实践探索,基于大数据的相关研究也开始出现,但总体而言,相关的研究仍然比较片面和碎片化,使用到的数据集也比较单一。在国际传播研究中,构建多语种多维度的数据集,对多语种的国际媒体和社交媒体的新闻和评论等大数据进行抓取,以及对中国官方媒体的对外宣传内容及其评论进行抓取,通过使用文本挖掘、情感分析和网络分析等计算传播的研究方法与工具,将更好地呈现国际传播场景和模式并发现其传播机制。
第三,基于计算视角的健康传播研究。健康和生命从来都是人类社会的核心议题,而新冠肺炎疫情的发生,使得人类对这两个词有了更深刻的理解。健康传播作为传播学的一个热点领域,近年来一直备受关注,前文中所呈现的计算传播的研究热点中也展示了研究者对健康传播的关注。计算传播的方法和工具正在被越来越多的研究者应用于健康传播研究领域,特别是在此次新冠肺炎疫情和信息疫情传播中,大量基于对社会公众行动轨迹和社交行为数据的计算研究,被广泛应用于对新冠肺炎确诊病例的预测,这延续了早期计算社会科学中经典的使用谷歌搜索数据监测流感的研究(Ginsbergetal.,2009)。但是计算视角的健康传播研究仍有众多可以去探究的议题,特别是对于当代中国社会而言,老龄化、乡村振兴等重大社会问题中所涉及的老年人群体、贫困人群、弱势群体的健康传播议题,都是值得关注和研究的。此外,通过社会网络分析的方法研究健康信息在互联网领域的传播路径、健康状况在现实社会人际网络中的传播模式,构建网络健康和现实健康的网络图;通过医疗卫生数据库,分析探讨健康中国战略在社会中的实际影响以及效果测量,并提出改进措施,这些议题也具有较强的实践意义。
当然,计算传播研究的实践主阵地是新闻传播实践。算法新闻、计算广告等带有强烈计算性的新闻传播新业态层出不穷,这些计算导向的新闻传播实践如何展开,其运作的机制与逻辑如何?计算传播如何改变新闻传播的行业生态,以及对个人和社会产生什么影响?其中涉及到的算法伦理等议题已经成为当前学术界广泛关注的热点。而对于当前中国新闻传播的实践而言,在技术与内容博弈的过程中,在传统媒体依靠国家战略的媒体融合来重构其影响力的过程中,植入新闻传播实践的计算理念会在媒介层面以及进一步的社会文化和舆论环境中产生怎样的影响,又会如何呈现影响,这些问题置身于中国自身的新闻传播场景显然具有强烈的时代意义和理论张力。
本研究系国家社会科学基金重大项目“大数据时代计算传播学的理论、方法与应用研究”(项目批准号:19ZDA324)的研究成果。
本文引文格式:巢乃鹏、吴兴桐、黄文森、李梦雨:《计算传播学研究现状与前沿议题》,全球传媒学刊,2022年第1期,19-40页。
本文参考文献从略,完整版请参看刊物原文
原文刊载于《全球传媒学刊》2022年第1期。
往期回顾
1 | |
2 |
3 |
全球传媒学刊
微信号 |
GJMS2014 (←长按复制)
邮 箱 |
gmj2014@tsinghua.edu.cn
唯一指定投稿系统地址 |
http://qqcm.cbpt.cnki.net
*本刊不以任何形式向作者及单位收取版面费、审稿费、中介费等费用。
望学界业界垂青,我们共同助力中国新闻传播学研究。