数字新闻学研究主题发现及其演化分析:基于Webof Science文献的考察
摘要 数字新闻学正在成为新闻学的主流范畴,研究文献也与日俱增,时至今日,有必要对数字新闻学的整体发展状况和知识脉络进行梳理、总结与反思。本研究以Webof Science核心数据集作为数据来源,借助Python工具训练LDA主题模型,使用困惑度评价指标确定主题数量,并使用主题强度分析研究热点和变化趋势。具体来说,本研究根据主题-词项概率分布,对获得的1325条文献摘要进行主题标识,抽取出了数字新闻学研究在1998-2021年的18个重要研究主题;根据文档-主题概率分布,引入时间维度计算主题强度分布。研究发现,包括数字技术的角色、新闻用户的主动行为、传统新闻理念的变迁、新闻学学科发展等研究主题都保持了相对稳定和上升的趋势,新闻职业身份、新闻学研究方法等少量主题呈下降趋势,但也仅仅是一种弱下降。具体而言,有7个主题的强度呈上升趋势,有5个主题的强度呈弱下降趋势,有6个主题的强度趋于平稳状态。数字新闻学在2021年及未来的研究中正呈现出主题越来越综合化的趋势。
关键词 数字新闻学;LDA主题模型;研究主题;主题演化
一、引言
数字新闻学是伴随着数字技术的发展及在新闻实践中的应用而诞生的,其最初的目的更多是为了应对和探索传统新闻业在数字时代面临的危机与挑战。但随着整个新闻业呈现出显著的数字化转型之后,数字新闻学所需要回应的并不仅仅是传统新闻业数字化转型的问题,而是在人类迈入数字化时代之后,承载人类知识教育、文化传播、社会治理的新闻业是否会在社会系统中扮演新的角色,由此是否会对数字时代的人类社会产生新的影响。对这些问题的回答也必然带来数字时代新闻学研究整体上的范式转型。
从新闻学学术发展的角度看,对数字新闻学的系统研究在过去十年间逐渐从一个新奇的前沿范畴,渐渐转化为新闻学的主流范畴。作为一个具有革新意义的学术领域,充分认识数字新闻学的研究进展能够为后续研究提供指示方向。有研究者通过质性分析中国数字新闻CSSCI研究文献,对中国数字新闻研究的主要议题、理论和方法进行了总结,以此描绘了当前中国数字新闻研究的现状;也有学者基于《数字新闻学》(Digital Journalism)这一专门性期刊进行了统计分析,呈现了“数字新闻学研究是什么样子的”。
虽然上述研究或多或少都对数字新闻学的整体研究态势和理论进展等进行了探讨,但囿于文献选择的有限性、研究方法的局限性,未能全面地展示出数字新闻学自产生以来发展的脉络。基于此,本研究将尽可能获取更全面的“数字新闻学”相关研究文献,通过LDA主题模型等计算传播研究方法,揭示数字新闻学具体的研究主题,以及这些主题的演化变迁,以期对数字新闻学的整体发展状况进行梳理、总结与反思。对于正在迈入主流范畴的数字新闻学而言,这一考察显然具有其独特意义,而且也有其紧迫性。具体而言,本文将尝试回答以下研究问题:第一,二十余年来,数字新闻学研究有哪些具体研究主题?这些研究主题的关注度如何?第二,随着时间推移,这些研究主题的关注度是否存在着变化?
二、研究设计
本研究使用LDA主题模型进行数字新闻学研究的主题发现和演化趋势分析。(图1)隐含狄利克雷分布(Latent Dirichlet Allocation, LDA)是基于概率图的非参层次贝叶斯模型,已成为当下主流的主题模型之一,被广泛应用于文本挖掘等计算研究之中。作为一种非监督机器学习方法,LDA能够对文本中潜在的主题信息进行准确有效地挖掘,帮助研究者发现大规模文本信息中的潜在主题。同时,LDA主题模型还发展出了主题演化概念(Topic Over Time),用于分析主题随时间变化的趋势。也即,通过对文本数据集按照时间窗口进行划分,并通过潜在语义分析计算得到不同时间窗口内的主题概率和强度,能够实现对文本主题演化趋势的纵向分析。
相比于传统的关键词等统计分析,LDA主题模型不是通过单一的共现词对聚类来刻画,而是通过概率方法生成与该主题相关的一系列词项来刻画,深度挖掘主题语义信息,并通过量化的方式度量主题的强度以及主题之间的关联,能够更加准确地研判学科领域的发展趋势。在本研究中,我们首先从数字新闻学研究文献记录中抽取与所有文档相关的一系列主题,其次根据主题强度和研究需要,最终确定、标识了18个研究主题,并对这些主题的演化趋势进行进一步分析。这一技术路线对于发现数字新闻学的研究主题和演化趋势具有一定的创新意义。
图1 研究框架
(一)数据来源
本文以Webof Science(简称WoS)作为数据来源,在WoS数据库选择“核心数据集”,以“digitaljournalism”为关键词进行主题检索。检索结果返回后,选择文献类型为“Article”、语言为“English”进行检索结果精炼,共获得有效文献1325篇,时间跨度为1998-2021年。(图2)
图2 Digital Journalism主题的发文量统计
从发文数量的分布情况来看,在英文学界,数字新闻学研究的发展可以分为几个阶段:1.蛰伏期,数字新闻学在2009年之前一直处于缓慢发展的蛰伏状态;2.成长期,在2009-2014年期间,数字新闻学开始被一些研究者采纳,2010年前后“数字新闻学”开始被一些学者作为新闻学的“第五范式”进行讨论;3.爆发期:2014年以后,数字新闻学研究热度迅速上升,进入了蓬勃发展的时期。SSCI期刊《数字新闻学》也正是在此前的2013年正式创刊,成为了国际数字新闻学研究的重要学术平台之一。
将以上数据结果的文献全记录导出,包括author、title、keywords、source and abstract等字段信息。数据检索、下载时间为2021年7月。本文将使用文献记录的摘要(abstract)部分组成语料库,进行数字新闻研究的主题模型分析。摘要作为文献内容的精炼浓缩,展现了文献内容的梗概。相比于关键词(keywords)和文献的摘要(abstract)具有更加详细的信息,能够更全面、准确反映数字新闻学的研究内容。
(二)数据处理
本研究使用Python等工具进行数据处理。首先采用NLTK进行词性分析、词形还原,并对所获得的数据进行分词、去停用词等预处理,得到包含1325行数据的文本语料库;其次进行主题抽取,为了提升主题建模的准确性,采用了单词先验的Guided LDA(Guided Topic modeling with latent Dirichlet allocation)模型来进行主题划分。
(三)模型训练
本研究采用困惑度(Perplexity)这一评价指标来确定主题数量,得到如图3所示的困惑度变化情况。困惑度表示文档所属的主题的不确定性(信息熵),当困惑度下降趋势不再明显或处于拐点处时,此时的k值为最优主题数。在本研究中,当主题数目为18时,文本集合的LDA模型困惑度较小,且困惑度的值变化保持稳定,不再随着主题数量的增多而明显下降,同时具有较好的理论性和可解释性。因此,本研究设定最优主题个数为K=18。
关于超参数设置,使用Collapsed Gibbs-Sampling(CGS)来推断主题的分布和词的分布。其中,迭代次数为2000次,α=50/k,k=主题数,β=0.01。最终抽取各主题下概率最大的20个词,按照词频从大到小输出,并选取每个Topic下的概率前5左右的词汇作为该Topic含义的代表,以此为基础核心词汇进行主题标识。
图3 不同topic数目下困惑度的变化趋势
三、研究发现
(一)数据结果
经过LDA模型训练和主题抽取等分析过程,最终选择确定了k=18个最优主题。按照每个主题下各词项概率从大到小的顺序排列,抽取各主题下高概率的词汇,并依据高概率词项含义,查阅相关文献和咨询专家对主题进行人工标识,得到主题-词项分布情况,如表1所示。
表1 Digital Journalism文献的主题-词项分布
根据文档-主题概率分布得到每一篇文档从属于不同主题的概率,从而可以计算出每个主题的强度。主题强度的大小就是主题在某一个时间窗口内受到的关注程度,即在某一时间窗口上某主题的强度与包含该主题的文档数目成正比,主题强度越大越有可能被认为是热点主题。主题及其对应强度如表2所示。
表2 1998-2021年Digital Journalism研究主题及强度分布
(二)热点主题
参见表2中的主题强度,可以看到在数字新闻学研究中存在一些被重点关注的热点主题,这里只对以下6个热点主题进行详细分析。
1.政策制度。随着数字新闻发展的不断深入,关于数字新闻的政策(policy)和制度问题越来越突出,成为数字新闻学实践和研究中的热门主题。目前,世界范围内对数字平台的监管政策在国家和政府(government)政策议程中占据了重要地位,尤其是对于平台垄断和平台竞争问题。比如,以Facebook等为代表的数字新闻平台常因对经济、社会和民主等施加不正当影响而受到强烈批评,因此需要建立“新一代互联网监管”(a new generation of internet regulation)。同时,数字新闻的发展不仅是媒体机构的自主发展问题,也需要来自政府的政策保障,近年来媒体不断呼吁能够制定新的政策以支持新闻业的数字化转型。
2.职业身份。这一主题对数字新闻生产过程中的多种身份转变进行了探讨,包括新闻编辑(editors)、职业记者(journalists)等,对于自由记者(freelance)这一参与数字新闻生产的新职业身份也进行了较多研究。数字新闻的发展不仅依赖于职业记者,还依赖于自由记者、评论员等多种渠道。但按照传统记者的定义,数字记者和自由记者被排除在新闻记者的群体之外,造成了严格的身份界限和模糊的新闻实践并存的局面,进而塑造了一种处于尴尬位置的电子连接的自由记者(e-lancer)。关于自由记者等非职业记者参与数字新闻生产的研究还发现,一方面越来越多的专业新闻记者借助数字技术更好地完成了数字新闻报道,另一个方面则是数字化时代新闻记者的劳动时间被进一步延长,报道数量进一步增加,并不拥有自由记者的自由空间。这些都是这一研究主题重点关注的问题。
3.新闻类型。在数字新闻时代,数字技术提供了更加丰富的制作工具,使得不同媒体都具有了实施资源密集型的新闻生产的能力,比如融媒体新闻、多媒体叙事、调查性新闻(investigativejournalism)、数据新闻(datajournalism)、虚拟现实新闻(virtualreality)等基于数字技术的多态化新闻类型。同时,在碎片化阅读时代,数字长篇故事(digital longform stories)新闻同样取得了巨大成功,这也增加了数字新闻创新的动力。数字长篇故事可被视为是包含了丰富文本和多媒体元素的复杂新闻项目,一定程度上它是对当前快速、即时新闻趋势的“逆向发展”。因此,数字媒介技术和数字新闻形态都在不断变化,关于新的新闻类型的研究一直保持着较高的关注度。
4.用户群体。在数字新闻时代,新闻出现了产消者合一的趋势,打破了专业记者新闻生产的垄断地位。用户既是新闻生产者,又是信息消费者,用户群体从新闻受众转变为社交新闻发布者、微播客主播、新闻故事讲述者等信息生产者。同时,他们也更青睐于消费数字新闻,尤其是新生代的新闻消费者,构成了数字新闻原生一代(digitalnatives),出现了youtuber、blogger等新兴职业。另一方面,随着数字化的发展,传统新闻原住民也已经向数字化平台完成了大规模迁移,成为新平台使用的数字移民。在这一主题中,不同形态和组织方式的数字新闻对于用户传播效果的影响和差异也是被重点关注的研究问题,比如在向用户传达信息时可视化统计图表的作用和效果等。
5.学科建设。在数字新闻媒体环境中,影响数字新闻的生产、流通和消费的因素是多种多样的,对于认识数字新闻应当秉承跨越学科边界的整合视角,探索多元方法和框架。比如有研究者将新闻学和语言学结合在一起,并借助计算机文本分析(computer-based text analysis)和词共现可视化(visualisation of word co-occurrence) 等技术,从而以跨学科(interdisciplinary)研究的方式来探讨新闻价值的话语维度。还有研究者从文化研究、数字技术等跨学科的视角对自动化新闻进行了探究,以揭示数字技术对新闻流程的再造意义。通过这些学科问题的研究可以看到,数字新闻学在努力成为一个独立学科的同时,也在不断与其他学科之间发生着交叉融合,数字新闻学不再是传统的单一人文学科研究领域,而是在不断打破学科的边界(boundaries)。
6.价值理念。不管数字新闻业如何发展,新闻基本的核心价值理念始终是新闻学研究中最重要的主题之一。比如,目前数据新闻仍是新闻编辑部正在扩张的一个领域,研究者基于305家新闻机构对数据新闻生产中数据的透明度(transparency)进行了研究,并坚信数据新闻有能力让新闻业变得更加透明。还有研究者通过对30位记者的深度访谈,探讨了记者作为真相讲述者的角色,揭示了数字新闻时代真相的复杂性,对于新闻客观性构成了巨大挑战。同时,由于数字新闻的情感转向和后真相时代的影响,相比传统新闻业,新闻客观性被一些学者置于相对次要的位置。同时,还有一些标题党新闻(clickbait)、虚假/错误信息(fake/misinformation)等广泛传播,研究者期望建立基于算法和机器学习的自动化解决方案(automation, education and regulation)来应对这些价值伦理问题。
(三)演化分析
将文档-主题概率分布按年进行计算,获得各个主题在不同且连续的时间窗口内的主题强度分布。根据不同时间窗口内的主题强度的变化情况,能够分析研究主题随时间变化的演化趋势。由于早期关于数字新闻学的研究文献较少,导致主题强度波动较大、缺乏规律性,而随着文献数量的不断增加开始表现出一定的规律性。因此,这里主要分析2012-2021年这十年间数字新闻学研究主题强度的演化趋势;需要说明的是:因为2021年数据统计不完整,所以其变化趋势只作为分析时的参考。根据不同时间窗口内主题强度的变化趋势可以发现,虽然在不同时间节点每个主题的强度变化都有一定的波动,亦有少量主题呈现下降趋势,但也仅仅是一种弱下降。整体而言,近10年来数字新闻学正在成为新闻传播学研究的一门显学,大部分研究主题都保持着相对稳定和上升的趋势。为便于分析,本文仍将数字新闻学研究主题的演化趋势分为三类:有7个主题的强度呈上升趋势,有5个主题的强度呈弱下降趋势,有6个主题的强度变化呈平稳趋势。
1.呈上升趋势的主题
图4 呈上升趋势的主题
图4展示了2012-2021年间呈上升趋势的主题,包括topic 4数字技术、topic 8政策制度、topic 9用户群体、topic 10数字经济、topic 13新闻类型、topic 15价值理念和topic 18学科建设。对应于表2主题强度分布,可以发现topic 8政策制度、topic 9用户群体、topic 13新闻类型、topic 15价值理念和topic 18学科建设这5个主题的强度都位居所有18个主题强度的前列。
(1)topic 4数字技术虽然不是强度最大的主题之一,但该主题的强度整体上逐年上升。数字新闻研究是伴随着数字新闻这一新闻实践产生的,而数字新闻本身即是由数字技术发展催生的,因此数字新闻研究与数字技术也存在着紧密的联系。数字技术对新闻业的影响是全球新闻学研究过去十余年间的核心议题。在数字技术的强烈冲击下,新闻学的本体论、认识论已经发生了新的变化,新的技术逻辑不断解构着传统的新闻逻辑,数字技术在数字新闻中的作用不断被放大。未来对于数字技术的研究还会逐年上升,并将从技术应用转向对技术逻辑和价值等方面的探讨。
(2)Topic 8政策制度不仅呈现出了持续上升的趋势,而且其主题强度一直处于各主题的前列。如前述分析,关于数字新闻和数字平台的监管治理等日益成为新闻业中的一个突出问题,对与之相关的政策制度相关问题的探讨正在逐年上升。这是由于数字新闻逐渐成为了一个影响力的应用和研究领域,与之相伴的便是各类不规范现象的产生,需要完善的制度、法律(law)等治理体系来应对解决。
(3)Topic 9用户群体主题强度除了在2017年稍有下降,整体上一直处于上升的趋势。随着数字媒介环境的变化,数字新闻用户结构与功能也处于不断变化的动态过程之中,不再是被动的新闻消费者,而是发展出了多种身份和多元化角色。研究处于变化中的用户群体,对于数字新闻生产模式创新和传播效果提升等都具有重要的参考价值,能够帮助媒体机构打造出更具吸引力的数字新闻项目,以及更好地满足用户生产新闻、消费新闻的需求。
(4)topic 10数字经济主题的强度在2015年经历了短暂下降之后,转而整体上开始逐渐上升。数字新闻的产消问题是一个经济问题,当前由大型投资者、风险资本等支持的盈利性数字新闻公司在新闻业中扮演着越来越重要的角色,数字广告营销、媒体品牌打造和经济资本引入等都是媒体实现数字化经济战略的重要组成部分。经济力量的介入对于数字原生新闻的发展具有强大的促进作用,但数字平台的资本化也带来了一些问题,它超越了数字通信本身的技术赋能潜力,导致了新闻消费的过度娱乐化等问题,新闻作为产品的经济价值在一定程度上侵蚀了新闻作为公器的社会价值。另外,尽管数字原生新闻的媒体的发展日益成熟,但传统新闻品牌仍然占据了最受欢迎新闻网站的大部分,其原因是传统新闻品牌由于其规模和资本优势而具有较大的结构性优势,这也是数字新闻发展过程中仍然需要面对的问题。
(5)topic 13新闻类型揭示了当前数字新闻生产中丰富的新闻形态,包括VR/AR新闻、数据新闻(datajournalism)、可视化(visual)新闻、叙事性新闻(narratives)、长篇多媒体融合新闻(longform)等,以及数字新闻时代数字工具在调查性新闻报道中的潜力和新闻记者如何利用数字创新进行调查性新闻报道的操作实践。从内容形态上来说,数字新闻也在经历着不断的变化,从最早的文字新闻,到图片新闻、视频新闻,再到如今的直播新闻和短视频新闻等,这些都构成了这一主题丰富的研究内容。
(6)topic 15价值理念在2017年以前稍微有所下降,之后开始明显上升。该主题反映的是传统新闻学的基本价值理念在数字新闻时代所面临的挑战,以及数字新闻学对传统新闻学客观性(objectivity)、透明性(transparency)等核心理念的重构。在数字新闻时代,由于标题党(clickbait)的存在、新闻把关的缺失以及对流量的追求,导致对新闻质量(quality)和社会意义(meaning)的下降,出现了一系列挑战新闻伦理的新闻事件。因此,关于数字新闻的价值理念等方面的探讨在未来还将继续。
(7)topic 18学科建设主题在2016-2018年有所下降,之后开始明显上升。该主题讨论的则是数字新闻学随着数字新闻的发展作为一个独立的、全新的学科逐渐建立的过程,它是对传统新闻学科的重构,研究对象、问题和理论都在发生变化。同时,数字新闻学具有学科交叉的性质,融合了数据科学、计算机科学、可视化技术等多个学科知识,打破了学科之间的边界。目前数字新闻学研究尚未发展成为一个十分完善的学科体系,因此对于这一主题研究的热度还将继续上升。
2.呈弱下降趋势的主题
图5 呈下降趋势的主题
图5展示了2012-2021年间呈弱下降趋势的主题,包括topic 3研究方法、topic 6媒体平台、topic 7职业身份、topic 12内容生产和topic 14新闻真实。
(1)Topic 3研究方法的主题强度在经历一段时间的上升之后,整体上强度有所下降。这可能是囿于数字新闻学研究方法的有限性。目前使用较多的研究方法有调查(survey)、实验(experimental)、访谈(interviews)、内容分析(content analysis)和民族志(ethnography)等方法,在量化或者计算研究方面还比较少,数字新闻学研究可能还没有探索出更加丰富、完善的研究方法体系。
(2)Topic 6媒体平台主题在2015年短暂上升,之后开始缓慢降温。2015年正处于新旧数字平台迭代的交替时期,手机移动媒体(mobile)、多媒体(multimedia)、社交媒体(socialmedia)已经占据了主流,而报纸(newspaper)、广播和传统互联网新闻平台都受到了较大的影响。整体来看,媒体平台主题强度并不十分高,强度值基本上处于0.05之下。
(3)Topic 7职业身份主题虽然是所有主题中关注强度最高的主题之一(表2显示,在所有主题中,其强度仅次于政策制度位居第二位),但其研究关注度在最近几年中却呈现出逐步下降的趋势。这可能与下述原因相关:在数字新闻发展早期,新闻记者的角色定位开始出现了分化,传统新闻记者出现了自我身份认知模糊的现象,也面临着数字化转型的痛苦和探索;此外,作为非职业记者的普通用户也在逐渐形成了自由记者、公民记者等新的用户角色,这些问题极具研究和探讨的实践意义。但是随着数字新闻业的快速发展,无论是专业记者还是社会公众,对数字化时代新闻从业者的多元化身份格局认知似乎正在形成共识,因此研究者的关注度也有所转移。
(4)Topic 12内容生产主题在2014-2016年经历了一段时间的上升,之后强度开始逐渐下降。与新闻记者职业身份主题类似,早期新闻信息生产方式处于剧烈的转变之中,在传统新闻采编形式的基础上,出现了个性化新闻(personalization)、策展新闻(curation)、公民新闻(citizenjournalism)等新形式,形成了新的新闻编辑室(newsroom)模式。随着这些新闻生产方式的不断完善,新的新闻内容生产方式的探索仍在不断探索中,理所当然,新闻内容生产的研究和思考也有待于进一步深化。
(5)Topic 14新闻真实的主题一直处于相对波动的状态,但整体上呈现出了弱下降的趋势。新闻真实的问题是新闻价值理念中的核心问题之一,是学界始终关注的重要争议性问题之一。随着媒介环境、传播技术和新闻样态的变化,每个时期新闻真实主题都会出现不同的新问题,这可能是导致主题强度不断波动的原因。到了2021年新闻真实的问题又开始上升,再次吸引了学界的关注,这一主题又具有了新的想象和探索空间。
3.呈稳定趋势的主题
图6 呈稳定趋势的主题
图6展示了2012-2021年间呈稳定趋势的主题,包括topic 1实践应用、topic 2理论工具、topic 5数据使用、topic 11地理区域、topic 16情感转向和topic 17转型创新。整体上看,这些主题的变化趋势不大,且强度值不高,主题强度值一般处于0.045-0.050之间。
(1)Topic 1实践应用主题在2017年前后有短暂上升,整体上趋于平稳。数字新闻实践应用主要围绕着数字新闻(digitalnews)、数字实践(practice)等问题展开,对数字付费墙(paywalls)、沉浸式(immersive)新闻、可视化(visualization)新闻、交互式(interactive)新闻等数字新闻技术应用进行了探讨。
(2)Topic 2学术理论主题中所指向的是数字新闻学研究中主要使用的理论,包括信息扩散理论(diffusion)、元话语分析(discoursev、把关人理论(gatekeepers)、场域理论(fieldtheory)以及技术可供性(affordances)理论的探讨。数字新闻学研究中对场域理论等经典理论进行了新的拓展性应用,用以解释数字新闻研究中的新问题,但是更多的依然是对于传统新闻学理论的应用和继承,还未发展出数字新闻学原生的新理论。
(3)Topic 5数据使用主题包括两方面的研究,一方面是数字新闻学研究中所使用的数据,比如质性数据(qualitativedata)、公开数据(publicdata)、用户数据(audiencedata)等;另一方面是数字新闻生产实践中对于数据的使用,比如大规模媒体数据(mediadata)、数据新闻、数据可视化等数据。同时,研究者还对新闻生产者如何使用数据进行新闻生产,比如数据使用方式和规范等进行了较多关注。但数据作为数字新闻实践中的核心要素之一,显然对于这一问题的关注程度还不太够。
(4)Topic 11地理区域主题探讨的是地方性(local)数字新闻转型、超地域性(hyperlocal)信息服务和跨地域性数字新闻等问题。数字新闻的特点之一就是打破了传统新闻时代发行地域和传播范围的物理限制,能够实现全球性(global)、全国性(national)和跨地域性(transnational)传播。
(5)Topic 16情感转向问题是数字新闻研究中的重要议题之一,吸引了越来越多的研究者的关注。相比于传统新闻时代,情感在数字新闻中的重要性越来越突出,这被称为数字新闻的“情感转向”(emotionalturn)。与此同时,伴随着情绪在信息传播中的渗透,也出现后真相(post-truth)式的传播问题。对于这一日益突出的问题,需要学界给予更多的关注。
(6)Topic 17转型创新主题探讨的是传统新闻业向数字新闻业转型发展的问题。随着数字技术的发展,新闻业的数字化(digitization)实践不断深入,开启了新闻生产、消费和传播的全方位转型(transformation)。数字新闻业对传统新闻业进行了革命性(revolution)地重构,进行了多种形式的创新(innovation)。
四、结论与讨论
本文借助LDA主题模型的计算方法,对国际学界关于数字新闻学的研究主题和演化趋势进行了计算分析。
首先,本研究揭示出了数字新闻学研究所涉及到的众多研究主题,既有数字新闻转型创新、新闻样态、新闻用户、内容生产、职业身份、媒体平台、数字经济等新闻实践领域的研究主题,又有关于数字新闻的价值理念、新闻真实、政策制度、学科建设等学科和理论的研究主题,还有关于数字新闻学研究的理论工具、研究方法和数据使用等研究框架的探讨。这些研究主题基本上反映了当前数字新闻学主要关注的研究对象和问题。
其次,本研究通过对这些主题强度的计算,发现在诸多研究议题中,政策制度、职业身份、新闻类型、用户群体、学科建设和价值理念等是强度较高的热点研究主题。同样也有研究者曾对数字新闻学的研究主题进行过文献分析。例如,S. Steensen等人在对《数字新闻学》这本期刊在2013至 2018年间发表的论文进行分析时指出,数字新闻学研究重点关注的主题有“技术”“平台”“受众(用户)”“方法”“理论”等;而白红义等则通过对中国数字新闻研究的相关文献进行分析后发现,在中国当前的数字新闻研究中,“转型”与“创新”是中国数字新闻研究的关键议题,主要包括新闻从业者与新闻组织的转型,基于新闻机构的机制体制创新和新闻产品创新等。这其中,“受众(用户)”“新闻从业者”“体制机制创新”等热点主题都与本研究的结果一致,但是“技术”“平台”“方法”等却与本研究的结果有所差异,这可能是因为不同研究选取的文献存在差异所导致。
再次,本研究揭示出各研究主题强度随着时间推移处于不断变化的状态,呈现出不同的演化趋势。这一方面显示出数字新闻应用和实践的媒介环境变化,另一方面则体现出了数字新闻学研究领域研究者关注议题的变迁。从主题演化分析的结果可以看到,不同研究主题的强度呈现出了上升、弱下降和平稳三种演化趋势。事实上,由于近10年来数字新闻学正在成为新闻传播学研究的一门显学,所以大部分的主题都保持着相对稳定和上升的趋势,只有少量主题呈下降趋势,而且也仅仅是弱下降。另外,由于2021年文献数量有限,虽然只是作为演化趋势分析的参照,但仍可以看出,进入2021年大部分主题的强度都有所上升,即便是强度呈现下降趋势的几个主题也是如此。由于LDA主题模型是一种概率分布,在计算主题强度时是假定每个文档(基本上)包含所有的主题,只是每个主题在文档中的概率不同,因此这或许也可以说明,数字新闻学在2021年及未来的研究中正呈现出主题越来越综合化的趋势。
➤作者简介 巢乃鹏,深圳大学传播学院教授、院长,广东深圳518060;韩少卿,南京大学新闻传播学院博士研究生,江苏南京210023;吴兴桐,深圳大学传播学院博士研究生,广东深圳518060
➤原文刊载于《新闻界》杂志2021年第9期,参考文献详见原文
排版:伊雪倩
往期精彩回顾