查看原文
其他

智能新闻生产:媒介网络、双重的人及关系主体的重建

吴璟薇 郝洁 国际新闻界 2021-05-14

吴璟薇,清华大学新闻与传播学院助理教授。


郝洁,清华大学经济管理学院创新创业与战略系讲师。


本文为国家社科基金重点项目《当代新闻观念研究》(编号:17AXW001)与清华大学自主科研项目“数字媒介技术视域下的新闻理论与实践探索(编号:2019THZWJC57)”成果。



问题的提出:

智能媒介技术与人的主体性问题


新闻生产研究是新闻传播学的经典话题。传统的新闻生产研究主要从新闻社会学的视角,通过对新闻室进行深度观察来分析新闻内容生产(塔奇曼,1973/2008),或者从场域或权力视角来分析政治、经济等因素对新闻生产的影响,以及各个场域之间的权力关系与权力变化(内维尔,本森,2005/2017;舒德森,2007/2010)。这些研究主要关注社会关系,而对媒介技术的影响讨论得较少。但上个世纪90年代以来,技术革新与新媒介技术在新闻领域快速扩散,使得具有深厚社会学视角新闻生产研究的美国学界,又开始重新关注技术主义的研究范式。这一范式强调技术处于新闻生产的核心地位,在理论视角上颠覆了传统新闻研究对以人作为新闻传播主体的关注,以及对新闻内容生产和消费过程的关注(张斌,2011)。进入新世纪以后,由于互联网等新技术开始在国内普及,国内学界也开始讨论媒介新技术带来的影响。前期主要关注互联网与媒介融合(崔保国,1999;孟建,赵元珂,2006),2009年前后的讨论则主要集中在新媒体和社交媒体对新闻生产的影响上(丁未,2009;刘丹凌,2012;翟星渊,2016)。


最近数年,基于大数据与人工智能的智能媒介技术的广泛应用,正在全面重塑和再造新闻与资讯的生产、分发、用户互动与评价等全部流程环节。在这个激烈的变化过程中,社会媒介系统的结构与权力关系发生了深刻的变化,对“人是媒介的主体”的传统观念形成了明显的冲击。这种激烈的变化引起了学界的多重反响。对新技术条件下新闻生产的研究主要集中在以下三部分。第一类研究从技术主体性的角度出发,强调智能媒介技术在效率上的巨大优势,认为更加“个性化”与“人性化”的智能媒体“使得新闻信息为用户而生,使媒体越来越懂用户所想与所需”(喻国明等,2017);而智能技术赋能下的新闻生产尤其是人工智能写稿机器人的应用,由于其在技术上的“突破性创新”特征,应该被当作新时代的新闻生产主体(之一)来看待(Power,2012;Belair-Gagnon et al.,2017)。对于这种观点来说,强化智能技术主体的发展和应用,是一种需要正面推动的思路。


第二类研究则更深入讨论智能媒介技术在新闻生产、分发、用户互动与评价方面的深度应用,以及这种应用所带来的社会后果和伦理问题,并在这个基础上重申人的主体性。例如,智能媒介技术在新闻领域的大规模应用不仅带来了“黑箱”问题,而且造成多种“社会格局变化”(仇筠茜,陈昌凤,2018),在新闻与社会的各个层面造成了非“向善”的后果(匡文波,2021)。更为严重的是,智能算法推荐带来的一系列问题可能会导致作为统合性价值体系的主导意识形态面临着凝聚力弱化、权威失落、引导乏力和认同窄化的风险(张林,2021)。这个类别的研究明确反对人工智能、自动化技术具有“主体性”。如杨保军(2013)认为将智能机器主体化是“浪漫主义的表现”,在“人—机”共同主体结构中的新闻生产传播中,人依然是唯一主体(杨保军,2018),因为技术仅仅是“工具”而人才是终极目的(杨保军,李泓江,2019)。


与上述尝试阐述技术主体性或者强调人的主体性的观点不同,第三种视角试图调和人和技术的之间的对立关系。例如姚建华(2021a)认为伴随着“自动化新闻”技术的普遍应用,新闻记者正在经历由“去技能化”向“再技能化”转型,且进一步向“多技能化”转变的趋势,在这个过程中,写稿机器人和新闻记者作为自动化新闻生产中的两种主体正在形成一种“共存关系”而非零和游戏式的“竞争关系”。这种共存关系如果能够在根据双方优势、强化二者不同职能分工的同时,能够“促进主体间的双向理解、建立人机合作的‘新闻把关’机制”,那么可以实现人机之间的融合即“人机联姻”的关系(姚建华,2021b)。


上述三类研究从新闻生产实践的多个方面诠释了媒介技术在新闻与信息生产以及流通全过程中所扮演的重要角色,并从三个不同角度分析了人与智能媒介技术之间的主客体关系,具有深刻的理论和社会洞见。然而,这些研究也存在两个层面的明显问题。一是“新闻生产”的定义过窄的问题。这些研究对新闻的自动分发及其社会后果的伦理问题、新闻生产过程中编辑室内的自动新闻生产和机器人写稿的技术主体性问题较为关注,而对于智能媒介技术情境下的广义“新闻生产”的探讨比较有限,对智能媒介技术在整体新闻产业中的实践可能性——算法模型设计与开发,数据汇集、清洗、标记与存储,新闻生产智能机器的深度学习与智能开发,数据挖掘与利用等方面等内容,则关注较少。二是过于强调技术媒介与人的关系的当下性,部分忽略了媒介技术—社会关系的历史性问题:这些文章彼此之间虽然存在较大分歧,但却共享一个重要观念,即智能媒介的广泛应用对人的媒介主体性带来了巨大的冲击,而且这种冲击是一种典型的新技术—社会现象。


这两个问题可以进一步细化出一系列的问题。例如,如果将“新闻生产”概念扩大到对智能媒介技术在整体新闻产业中的实践可能性的讨论,那么这种扩展对于理解智能媒介技术与社会、群体和个人的一般性关系会不会有帮助(R1)?如果从长时段的媒介历史观出发,把智能媒介技术下的新闻生产放入到媒介技术与社会之间的一般关系之中考察,那么当下的智能媒介技术对媒介主体性的冲击究竟是一种纯粹的新现象,还是一种存在于媒介系统中逐渐变化的、具有本体论意义上的“元”问题(R2)?如果是的话,那么该如何理解人的主体性在媒介系统中(逐渐)消融的问题,技术是否真的可以成为独立的新闻主体或者成为“人机联姻”中的关系主体,对人的主体性的重新伸张能否解决人的主体性消融的问题(R3)?最后,技术主体、人类主体和“人机联姻”等研究是否穷尽了理论探讨的可能性,是否还有其他的思路可以帮助理解当下智能媒介技术条件下的主体状况,并提供新的媒介主体重建思路(R4)?这些问题涉及到如何更为深入地理解智能媒介系统或一般化的人工智能与“人”共处的伦理规则的生成基础、机制与可能的未来状况,因而亟待解决。


本文将从“媒介网络”(Medienverbund),(Kittler,1993,2009:I)的理论视角来对上述问题进行进一步讨论。一方面,本文将跳出“新闻分发”和“新闻编辑室”这两个主要论述领域,从媒介本体论的角度重新审视智能媒体的智能生产/自动生产的概念以及一些关键侧面的微观操作问题,将现有研究中较为忽略的智能媒介技术情境下的广义“新闻生产”过程纳入讨论;另一方面,本文在此基础上透过“媒介网络”理论来重新审视智能媒介技术、计算机网络和人类主体之间的关系,以此帮助我们进一步理解当下的媒介情境,并尝试提供具有启发性的解决思路。


“媒介网络”视野下的新闻生产


“媒介网络”是弗里德里希·基特勒(Friedrich Kittler)发展出来的一种具有强烈媒介本体论色彩的媒介理论。基特勒从马丁·海德格尔(Martin Heidegger)的关系本体论出发,强调技术、媒介与身体的融汇对于个体和群体存在情境的塑造性作用。基特勒认为,在本体论层面,并不应该依照亚里斯多德所开启的形而上哲学的传统,即主要依照形式与质料的差异来定义事物的方式来定义媒介(例如常见的纸媒和广播电视的区分),而应该延续马丁·海德格尔所开创的技术本体论,从媒介在“时间与空间中的关系”来定义媒介自身(Kittler,2009)。从这种角度来看,那么技术媒介的本体论特征即是基于“处理、传输、存储”数据和信息的网络,这种特征可以在“技术媒介的整个递归历史中寻找到”(Kittler,2009)。无论是书写、印刷,还是打字机、留声机和电脑,这些技术媒介都使得信息、话语和语言在空间得以“处理、传输、存储”,从而使得信息、话语和语言在时空中成为了“不朽的东西”(Kittler,1993:11)。


在这个过程中,技术媒介从来不是单独的媒介,而是由诸多媒介形成的网络。例如,“图书馆是被称为书的存储媒介的存储媒介”(Kittler,2009:30)。扩大范围,就“被称为书的存储媒介”来说,古登堡式印刷机、书、运输售卖系统、书箱、家庭书架或图书馆(甚至是制造这些技术媒介的其他技术媒介和工具),共同组成了一个技术媒介网络。正是这种网络使得《话语网络1800/1900》中的“1800”时代,能够形成一种以“母亲”为特征的话语网络(discourse networks,德语原文为Aufschreibesysteme,意为铭刻系统)。随后,留声机、耳机、录音机、电影等模拟媒介技术组成的媒介网络的大规模应用,使得基于声音(而不仅是基于印刷文字)的交流能够得以记录、打印成文字转存、分发和扩散。在此基础上,小到雅克·拉康(Jacques Lacan)授课时由录音机、耳机以及打字机组成的课程记录媒介网络(Kitter,1993:11-57),大到一个国家的阶段性的总体话语网络(Kittler,1985/1990:Part II 1900)都在模拟媒介网络的基础上得以形成。


基特勒一生中反复阐述的一个重要思路,即无论是从某些特定的时代的话语网络来看,还是从雅典已降的长时段历史来看(Kittler,1993,2009,2010),技术媒介网络都对社会沟通与运行,知识与话语的生产与再生产,资料与知识的存储和传承产生决定性影响。例如,基特勒以哲学书写为例,指出羊皮纸代替莎草纸,古登堡印刷机代替手写,不但对哲学的形式,还是哲学的内容都产生了系统性的影响(Kittler,2009)。而媒介技术对于艺术和生活的影响,基特勒曾经这样说道,“因此,技术装置可以从所谓的艺术家的眼睛和手中分离出来,形成那些绝对自主的领域——光学媒体技术,它们环绕着我们,甚至决定着我们今天的生活。”(Kittler,2010:19)在《留声机电影打字机》中,基特勒用更加简约的一句话将之归纳为“媒介决定人的处境”(Kittler,1986/1999:XXXIX)。


不仅如此,在对“媒介网络”概念做出了系统诠释的《德古拉的遗产》(Draculas Verdachtnis)一书中,基特勒直率到令人不适地指出,在机械技术媒介出现之后(如留声机和打字机),人本身“就是机器话语处理的配件和工具的主体”(Kittler,1993:57)。因而,在一代代的媒介技术迭代过程中,每一种新技术出现都会引起社会层面的“恐慌”、忧虑和批评。在《留声机电影打字机》一书的前言中,基特勒带有一丝怜悯地写道,“在技术媒介刚刚兴起之时,其革新曾经引起极度的恐慌”,这种过往的“惊恐情绪”,“就成了我们现代对未来充满恐慌的真实写照。”(基特勒,1999/2017:2)


基特勒之所以经常被认为是媒介物质性理论研究的重要推动者,是因为正如上面简述所显示的,基特勒的确采取了一种非常典型的“后人类主义”的叙事视角,在他的论述之中,物质意义上媒介网络具有本体论意义上的主体性,并占据了叙事的主线。至少从表面上看起来,在基特勒以技术媒介为主体的媒介网络中,人更多是信息和媒介的传送、记录和保管者,一种“机器话语处理的配件和工具的主体”。在这个意义上,基特勒比他所自承的“将海德格尔的技术概念转移给了媒介”(Kittler & Banz,1996:21)。其实还更进一步,将技术对人的“促逼”作用(海德格尔,1954/2005:12)推向了极致。


但是基特勒毕竟是深受海德格尔影响的媒介理论家,这种后人类主义的叙事视角并不能完全掩盖他的海德格尔式的关系本体论视野——一种基于“共在”的视角。他并不单纯地认为媒介是作为一种限制性的“外部性”来“决定人的处境”,从而使得人的主体性被压制甚至处于奴役之中。基特勒从关系本体论出发,其实非常强调技术、媒介与身体的融汇对于个体和群体存在情境的塑造性作用。他始终认为媒介技术在不断发展的过程中与人融合成一个运作网络,也将“所谓的人分裂成生理结构和信息技术”(基特勒,2017:17)。例如,数字媒介技术通过声光电等多媒体形式,将原本在书写时代被分割开来的不同感官领域整合在一起,替代了人的中枢神经系统,也“模糊了人与机器之间的界限”(基特勒,2017:17、54-55)。通过技术的更新迭代,“人和它的模拟者联合起来了”,机器通过不断学习来改进自身程序,以不断贴合人的需求,也因此变得更加智能化(基特勒,2017:18)。因此,媒介技术物质性能够至少部分地消融人的主体性,但是从本体论的角度来看,人、物、媒介技术关联本身就处在一种关系网络之中(Kittler,2009;海德格尔,1954/2005:180-181)。杰弗里·温斯洛普-杨(Geoffrey Winthrop-Young)对此评论道,基特勒这种不把人作为绝对主体的理论叙事手法,可能只是对“20世纪60年代人文学科的人类趣味”的一种反动和夸张化的回应(温斯洛普-杨,2011/2019:149)。如果统合基特勒前后期的学术思想来看,那么媒介技术本身显然不是唯一的决定因素:技术需要在与人组成的媒介网络之中才能发挥作用


接下来,本文将从“媒介网络”的理论视野来讨论智能媒介技术对广义新闻生产的影响,并讨论智能媒介技术的广泛应用所带来的人、媒介技术、媒介网络之间的“变”与“不变”的关系。首先,本文试图将智能媒介技术引入更长时期的技术-社会关系视野以及媒介网络的历史演化语境之中,从而以关联方式来比较智能媒介技术与历史语境中诸多“新”媒介技术所形成的关系,并考察智能媒介技术的本体论特征;其次,本文将整合长期线上与线下调查所获取的数据与材料,来进一步分析当下智能媒介网络的广义新闻生产中“人”的多重角色,并对这些角色的境况进行历史化;最后,在上述基础上,本文试图探讨智能媒介系统或者一般化的人工智能与“人”共处的伦理规则的生成基础、机制与可能的未来状况。


研究方法与过程


目前多数对智能媒介技术下的新闻生产的研究,集中在机器人写作、新闻编辑室内采编工作等与新闻生产最直接相关的流程环节上。媒介物质性视野中对智能媒介技术下的新闻生产来说极为重要的是物质性基础的构建与再生产过程,比如对于智能媒介平台内部的模型与算法开发、机器学习与人工训练调试、内容来源与数据适配、个性化用户信息分发等智能媒介平台内部的广义“生产”实践过程,受到的关注要少得多。当然,在对这种广义“生产”过程的研究中,如果针对的是模型与算法开发、智能机器学习训练这些“黑箱环节”的操作细节,由于涉及到技术环节的“黑箱”问题以及智能平台内部运作的商业机密问题,研究起来的确会比较困难。但是,如果将智能媒体平台看作自身不断生产和再生产的“媒体系统”或“媒介网络”,那么对它的研究可以通过当下主流的研究方法来完成。


本文主要通过综合诠释学和质性研究方法来探索智能算法主导的平台媒介网络的广义新闻生产状况,以及媒介技术物(一般意义上的客体)和人(一般意义上的主体)在这个运作过程中所组成的网络关系。质性方法的研究过程包括三个部分。首先,从2011年对新浪微博平台的关注开始,本研究小组的主要成员对包括即时通讯、电子商务和新闻聚类分发平台在内的各类平台的技术开发与运营状况进行了长期观察与追踪,关注平台内容、平台技术开发、平台运营、ICT基础设施更新、用户群体、政策监管等各要素之间的互动与变化。通过这种长时段的观察与追踪,本研究小组建立了对平台技术开发与运营的演进状况的基础了解。其次,本研究小组在2016年以后着重关注新闻聚类平台(如头条)、大型融媒体平台(包括光明网、人民网、凤凰网、澎湃等复合在线媒介平台)等新闻资讯平台,以及微信公号、短视频平台的智能推送系统等重要智能媒介技术系统的开发与运营状况,对企业技术开发人员、运营人员进行了包括深度访谈(访谈编号Z1-Z12)、非参与式观察等多重方式,以深入了解智能媒介技术平台的开发与运营的基本状况,以及这些媒介技术平台与用户、监管机构、媒体机构、第三方劳务机构和外包机构之间的互动关系。研究小组还在此基础上对从门户网站、社交网络到智能媒体的发展过程进行复原和追踪。随后,该文采用数字诠释学而非单纯的数据分析方法,来对所获得的量化和质化数据进行整体性诠释。


媒介网络与双重的人


(一)智能媒体平台的(狭义)媒介网络


从媒介网络的角度来看,智能算法平台是基特勒所称的“计算机科学”在互联网时代的升级版本。在“计算机科学”阶段,冯·诺伊曼构架意义上寄存器、总线和随机储存器(RAM)构成了一个循环的反馈回路。“在结构上,存储在寄存器中的比特(bits)执行逻辑操作和算术运算,多条总线传送命令、数据和地址,而随机访问存储器(RAM)则为命令、地址和数据提供存储场所。”(Kittler,2009)“命令、地址和数据”,是媒介网络的基础本体论特征“处理、传输和存储”在计算机科学时代的体现。


在这个意义上,智能媒介网络平台实际上是一种经由互联网而扩大了的计算机体系。平台计算系统形成了复杂的、软件和硬件相互嵌合的技术物质体系(Coté,2014)。智能媒介平台最大的变化,在于其在“处理、传输和存储”的三个环节都增加了人工智能。就当下阶段来说,人工智能主要通过“深度神经网络”

(Deep Neural Networks)的多层次建模来实现“深度机器学习”(Deep Machine Learning),从而实现具有一定智能的自动化处理,例如新闻智能生产与分发、人脸识别、图像识别、智能导航和设计自动优化等。这种构架以简化的方式描述,相当于在存储部分加入为“数据智能化管理”的并行系统(例如常见的HadoopHDFS,HBase数据管理系统),在处理部分加入适配智能“计算框架”的并行系统(例如Map Reduce,Spark,Spark Stream等),以及在传输部分加入“智能挖掘与分发”系统(例如DeepMind,GraphX等)。然而,这些复杂的体系,并没有脱离基特勒(Kittler,2009),所提出的“在硅晶体物理学和冯·诺依曼架构的双重条件下”的计算机体系,大型平台的运行基础仍然是基于命令、数据和地址的“寻址、处理和存储”的媒介网络(Kittler,1993:41)。总体上来看,当下的智能媒介平台依然延续了技术媒介网络在纯粹物质性层面的总体特征。


(二)隐形工作、新闻生产与智能技术的人-物网络关系


从媒介网络视角来审视智能媒介平台的广义新闻生产,还可以发现智能媒介平台的另一个重要特征,即人或者人工与平台上述的媒介物质性网络所形成的网络关系。由于当下包括新闻写作机器人在内的人工智能仍然是面向特定应用场景的“弱人工智能”(Artificial Narrow Intelligence,ANI),而非具有类似人类智能的“强人工智能”或者“通用人工智能”(Artificial General Intelligence,AGI)。在很大程度上,当下的智能媒介平台的人工智能应用,需要大量的“人工”参与和干预。例如,中国科学院自动化研究所的谭铁牛提出,按照人工智能开发的简化过程,人工至少在以下环节仍然至关重要:“人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统”(谭铁牛,2019)。


人工干预的诸多环境中,人工采集和数据标注是相对最受关注的人工干预环节,同时也可能是广义新闻生产中最受忽视的环节之一。从2018年开始,人工智能背后的“隐形工作”开始从浮出水面(甲子光年,2018;格雷,苏里,2019/2020),受到媒体和公众的较多关注。其中,数据标注工作由于工作时间长、任务单调、媒体报道较多而备受关注。由于当下主流的人工智能开发工具“深度神经网络”,需要在建立起神经网络模型之后,通过大量输入详细标注后的标准数据来进行“学习”才能建立起处理未标注的同类数据的“智能”能力,因此数据标注工作对于当下的人工智能来说必不可少。例如,谷歌旗下的“深度思维”(DeepMind)公司的著名人工智能机器人“阿尔法围棋”(AlphaGo,又译作阿尔法狗),在建立模型之后密集输入了超过3千万步的现存棋谱走法(等同于标注后的标准数据)来训练模型,并且在这个过程中进行了多次调校,最后才在2016年形成具有高度智能棋力的人工智能。


阿尔法围棋的输入数据是非常标准化的棋谱数据,省去了相当一部分的繁琐“标注”工作。但是,对于需要进行文字、图像和视频处理的神经网络模型来说,无论针对的是智能新闻分发还是自动化新闻写作(或者是导航优化、在线商品推荐优化等其他应用场景),大量的数据标注不可避免。在当下,数据标注已经成为了一个规模较大的行业,出现了大量的数据标注公司,甚至已经有百度众测、京东众智、阿里众包等和数据标注有关的大型众包平台。一些资源网站如Github也有很多标注好的文字、图像和视频处理的通用数据集可以通过免费下载或者付费获取的方式来获得。不过,如果一个人工智能产品想要获得超出同类产品的智能化程度,那么额外附加的标注必不可少。对于今日头条等早期智能媒体的开拓者来说,绝大多数的数据标注都需要自己或者通过外包服务的方式来完成。


以文字为主、兼含图片与视频的新闻文章为例,数据标注的典型流程包括收集(用网络爬虫爬取或者用新闻文章数据库获取)、数据清洗(去除不必要信息以符合信息格式要求)、数据标注(按照要求对文章内容进行标注)、汇总成数据集等步骤。每一个步骤都涉及大量的人工工作,但是其中数据标注步骤对人工依赖最重。典型的标注工作包括标注出能够体现出文章内容的关键词及其类属,以及从上下文理解这些关键词的准确意思,对于图片和视频则至少需要标注出图片和视频的主要内容的关键词。按照具体需要,标注工作还可能更加细节化,比如为了方便算法对文章进行情感分析和判断,标注时需要依据文章的上下文,给涉及到情感和价值判断的关键词进行情感赋值标注、语义差异标注等额外标注。精细化的图片标注需要图片内容仔细分区标注,最细致的视频标注甚至需要一帧帧标注视频内容的细节特征。同时,为了提高准确性,每一篇需要被标注的文章最好能被不同的数据标注员重复标注,以形成对照。


由于标注工作需要高度的分析和判断能力,因此目前虽然很多数据标注公司或者智能媒体平台已经开发出具有一定智能的自动数据标注工具,但是总体上这个行业仍然非常依赖人工介入。同时,标注工作也是持续的。以头条等新闻信息平台为例,为了优化算法、应对层出不穷的新语汇和旧词新用等状况、适应新政策和新法规等,平台需要持续对大量的图文进行标注。一位前头条计算工程师(访谈Z3)在2018年的访谈中提到:


我去今日头条的时候(2014年),算法(已经)修改过很多轮了。因为每一次大一点的修改都会调整算法的很多方面,修改以后,一些以前不是很重要的方面就变得重要了,所以每次修改都会加入很多新的标注数据......有一段时间我们要提高图片识别(率),找了外包公司重新标注了很多图片,(单是)我们小组在这上面前前后后(就)花了快有半年,最后效果还算可以......我走之前(2018年初),算法已经比较稳定,但是(数据标注)工作量还是很大。要提高算法的准确性,标注其实是越来越多的。”


也就是说,由于现在的人工智能仍然是弱人工智能,在面向不同的新闻生产流程场景时,人工智能需要根据场景的不同特征,采用不同的标注数据进行机器学习与训练。只有采用这种系统标注后的图文数据训练后的算法,才能形成相对可靠的人工智能来进行智能化的新闻与信息汇总,进行自动化的新闻写作和编辑,并根据用户画像特征进行智能化推送。因此,从媒介网络的角度来看,对智能媒介技术驱动下的新闻生产研究,如果只关注新闻编辑室内的写稿机器人的工作特征及其与人工编辑的互动或互补的关系,就可能忽略了自动化写作与分发的智能技术媒介网络的多层次性,以及其中的人、物之间的网络关系。


同时,这种隐形工作的巨大体量,以及其中劳动的不平等性令人关注。然而,如果换一种视角,从媒介网络的角度来看,数据标注员以及其他的隐形工作(如服务器软硬件维护等),它们在媒介网络中的结构性位置,和纸媒时代的审查、排版、校对人员的工作颇有相似之处。甚至,纸媒和广播电视时代的媒介网络由于具有更强的分散性、多元性和基数大的特征,使得审查、排版和校对等“隐形”工作人员的数量未必少于现在看起来数量庞大的智能媒介网络的隐形工作人员。只是在具体的工作组织形态上,智能媒介平台的隐形工作更加具有分散性、不稳定(precarity)的特征。从这个角度来说,智能媒介平台虽然具有鲜明的数字时代的特性,然而其仍然共享了媒介网络的结构性特征。


(三)智能媒介平台的主体“永存”与人的主体消融


相比数据标注,深度神经网络模型设计与开发、人工智能应用场景适配,常常被认为是人类主体性体现最为完整的领域:作为主体的人类和作为客体的程序模型,两者之间的关系体现的是主客体关系。从这种观点出发,许多论者试图表明作为人类智力的产物,算法模型、人工智能、智能媒介平台体现的是人的意志。从而,对智能媒介的治理,即是要从人的主体性出发,重新审视算法模型、人工智能和智能媒介平台的价值取向,以弱化甚至避免媒介技术对人产生的宰制效应,以及构建更加公平、普惠的智能媒介平台。


然而,如果从媒介网络的视野来看,人在媒介系统中从来都处于一种双重的位置:就微观工作层面,无论是个人还是群体都对自己的工作具有相当程度的掌控性;然而,就整个媒介网络层面而言,无论是个体还是群体,都成为媒介网络系统的一部分,或者成为多重媒介网络组成的媒介系统的一部分,从而被整个媒介网络的运转逻辑和技术媒介的演进逻辑所影响。就本文主要关注的数字新闻生产的演进历程来看,可以清晰地观察到这种双重性。


1999年前后,以新浪、搜狐和网易等为代表的互联网门户网站引入了“新闻主页(news portal)”的形式。这些网站将原本登载在报刊杂志等纸质媒体、电视广播媒体的文字和图片稿件,以网页转载出去。在整个所谓Web1.0的新闻生产过程中,承载媒介内容的传统媒介向互联网技术为基础的网页转移,传统媒介的特性的确因为“新媒体的语言”(马诺维奇,2001/2020:27-47)的语法规则而发生了重大的改变:网页成为电子化的印刷平面,传统媒体的标题和内容被重新编辑成为更适合快速阅读和浅阅读特点的形式,并主要根据“点击率(page view)”来进行评价。然而,从新闻生产的媒介网络角度来看,为了实现新闻与信息的网络发布,网页新闻网络组织了人与媒介技术之间的特定网络关系:程序开发人员负责开发新闻的呈现与发布系统,而以人工操作为主的新闻写作、内容编辑与加工转化仍然占有主导地位,双方的合作推动着网页新闻网络的顺利运作。


进入2003年以后,代表Web2.0时代的博客、早期的脸书、人人网、开心网等社交网络站点开始成为重要的信息传播和社交方式。在Web2.0阶段,算法开始被大量运用到推送中,来满足用户的个性化需求。相比传统的新闻内容生产,技术在Web2.0时代扮演着更为重要的角色。通常在注册时,社交网络用户会被要求选择自己感兴趣的话题,或者填写年龄、性别、所在地和个人兴趣爱好等信息。之后,互联网公司通过标签设置,根据用户所关注或感兴趣的内容、所在地理位置等个人信息来推送内容。从注册时选择相应的兴趣标签,到好友网络和关注、点赞、留言的记录,乃至个人的地理位置信息,都是互联网公司获取个人数据的重要方式和进行内容推送的重要依据。当然,除了个人用户,传统媒体也在社交网络中注册成为用户,并把新闻内容改写为更易于在社交媒体传播的形式。但其中有一个重要的变化,就是内容生产进入到社交媒体阶段以后,人工编辑在其中的影响迅速减弱:“我们将越来越多地依赖非专业的编辑和代码来确定观看、阅读和了解的内容”(帕里泽,2011/2020:41)。人工编辑主要在事实核查中和一些重要时政内容的推送中把关,内容的分发则主要遵从用户标签和文章标签之间的相关性,由系统自动完成。因此,在Web2.0阶段,可以看到互联网媒介技术的影响逐渐加深,在整个媒介网络中的新闻与资讯内容生产层面,人工投入与内容产出的比率在下降,技术人员的重要性和占比在同步提升。


在移动互联时代,智能媒介技术开始逐渐占据主导地位。2006年在美国诞生的Buzzfeed和2012年在国内诞生的今日头条(现称“头条”)标志着更具个性化、互联性以及人工智能技术高度融合的到来,新闻实现了彻底的智能平台化运营。初期的头条将自己定位为一家纯粹的技术公司,自身没有任何内容采编和生产业务,主要依靠汇总传统媒体以及用户生成的内容来投放信息。在这种新业态中,头条主要完成两方面的工作:一是通过人工智能自动对来自不同信息来源的新闻信息进行格式调整和入库储存,并对每一篇新入库的新闻内容进行自动分词处理、标签以完成类别化;二是通过App的用户使用痕迹来获取用户的信息偏好,在此基础上借助智能算法进行相对精准的用户画像来定位用户感兴趣的内容类别,然后从前述第一步工作获得的内容中选取匹配类别的内容推送给用户。头条运营人员在访谈中确认了之前在媒体上出现过多次的报道,即早在2014年,头条为用户更新“画像”的频率最快就已经可以达到10秒一次,而且用户使用数据累积得越多,就越可能实现“用户用得越久,算得越准”(访谈Z5)。头条(以及其他类似的自动新闻分发平台)的这一做法也招致了以“信息茧房”为框架的众多批判,而头条则以“构建信息茧房是人的本能,而非技术的诱导”的论述框架加以抗辩的同时,亦对算法采取了“掺沙子”式的优化:在为用户推荐其偏好内容之余,也向其随机推荐一些其他种类的内容,并为用户提供了强干预(“叉掉”)和弱干预(“划过去”)的交互余地(访谈Z5)。但无论如何,现阶段智能技术在整个信息自动分发系统中的确起到了决定性作用,头条数以千计的工程师团队,无论是负责硬件设施的采购、调试与更新的,还是算法的开发、升级与调试的,或是移动用户终端App的设计和更新的,很大程度上都在围绕着算法的开发、升级和长久顺利运转而努力。


从Web1.0到Web3.0的新媒体发展进程可以看出,基于互联网的媒介技术的升级换代推动着新闻与资讯平台的升级换代。媒介技术对于新闻生产过程的介入越来越深,智能化程度越来越高。在这个过程中,技术已经体现出了一定的自主性(维纳,1977/2014),依照自身的发展逻辑进行代际更迭,并且在很大程度上改写了新闻平台的运营规则。技术开发人员的投入占比在不断上升,但在内容生产与呈现层面,平台内部的人力资源投入越来越少。到了智能平台阶段,人工已经成为人工智能技术的辅助。但是,智能媒介平台的媒介网络特征并没有改变,媒介网络人与算法融合到整个智能媒介平台中,无论是人还是算法模型,都是为了整个新闻生产的智能技术系统的有序运行而关联在一起。前述今日头条的运营人员(访谈Z5)对此评论道:


这个公司就是因为这个平台、这套算法存在的。如果这套算法没有了,或者在市场上没有优势了,头条也就不是现在的头条了。所以大家所有的努力,就是维护好这套算法,让这个平台在市场上不要掉下去。


综合起来看,无论在哪个阶段,新闻的采编写作、技术框架的开发与维护、平台的软硬件构架、外包服务机构等所有的运作,都作为媒介网络的一部分为新闻网站或智能平台的顺利运作和“永存”而努力。这种状况回应了前文所说的“双重性”:在媒介网络中,人在微观层面的确仍具有一定掌控力,但其实在这个媒介网络体系中的所有人和物,都在为媒介网络的“永存”而努力。因而,认为智能媒体时代,算法工程师或者其他的“人”才是智能媒介平台的“掌控者”,可能在一定程度上忽视了这种媒介网络中人的“双重性”。


(四)人工内容审核:重审“主体性”回归


在智能媒介技术的大规模应用过程中,引起争议最大的问题之一,即是新闻“把关人”角色由新闻编辑室的资深采编人员转交给了算法与人工智能。批评意见认为,这种“把关转移”“取代了传统媒体的价值判断和把关权”,并在受众层面、行业层面、社会层面都造成了不都是“向善”的后果(匡文波,2021),甚至会带来意识形态的风险(张林,2021)和导致人的主体性的部分丧失(杨保军,李泓江,2019)。那么,人工内容审核工作的大量回归是否意味着人的主体性得以重新伸张,甚至是通向良性“人机协作”甚至“人机联姻”的路径呢?


由于大量的自媒体生产内容进入各种智能媒介平台并且引发了众多不同类型的网络事件,监管部门逐渐开始强化网络内容审查的政策性要求。这种变化推动了人工审查工作的大量出现。例如,早期的新浪微博主要依靠关键词监测来进行内容审核,这导致了大量以谐音化、符号化、图片化表达方式来绕开审核的微博推文出现。应政策监管部门要求,新浪微博从2011年开始组建人工内容审核团队,在2012年初团队人数就超过了1000人;截至2014年底,新浪微博光外包人工审核团队的人数就超过了5000人(访谈Z11)。从2018年初开始,包括头条、微信公众号等大型新闻聚合平台开始组建和扩大人工内容审核团队规模,以对平台内容的真实性、合规性进行核查。由于这些平台的体量非常庞大,审核团队的规模从建立开始就急剧扩大。以头条为例,2018年初每天新增发布约50万条内容。面对如此庞大的信息量,人工审核的效率难以跟上:每天50万条内容如果全部交由人工来筛选的话,一个人需要工作500天才能看完,而机器则只需要90分钟。但若全部交由机器,“刷选”的边界就会成为另一个棘手的问题。头条因此建立了“人工审核+技术识别”的方式来完成这个工作:先由人工智能进行初步审核,这个过程可以解决80%以上的内容审核工作,余下约20%左右的内容则自动提交系统转发人工审核。除了人工智能筛选出来的内容之外,举报邮箱中的待处理内容、重点关注人员、重点关注内容的审核,也交由人工审核。


在人工审核部分,头条建立了一套数据分析系统对审核人员进行分配协作,其机制与质化数据编码信度检测类似:两个审核人员“背对背”审核,如果结果不一致则提交给资深团队来进一步审核。对于重点文章,只有两审操作结果一致才能生效(访谈Z5)。由于这种设置,人工审查的工作量变得非常大。伴随着头条信源的日益复杂化以及每日新增信息数量的急剧增加,审核人员团队人数也在急剧上升。截至2019年底,头条合计已经拥有一个超过10000人的庞大内容审核团队。


对人工审核大量回归的追问,将一个关键问题再次放到审视目光之下:头条、微信公众号这样的新闻与信息聚合网站仍是一个媒介网络。正如基特勒所说的“被称为书的存储媒介的存储媒介”的“图书馆”一般,头条和微信公众号等平台并不生产新闻和信息,它们只是将其他合作信源和自媒体的新闻与信息聚合起来进行推送。然而,它的合作者和自媒体用户的媒介内容生产同样是在媒介网络中进行。这种审视至少提示两方面的重要内容:一方面,对于智能媒介平台来说,其他合作媒介信源、进行用户内容生产的自媒体用户以及各种隐形工作的从业者(如数据标注工作者),构成一个庞大的次级媒介网络。在这个次级网络中,虽然各大内容信源和自媒体的内容创作主体在现阶段仍然在很大程度上归属于人,但这些由人与物构成的网络主体,却在围绕着智能媒介平台而运作。另一方面,现在以及在可预见的将来,人工审核团队在各大智能媒介平台中将保持较大的规模,然而由于当下审核团队的主要工作目的是以政策“合规”为主,这只能解决由于“把关转移”所带来的小部分问题(如新闻与信息的“真实性”、意识形态和社会政策与法律合规性等问题),对于在受众层面、行业层面、社会层面出现的众多问题无能为力,离实现“人机联姻”还非常遥远,更不用说全面伸张人的主体性。甚至,在将来实现“人机联姻”情况下,智能媒介平台下的人的境况能否超越媒介网络下的人-物关系框架,仍是一个可以大胆追问的难题。


结论


本文循着基特勒“媒介网络”路径,从智能新闻媒介网络的广义新闻生产中的关键微观操作来呈现媒介技术与人之间的网络关系,并以此来考察智能技术与人的关系的问题。本文首先讨论了智能媒介平台在长时段历史情境中的历史地位,提出从媒介本体论的角度来看,智能媒介平台实际上共享了计算机产生以来的技术构架,它们的运行基础仍然是基于命令、数据和地址的“处理、传输和存储”的媒介网络。智能媒介平台最大的变化,在于其在“寻址、处理和存储”的三个环节都增加了人工智能,但这种改变并没有转变智能媒介技术在媒介本体论层面的基本主体性特征(R2)。


如果从媒介网络的视角来仔细观察智能新闻聚合网站的微观生产的发展历程,可以看出从Web1.0时代的页面新闻到当下智能媒介技术主导的新闻聚合平台,“人”在媒介网络主体中的位置正在做系统的迁移:在广义新闻与资讯生产层面,人和人工正在渐渐脱离核心位置。虽然出于政策监管要求,大量的网络内容审查人员重回“把关”位置,然而和内容信息的庞大数量、整个媒介网络的巨大体量相比,在内容层面的“人”的重要性在急速降低。只有在智能媒介技术开发层面,人的投入量在急剧增加。然而,这种迁移无论方向如何,都并未改变一个基本状况:在智能媒介网络中的所有人和物,都在为以算法为核心的智能媒介网络主体的“永存”而服务。换句话说,智能媒介网络主体也共享了媒介本体论的基本特征——具有相对自主性的媒介主体,而人仅作为一种关联要素存在于智能媒介的网络主体之中(R1和R3)。


因而,如果以大众传播时期的部分媒介实践经验,来讨论如何在智能媒介技术时代重新伸张人类主体性,可能会面临众多的困难。从基特勒的媒介网络主体视角进行分析,人的绝对主体地位如果不是从来都未曾存在的话,那么至少在机械媒体时代已经大部分消融(Kittler,1993:1-57)。尼尔·波斯曼(1985/2011)以及批判学派数以百计的研究,也曾从不同角度对大众传播对人类主体的支配性进行了严厉的批判。在技术媒介通过自主性增长日益把人变成技术媒介网络“配件”的情况下,人一直处于一种双重的位置:就微观工作层面,无论是个人还是群体都对自己的工作具有相当程度的掌控性;然而,就整个媒介网络层面而言,无论是个体还是群体,都成为媒介网络系统的一部分,或者成为多重媒介网络组成的媒介网络系统的一部分,从而被整个媒介网络运转逻辑和技术媒介的演进逻辑所影响(R2和R3)。


基特勒晚年的关注重点,从技术媒介转移到前技术媒介的“文化技艺”(Kulturtecknik)上。文化技艺在德国媒介研究尤其是媒介考古学领域具有广泛的扩展性、多义性和模糊性,基特勒本人也没有直接进行界定。然而,从他早期的《话语网络1800/1900》(Aufschreibesysteme 1800/1900)的“1800”部分到晚期的古希腊研究中,可能呈现出一种共同的关注:对能够形成群体性差异、具有文化“培育性”的文化操作实践保持紧密的关注。在这些操作实践中,操作实践本身以更加贴近身体体验的方式,培育一种具有群体区分性的技艺。这种技艺贴合个人但更加关乎群体,却并不要求一种超大范围甚至全球意义上的同一性和垄断性。例如,在《音乐与数学(一)》(Musik und MathematikI)(Holl & Kittler,2005)里基特勒提到古希腊的字母表和它的变体能够标记语言、数字、音乐记谱,它构成了一种关系性的技艺网络,连接了个体、群体的多重文化实践。这些技艺显然很难看作是一种“以人为本”的操作,也非“技术决定论”所能概括。与此相反,智能媒介平台目前被广泛质疑的“个体定制化信息生产和推送”,在初期反而被技术乐观主义者看作是一种“以人为本”的智能化媒介实践。在智能媒介平台的微观生产与社会后果两大层面都越来越体现出支配性的情况下,重提文化技艺并非主张退回到非媒介技术时代(这既不可能也不必要),也并非要在主体-客体的二分思维下,重新伸张作为主体的人对于作为客体的智能媒介的掌控(如上文所述,这也不太可能)。探讨的方向之一,可能在于从网络关系本体论的视野出发,一方面承认技术媒介的强大自主性,另一方面思考智能媒介技术和平台如何能够生成可以连接个体、群体且能够形成群体性差异、具有“培育性”的操作和实践(R4)。


本文系简写版,参考文献从略,原文刊载于《国际新闻界》2021年第2期。

封面图片来源于网络

本期执编/大鱼


订阅信息


全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!


您也可通过下方二维码或网址https://weidian.com/?userid=1185747182,进入国际新闻界微店,购买当期杂志和过刊。


您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存