陈昌凤 | 新闻生产中算法运用的技术路径与价值逻辑
编辑按语
智能算法正在不易觉察地影响着我们的观点和决策,以至于影响到现代社会的运行机制。在欣欣然于技术推动的进步时,我们也不能不时刻保有价值理性,突出人的主体、理性、价值和尊严。清华大学陈昌凤教授以智能算法运用于新闻生产阶段为例,通过分析算法运用的技术路径,探讨了其价值逻辑及风险。
以新闻文本的生产为主要目的,由机器学习或者神经网络为技术基础生产和分发的新闻被称作算法新闻。算法新闻的流程包括三个阶段——数据输入、数据吞吐和新闻产品输出。内容生成属于自然语言生成算法领域的一个应用分支,基于模板的静态算法和基于上下文的动态算法是主流的自然语言生成方法。
基于模板的静态算法主要将模板填空式算法作为主流算法,最初主要使用在“预定义结构”的填充上。预定义结构俗称为“模板”,类似于完形填空式的内容,对于具有预定义结构且只需要填充少量数据的文本可生成一段完整的描述。但也正因为“预定义结构”,其并不被认为是真正的自然语言生成。在该方式下,无论是句子模板还是词汇模板,基本上都来源于人工总结提取,并形成固定模板,优点在于简单、可控和严谨,但模板的丰富性和实时性都很难得到保证。
基于上下文的动态算法通过上下文语法语义结构信息来动态地创建句子,允许系统在语言
上以多种方式优化句子,包括引用、聚合、排序和添加连接词,能够生成更长的内容。根据文本的目标人群及个性化信息体系是否完整,其可以在“微观层面”生成句子,或者在“宏观层面”生成与读者相关、结构良好的有用的叙事性文档。近年来,主流的基于上下文的动态算法主要包括马尔可夫链、循环神经网络、长短期记忆网络和自注意力模型等。这种方式不需要过多的人工干预,但也存在不可控性以及前后逻辑矛盾的缺陷。为了克服这些缺陷,目前大量的研究开始探索如何将人类经验和生成模型结合起来。
算法运用于新闻生产,主要涉及三个方面的价值观问题。首先是人在生产中的创造性和主体性。基于计算机智能的生产者和研究人员降低了人性。算法技术还存在写作模式固定、缺乏举一反三的创造性,原生创造力缺失、应对突发情况能力差,知识和感知可能无法自洽等缺陷。其次是算法的权力关系与道德风险。这里有两层权力关系:一层是算法对新闻业的介入引发的“权力迁移”,算法使权力从公共机构迁移到资本驱动的技术公司;另一层是在人工智能系统的生产过程中,存在两种不平衡的权力关系——决策权和技术知识的联手。数据驱动型技术的不可解释性、不透明性,以及技术人员的价值观和意识形态取向,都可能导致算法偏见。最后是工具价值与终极价值的矛盾。掌握技术的商业公司可能使用户成为被权力工具宰制的对象,成为实现其商业化目标的手段。此外,基于既有数据(包括非理性用户)的智能技术,有时会走向反智的一面,进而反人类价值观。但技术的积极意义在于其使用户认为它代表了一个“良好”社会的价值观,也就是不只强调技术的工具理性,还应关注技术的价值理性。
本文系精编版,注释从略。阅读原文请到2021年第3期纸质刊物或我刊小程序。文章系国家社科基金重大项目“智能时代的信息价值观引领研究”、 “文化名家暨四个一批”人才项目(2020)。关注“现代出版”公众号后,在后台回复“索取电子期刊:刊期+姓名+单位+职务/职称+手机号+电子邮箱”,我们将把相应刊期的电子资源(.pdf格式,202001期及以后)发到指定邮箱。
作者陈昌凤系清华大学新闻与传播学院常务副院长,教授、博士生导师;张舒媛系清华大学新闻与传播学院2017级博士研究生。
引用格式参考
GB/T 7714-2015 陈昌凤,张舒媛.新闻生产中算法运用的技术路径与价值逻辑[J].现代出版,2021(3):36-42.
CY/T 121-2015 陈昌凤、张舒媛:《新闻生产中算法运用的技术路径与价值逻辑》,《现代出版》2021年第3期,第36页至42页。
MLA 陈昌凤,张舒媛."新闻生产中算法运用的技术路径与价值逻辑."现代出版.(3)2021:36-42.
APA 陈昌凤,张舒媛.(2021).新闻生产中算法运用的技术路径与价值逻辑.现代出版,(3),36-42.
拓展阅读
● 我刊未授权任何个人、单位代理稿件业务,投稿请通过电子邮箱xiandaichuban@163.com
● 我刊无独立官网,望作者及读者周知,谨防受骗