查看原文
其他

【一篇重要而又烧脑的文章】什么决定你的新闻:平台媒体新闻业务算法机制比较研究|2018新闻传播考研专题06

2017-06-03 方师师 新传土拨鼠

作为新闻业在数字环境下“后台前置”的下一个阶段——“把关后移”的主体,平台媒体(platisher)新闻推送业务大多基于用户的使用惯习,通过算法预测用户感兴趣的信息和话题,再将其推送给用户。逐渐转型为平台媒体的社交媒体在现有的模式下很大程度上主导着新闻内容的聚合与分发,其身份和功能的主要定位是通过对于用户偏好的精确匹配,从海量过剩的信息洪流中将用户最关心、最适合用户接收的信息甄选出来。2018新闻传播考研干货,新传土拨鼠:上海大学新闻传播研究生运营


美国皮尤研究中心《2016美国社交媒体平台新闻使用报告》显示,62%的美国成年人从社交媒体上获取新闻,Facebook成为最大的新闻入口;今年8月易观发布的《中国移动资讯信息分发市场专题研究报告2016》显示在国内资讯信息分发市场上,算法推送的内容已经超过了50%;路透新闻研究院的调查显示,虽然对于算法推送新闻确实存在算法审查(Algorithmic Censorship)、平台偏向(platform bias)、信息茧房(information cocoons)以及回音壁(echo chamber)的担心,但人们尤其是年轻人,更加愿意使用和相信根据算法生成和推送的内容。







核心问题


既然算法推送新闻在人们日常的信息接触中已开始扮演如此重要的角色,那么是什么因素决定着平台媒体的算法?这些因素是如何组合起来的?背后体现着怎样的标准与价值观?数字社会学家马诺维奇(Manovich)认为:当前,理解大规模数据采集(large-scale data collection)、算法分析(algorithmic analysis)、计算实践(computational practices)和公共知识生产(the production of public knowledge)之间的互动关系,是我们这个时代的核心方法论和哲学挑战之一。因此,本文尝试在平台媒体渐成社会主流信息接入的背景下,通过不同平台间“算法机制”的比较,将平台的发展、定位与行为放入到整体性的社会互动的框架下,通过开箱“算法机制”,挖掘和发现潜藏在平台、技术、用户、社会关系等问题背后的更为深层次的价值理念。




研究路径


本文试图将“算法研究”(Algorithm Study)扩展成为对于“算法机制”的研究,从技术-社会互动的角度揭示平台媒体新闻推送的算法逻辑。在既有的争议和怀疑当中,平台如何对算法机制进行确认、更新、废弃或转换,这些行动体现出平台媒体在媒介生态中的对策和战略,背后是运作理念与价值观。由于新闻处于争夺用户的焦点,因此对于新闻推送的算法机制研究就成为打开这一迷思的通道。通过比较不同类型的平台媒体的算法策略,不同的信息/新闻价值观得到彰显,代码是法则的规律性,与行动者在其中的能动性,都可以从这一窗口得到展现。


分析框架


在理论框架上,安德森借鉴布尔迪厄的“场域”理论和技术论的视角,在迈克尔·舒德森“新闻社会学”的四种路径(经济的、政治的、文化的、组织的)基础上,发展出研究算法新闻学的六种路径:1、政治和公共政策;2、新闻生产的经济组织;3、制度和场域视角;4、组织动力学视角;5、文化-历史视角;6、技术与新闻视角。


研究对象


海外互联网公司的新闻创新活动,“实际上就蕴含着搭建平台媒体的操作逻辑”。如果将不同平台媒体按照其算法使用梯度分布进行分类,大致可以分为:一是依赖与内容生产方合作或者编辑选择;二是人工与算法相结合进行推荐;三是几乎完全依据算法推荐。而这三类可以概括为媒体型、关系型和算法型。


(👇下面这张图是重点!重点!重点1)



本文选取国外的三大平台媒体:谷歌、Facebook以及苹果公司的新闻业务进行算法机制比较。由于这三种平台媒体在具体实践过程中并非拥有统一的模式,因此在比较的时候会按照先进行业务算法机制说明再比较的流程。同时,值得说明的是,正是由于这种各具特色的业务实践特色才是本文提出的“算法机制”比较的必要性所在。


算法机制比较


(一)谷歌:排名算法主导新闻分级


截止到2013年Google在10年间进行了三次大规模的算法排名调整,其中与新闻信息排名最为密切的一项是《用于改进新闻文章分级的系统和方法》(Systems and methods for improving the ranking of news articles),其中详细说明了Google对新闻文章排名的度量指标和衡量标准。


第一,明确排序必要性。Google认为对于新闻文章的分级是必要的,这决定了用户信息搜索结果的质量。因此需要系统和方法来基于与新闻文章相关联的新闻源的质量来对新闻文章进行分级。


第二,多维度量指标。专利中显示了超过13项度量指标来对其他网站的新闻文章进行排名。主要包括:1.第一时间段中新闻源生产文章的数目;2.新闻源生产文章的平均长度;3.第二时间段中新闻源产生的重要报道的数量;4.爆炸性新闻分数;5.新闻源的网络流量;6.人们对新闻源的评价;7.新闻源的发行统计;8.与新闻源相关联的职员数量;9.与新闻源相关联的办事处数目;10.在文章簇(Cluster)中原创命名实体的数目;11.新闻源的覆盖幅度;12.新闻源的国际流量多样性;13.新闻源使用的写作风格。


第三,辅助连接度。谷歌的排序算法还部分基于确定的一个或多种度量值来计算新闻源的质量值:代表到新闻网站站点的超链接的数目的值。一旦考虑这组度量,就可以部分确定每个新闻源的源等级。一旦已确定出新闻源的源等级,服务器就可以存储该新闻源的源等级,在需要的时候调用。





(二)Facebook:社交经验和朋友关系优先


News Feed是Facebook新闻推送业务的核心项目,之前News Feed的算法经历过三个主要阶段:


第一阶段:边际排名算法(EdgeRank Algorithm每个出现在你新闻源里的内容被称作Object,与Object互动行为被称作一个Edge,每一个Edge有3个至关重要的组成要素,分别是:U:亲密程度(Affinity Score),W:边类权重(Edge Weight)和D:时间衰变(Time Decay)。对Edge产生的影响的因素叠加在一起,则会增加Edge的分数,然后就产生了EdgeRank。分数越高,你的内容就更容易出现在用户的News Feed里面。


第二阶段:机器学习与算法更新。2011年之后News Feed的排序算法全面转向了机器学习,用优化理论来决定每个因素的权重。该系统约有10万个独立项的权衡因素。除了最原始的3个EdgeRank要素之外,新加入的包括:关系设定、贴文种类、隐藏贴文/检举粉丝专页、点击广告和观看其它内容的时间轴、装置与科技、故事颠簸(Story Bumping)和最近行动者(Last Actor)。




第三阶段:协同过滤机制。在强化机器学习的同时,News Feed团队设置协同过滤机制。算法工程师、数据科学家会将公司雇佣的合同工反馈回来的评估重新设定算法,提升新闻推送的精度和准度。


最新调整:“3F原则”与News Feed新闻价值观。2016年6月29日,Facebook再次改进了NewsFeed的算法,虽然这只是一个小小的改动:你将看到更多基于真人的推送,而类似与群组、媒体、品牌或其他来源的信息都会被弱化。但更重要的是,配合这次改动,Facebook有史以来第一次发布了对于自身算法的理念说明:NewsFeed新闻价值观(News Feed Values)。如果用一句话来概括,那就是所谓的“3F原则”(Friendsand Family First):友谊家庭大过天。这一价值观的主要内容包括:社交优先、“有用的信息”是关键、不要忘记娱乐、推崇多元观点、真实性很重要。


(三)苹果:弱化算法更重视编辑作用


与Google、Facebook此类以算法著名的科技公司不同,苹果公司认为,计算机算法有着不可逾越的瓶颈或缺陷,在绝佳的新闻内容以及满足小众新闻需求方面,算法还显得粗糙和幼稚。Apple News放弃算法排名而招聘编辑的主要目的就是为了避免有人通过算法漏洞影响排名,同时通过人工筛选更好地强化用户体验。苹果提倡内容发布者可以通过苹果提供的 News Publisher 工具,将原网站的所有内容和视觉元素,包括新闻标题、文本、图片/图片集、视频、超链接,还有字体、排版、央视以及其他交互效果,原汁原味复制到 Apple News 里,从而一眼可以看出来自不同媒体的报道风格。在前不久的苹果大会上,“人,而非算法”的理念再次得到重申,并将把“向用户提供更多由人工生产的定制化内容”作为新产品的核心战略。





本文来源于微信公众号:腾讯研究院,作者方师师。有删节,本期编辑为上海大学新闻传播研究生新传土拨鼠团队的栗子姐。


其他的精彩荐读 



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存