查看原文
其他

抖音用户对个性化推荐算法的认知

蒋雪颖 新传播智库 2023-08-24

  

个性化推荐算法的过度使用,可能导致人们沉溺于快感中。人们对算法的无知可能将自身置于无意识地被平台和算法操纵的境地,受到算法控制的威胁,所以关注用户对算法的认知至关重要。本文以国内抖音用户为研究对象,探究用户对个性化推荐算法的认知,包括算法感知和知识的形成。研究发现75%的参与调查者能够感知到个性化推荐的存在,且听说过个性化推荐,但了解程度有限、存在许多误解,63%的参与调查者了解意愿较低。活跃的抖音内容生产用户了解意愿较高,用户对算法有着拟人化的认知,认为算法担任着内容审核员、流量分配者、评委、推荐人的角色,还发展了“养号”“挖坟”等行话。

    

一、研究背景

互联网带来信息过载的问题,用户很难快速找到自己需要的内容,目前解决信息过载的两种技术是搜索引擎和推荐系统。搜索引擎被动地返回用户查询关键字相关的内容,推荐系统则主动地预测用户感兴趣的信息。推荐系统经历了从非个性化到个性化的过程,个性化推荐系统经过了20多年的发展,如今它与我们的生活密切相关。

最早的三大个性化推荐系统在1995年提出,分别是卡耐基·梅隆大学提出的Web Watcher、斯坦福大学的LIRA、麻省理工学院的Litizia。在1996年,雅虎推出了个性化入口My Yahoo;1999年,德国Dresden技术大学的塔尼亚·约丁(Tanja Joerding)实现了个性化电子商务原型系统TELLIM;1997年,AT&T实验室提出了基于协同过滤的个性化推荐系统PHOAKS和Referral Web。[1]个性化推荐系统主要由三个模块组成,用户建模模块、推荐对象模块、个性化推荐算法模块,个性化推荐算法是其中的核心部分。[2]

随着社交网站的兴起,用户使用搜索引擎留下的历史记录、在社交媒体留下的图片与文字、在购物网站留下的购买订单记录和评价互动,这些在线活动为个性化推荐提供了大量数据,个性化推荐变得越来越智能。我们生活中越来越多的方面与个性化推荐交织在一起,在线体验的大部分中介内容,都是由个性化推荐算法分类生成,搜索引擎不断植入个性化推荐更有效地反馈查询内容,新闻、视频和社交媒体内容,几乎是根据算法对用户相关性的判断,然后以个性化的方式排序,媒体产品的生产、选择和展示都经过了算法的作用。[3]

在国外,路透新闻研究所发布的《数字新闻在线报告2017》显示,54%的受访者更喜欢通过个性化推荐算法筛选故事,[4]68%的美国成年人从社交媒体如Facebook和YouTube获取新闻,这些平台使用个性化推荐算法来提供内容;在国内,2012年以今日头条为代表的个性化推荐算法型应用上线,开启了算法分发资讯的潮流,2016年百度、阿里巴巴、腾讯、微博等网络巨头加大技术算法投入,移动资讯信息分发领域中个性化推荐算法开始超过人工推送,成为主要资讯信息分发方式[5]。个性化推荐算法已经成为用户的“信息界面代理人”,行使着信息筛选的权力。
  
  
深陷其中的用户是如何认知个性化推荐算法的呢?皮尤研究中心2018年的一项调查显示,53%的美国成年人并不了解它的运作机制,对平台积累了大量个人数据也不知情,还把这种推荐当作客观精准的代名词,身处算法的权力控制之中而不自知,用户在互联网平台巨鳄面前无所遁形。互联网曾经被形容为一个可以实现自由、平等、个人赋权的地方,互联网用户被赋予自由地掌控信息流动的权利。如今互联网早期的乌托邦光环已经褪去,平台巨鳄更有能力利用个性化推荐技术控制个人,技术掩盖了数据对个体的控制方式。

对算法的无知可能将自身置于无意识地被平台和算法操纵的境地,[6]如果不加反思和质疑地接受和使用算法,将其视为某种“社会必然性”的展开,表明对其预设的价值取向的屈从或默认。如果我们想了解算法的社会力量,就必须了解用户是如何认知算法的,以及这些认知经验如何反过来影响用户对算法系统的期望,进而影响到平台对算法规则的修改,这可能有助于塑造算法本身,实现算法善用,因此关注用户对算法的认知至关重要。

二、研究设计

本文选取抖音短视频用户作为研究对象。之所以选择短视频应用,是因为网络短视频的用户规模大,而且中国网民最频繁接触具有个性化推荐算法的应用,不是社交媒体、新闻、搜索应用,而是短视频应用,[7]而且短视频应用的用户比起新闻应用的用户更具有能动性,可能有更多的与个性化推荐算法的交互活动。

本研究对抖音用户开展问卷调查,同时以“抖音算法”为搜索关键词,在网民活跃的平台进行样本的搜索与选取。本文探究抖音用户对个性化推荐算法的认知,具体包括感知和知识形成两方面,试图回答两个问题:

1.抖音用户是否感知个性化推荐算法的存在?了解程度、了解意愿以及对此的评价是什么样的?
2.抖音用户形成的个性化推荐算法知识是什么样的?

三、研究发现

(一)用户对个性化推荐算法的感知

问卷主要调查了抖音用户对个性化推荐的了解程度、了解意愿、改善信息环境的意愿和行动、评价等。整体来看,不同群体对个性化推荐算法的感知存在差异。有75%的参与调查者能够感知到个性化推荐的存在,且听说过个性化推荐;49 %的参与调查者认为自己对抖音个性化推荐机制有所了解,但经过测试发现实际上了解程度有限,存在许多误解。认为对抖音个性化推荐了解程度越高的人群,更有可能评价自己对抖音有控制权。

大部分参与调查者知道“使用行为偏好”“身份信息”能够影响个性化推荐,但不太了解“使用设备的信息”“用户在其他网站或APP上的使用行为”也能产生影响。不同群体对个性化推荐算法的了解程度存在差异,了解程度高的女性比例远高于男性比例,18-30岁年轻人了解程度更高,城市地区参与调查者了解程度高的比例,要高于乡镇和农村地区的比例。

在抖音个性化推荐的了解意愿方面,整体上参与调查者不是很强烈,40%的参与调查者表示“无所谓”,约20%的参与调查者明确表示,不想了解抖音个性化推荐机制。女性的了解意愿比男性更强烈,18-25岁的参与者了解意愿最高,51-60岁的参与者了解意愿最低,直辖市参与调查者了解意愿最高。

在改善信息环境的意愿和行动方面,有46%的参与调查者尝试过调整在抖音上看到的内容,积极改善他们的信息环境,最常见的行动是“关注或取消关注某些人”,其次是“不感兴趣或屏蔽某些视频”。

在抖音个性化推荐的评价方面,分为控制权、精准度、喜欢程度的评价。关于控制权,36%的参与调查者认为自己“有很多控制权”,女性、18-25岁的参与调查者、直辖市的参与调查者,更乐观地觉得自己有控制权,表示没有控制权比例最高的是乡镇参与调查者。另外,使用越久的参与调查者,更有可能觉得控制权程度较低。每天使用时间越长的参与调查者,更有可能觉得控制权程度低。

在精准度方面,55.67%的参与调查者选择了“一般准确”,女性对抖音个性化推荐准确程度的评价略高于男性,51-60岁年龄段的参与调查者认为,抖音个性化推荐准确程度较高。表示抖音个性化推荐“不准确”和“不太准确”较高比例的,是乡镇(23%)和农村的参与调查者(25%),其他地区差异不是很大。三年前开始使用的参与调查者认为“不准确”所占比例最高。另外每天花费时间越多,更有可能感知到个性化推荐比较准确。

在喜欢程度方面,62%的参与调查者表示“一般喜欢”,男女差异不明显,41-50岁年龄段的参与调查者喜欢程度最高。直辖市参与调查者表示很喜欢的比例(5%)和不喜欢(13%)都是最高的,乡镇参与调查者表示“一般般”的比例是最高的(84%)。越早开始使用抖音的参与调查者、每天花费时间越多的参与调查者,更有可能喜欢个性化推荐。

(二)用户对个性化推荐算法的认知

1.对个性化推荐算法的拟人化概念

本文对知乎平台上“抖音的算法是怎么样的?”所有回答进行文本分析,并制作了前60个高频词的词云图(图1)。通过形成算法的拟人化概念,能更好地理解算法在现实世界中的设计理念,以及用户是如何理解抖音算法及其技术机制的。
  
第一,算法是内容审核员。在抖音用户看来,算法承担着初始的视频质量审核作用。算法发挥着两个关键作用,第一是审核作品、文案中是否存在违规行为,如果疑似存在就会被机器拦截提示用户修改;第二,算法通过抽取视频中的画面、关键帧,与抖音大数据库中已存在的海量作品进行匹配消重,如果有重复内容,将设置仅自己或者粉丝可见,缩小推荐范围。

第二,算法是流量分配者。在抖音用户看来,算法决定着流量的分配,这种算法被他们叫作“信息流漏斗算法”“流量池”“梯子”“流量分桶”,指的是当用户上传视频后,算法系统将分配一个初始流量池,如果获得的传播效果好,将会被算法分配到第二个流量池,这时候的曝光度将翻倍,如果依然表现得好,将会被算法分配到第三个流量池,大规模曝光,成为热门视频。

第三,算法是评委。在抖音用户看来,算法对流量分配有一套复杂严密的打分体系,形成“账号分值”和“视频分值”。账号分值包括账号是否进行达人认证,账号头像、昵称、签名、性别、其他资料是否填写完整,账号发起的话题质量和专业度。视频分值主要是用户的反馈,包括视频的完整播放率、重复播放率、点赞数和点赞率、关注数和关注率,还有进入主页数、评论数、评论率和评论的点赞数、分享数及分享率。

因此针对这两种评分体系,用户提出两类方式:一是“养号”,指的是让专门用来营销的账号,先模拟正常活跃用户使用抖音,来提高账户权重,让算法判定账号为优质账号。二是引导用户完成互动,比如在作品描述里设置互动问题、回复用户评论来引导用户留言评论。

第四,算法是推荐人。有些抖音用户认为算法是综合推荐机制之一,另外还与实时热度和用户关系有关,大部分人认为算法主要是利用内容标签和用户标签来智能分发视频,认为用户的喜好是最重要的推荐因素。

2.对个性化推荐算法的“行话”

①养号

除了上述的拟人化概念,活跃的抖音用户还发展了一些行话,比如“养号”。养号指的是让专门用来营销的账号,先模拟正常活跃用户使用抖音,来提高账户权重,让算法判定账号为优质账号,以便优先推荐成为热门视频。算法会根据用户的行为将账号判定为“僵尸号、最低权重号、待推荐账号”,也有用户认为算法会分为“优质用户、沉默用户、流失用户、可挽回用户”,如果是不符合抖音调性的“营销号”会被平台封禁,如果被算法判定为优质用户,平台会加大推荐。

具体操作有两方面,一方面是模拟普通用户使用抖音,很多用户分享了自己的技巧,比如@祝祝认为“新号上来不要改资料,刷视频的时候要刷和自己相关领域的视频,每天刷两小时左右的视频,上午1小时下午1小时,三天后或者发视频前一天改资料,刷视频的时候用流量卡少用无线网,一机一卡一号”等技巧。还有用户认为硬件影响流量,需要避免“一机多号”(同一个设备,频繁切换不同抖音号,容易影响账号流量,被判定为小号作弊)、“一号多机”(同一抖音号不能在多个设备上登录),需要注意4G条件下发布视频的流量,比wifi情况下发布的视频流量高;时间影响流量,不同时间段发布视频,流量差异很大,一段时间不发视频,再发视频流量就会被限值;发布数量影响流量,一天发布视频不能超过3个,否则受限;视频在同一账号下发布两遍以上,会火的概率更高;粉丝互动影响流量,频繁刷新或者删除回复和评论对视频流量有影响,抖音对大的账号会有打压策略,粉丝越多,流量越容易受到影响;企业号影响流量,认证成为企业号后,会影响账号的正常分发流量;企业号比个人账号容易起量;企业号被举报后处理得会更严厉。

另一方面是塑造人设,精准定位。要有趣、有用、有价值观或者有性格,发布的视频要与人设直接相关,因为用户认为这样才能实现“垂直定位”,因此需要专注领域的深耕,发布同款系列短视频,精心写好标题和封面的关键词,以便算法精准匹配视频内容标签。用户认为如果每天发布的视频主题不一致,容易被算法判定为低质量,难以匹配标签,将会减少推荐量。只有被精准推荐了,才能得到有效的反馈,系统才会加大对视频的推荐力度,形成良性闭环。

②挖坟

用户的行话还有“挖坟”,指的是用户很久以前发布的视频,经过算法推荐突然成为热门视频,抖音用户称之为算法的“时间效应”“二次推荐”。出现“挖坟”有三个方面的解释:第一是认为抖音的叠加推荐算法能重新挖掘出老视频,送入更高阶的流量池获得大规模曝光,因此用户认为要坚持用渠道分享推广来提高互动数据,让算法重新“看见”老视频。第二是用户认为算法是持续工作的,在没有运行新任务内容时,就会出现“挖坟”,把以前的老视频再推荐一次。第三是认为视频的地理位置和话题挑战的关注量逐渐提升,从而带动老视频的曝光量。

四、结论

关于用户对个性化推荐算法的感知,75%的参与调查者能够感知到个性化推荐的存在,且听说过个性化推荐,49%的参与调查者认为自己对抖音个性化推荐机制有所了解,但实际上了解程度有限,存在许多误解。63%的参与调查者了解意愿较低,其中40%的参与调查者表现出了无所谓的态度。对于个性化推荐算法的评价,55%的参与调查者选择了“一般准确”,62%的参与调查者表示“一般喜欢”。

总的来说,中国抖音用户对个性化推荐算法的感知,没有强烈的批评和反抗态度。很多用户其实知道抖音在将注意力贩卖给广告商,人们却表现得似乎并不在意,依然继续使用平台。他们模糊地意识到平台的权力,尽管不同意平台将他们的数据货币化,但还是决定继续使用个性化推荐,或许是因为他们找不到办法来阻止,或许是因为他们觉得能够受益于这项技术:个性化推荐使他们能够找到自己喜欢的信息,学习新的事物,还能制作视频来吸引人气获得经济资本。

关于用户对个性化推荐算法的知识,用户认为算法担任着内容审核员、流量分配者、评委、推荐人的角色。在此过程中,他们还发展出了“行话”,比如“养号”。

纵览这些关于算法知识的讨论,活跃的内容生产用户为了让自己的视频成为热门,渴求抖音算法知识,非常关注其运作机制,尽管他们中的大多数没有计算机专业的基础,但他们在抖音应用使用的日常体验中习得了算法规则,甚至有用户开设了抖音运营的培训班或者在线课程。但是,几乎没有涉及较为深奥的算法术语,很少有短视频运营员工或算法员工等专业人士,来提供确切的算法知识。

在这些讨论中,其他用户逐渐意识到,抖音掩盖了有关其算法的信息并不断更新这些信息,抖音算法依然比较神秘。用户通过实践习得了算法知识,他们对算法的规避行为也对平台和算法产生了影响。抖音的内容生产用户出于获取经济资本的考虑,更愿意学习和利用算法规则来达到热门视频的目标,具有较高的主动性和自觉性。也有一些用户提出了规避算法监控的举措,但本质上还是在迎合算法的规则,比如利用机器刷粉刷赞,还是为了达到更高的曝光度以便被算法优先推荐。在此过程中,还出现一些“行话”,比如“养号”,指的是让专门用来营销的账号,先模拟正常活跃用户使用抖音提高账户权重,让算法判定账号为优质账号,以便优先推荐成为热门视频。

需要注意到,个性化推荐其实是一种幻想,平台不让用户提供个人信息和兴趣,反而通过收集用户隐私信息,由计算机来设计代表用户的算法程序来实现“个性化”。算法背后其实蕴含着网络个人主义意识形态,每个人根据自己的需要创造互联网体验,通过消费选择来构建自主的个体——他们可以自由地选择他们喜欢的东西,而不受国家或其他社会经济机构的干预。这些所谓的个性化选择资料被商业公司所掌握,并卖给营销人员,最终个性化或许会沦为社会工厂的一个节点。

个性化技术并没有赋予人们自由,甚至可能使人们失去自由,意识形态的幻想掩盖了数据资本主义制度带来的监视和不平等。不平等体现在平台与用户之间的数据权力上,个人产生的数据为平台所拥有,丧失了数据的控制权;不平等还体现在用户之间,一方面体现在用户的算法知识鸿沟上,那些拥有更多的文化、技术、经济资源的资深用户,更乐于钻研算法规则,将自己生产的视频更大范围地让人看见,获得更多的关注度和资本;另一方面体现在用户内容的算法歧视上,基于协同过滤的算法原理,在于利用某兴趣相投、拥有共同经验之群体的喜好,来推荐用户感兴趣的信息,它试图了解用户的习惯,并将其与其他用户分组,以此进行分类。算法的特性使得对个性化的“人”进行社会分类,从而创造出个人同质化系统。算法带来的伦理问题值得深入讨论,这是今后研究的方向。

注释  
[1]安维,刘启华,张李义.个性化推荐系统的多样性研究进展[J].图书情报工作,2013,57(20):127-135.
[2]张宇航,姚文娟,姜姗.个性化推荐系统综述[J].价值工程,2020,39(02):287-292.
[3]Alexander R. Galloway, Gaming: Essays on Algorithmic Culture. (Minneapolis, University of Minnesota Press, 2006), 6.
[4]Reuters Institute for the Study of Journalism.News in social media and messaging apps[EB/OL].https://reutersinstitute.politics.ox.ac.uk/risj-review/changing-face-social- media-and-rise-messaging-apps-news,2018-9-15.
[5]易观.《中国移动资讯信息分发市场专题研究》网络报告2016[EB/OL].https://www.analysys.cn/article/analysis/detail/1000218,2016-8-12.
[6]转引自姜红,鲁曼.重塑“媒介”:行动者网络中的新闻“算法”[J].新闻记者,2017(04):26-32.
[7]中国网络视听节目服务协会.《2021年中国网络视听发展研究》在线报告[EB/OL]. http://www.wenming.cn/zg/wmzk/202201/t20220121_6285551.shtml,2022-1-21.

  

作者蒋雪颖系北京大学新闻与传播学院博士生

  

本文刊登于《新传播》杂志2022年第三期。
  
《新传播》2022年第三期封面和目录
<滑动查看下一张图片>



往期回顾

为改革发声 为城市立传 为人民讴歌


面向未来启新程

吴松营:深圳报业从舢板到巨舰

2022年普利策新闻奖揭晓


这家报社的版面何以能连续三获中国新闻奖一等奖
 
一家传统媒体公众号年收入近3000万元,是怎么做到的?

 

将“偶遇的快乐”向数字端延伸
 
做好粤港澳大湾区国际传播的关键:推进战略传播与跨文明对话

融媒体时代的新闻通报写作技巧

国有媒体如何探索创新“新闻+政务服务商务”模式


欢迎关注“新传播智库”!“新传播智库”公号是深圳报业集团《新传播》杂志推出的新闻研究和探讨的平台,注重理论与学术探析,也重视实战与案例分析,突出引领性、前瞻性和全球视野,力求成为传播力研究思想智库。

读特客户端《新传播》专题二维码:

投稿:
xcb0755@126.com
电话:
0755-83518875

若有意购买纸质版《新传播》杂志,欢迎点击下方“阅读原文”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存