揭开算法的面纱,TikTok缘何成为东京奥运会「赢家」?|德外独家
8月8日,东京奥运会刚刚落幕,相比美国官方指定的赛事转播媒体NBC,短视频社交媒体TikTok正成为用户更加关注的内容渠道。
从体操运动员西蒙·比利斯(Simone Biles)的退赛消息,到奥运村的纸板床、春卷拉面炸奶酪,TikTok不仅在信息传播速度上大为领先美国官方媒体,在挖掘奥运会幕后花絮方面更是不甘示弱。
分析公司Similarweb的数据显示,自7月23日到7月27日,美国安卓设备上TikTok的日活跃用户为2700万,日均用户增长率为3.6%,而YouTube和Instagram的日均用户增长率则分别是1.8%和0.8%。来自Sensor Tower的最新数据显示,2021年6月TikTok是全球非游戏类应用下载最多的APP。
《华盛顿邮报》将这一现象归结为TikTok精准算法助推下的对每一个用户喜好的满足。2021年一项最新的研究从算法与传播互动的角度分析了这种“TikTok狂热(TikTok Mania)”。
用户为算法的第一视角
2021年2月,TikTok推荐算法与mRNA基因疫苗、GPT-3语言模型、数据信托、锂金属电池、数字接触追踪、超高精度定位、远程服务技术、多模态人工智能、绿色氢能一道,被《麻省理工科技评论》评选为2021年“全球十大突破性技术”。
TikTok推荐算法之所以上榜的原因是“这款应用的算法可以让任何人在‘为你推荐’(For You)页面一夜成名,这也是它领先于竞争对手的秘密所在。”
TikTok的快速增长和高用户黏性,与其发现和提供内容的独特方式密切相关。
一方面,推荐算法通过充分满足用户的需求来迎合用户:兴趣标签层次结构树、用户画像和数据分区桶策略,可以为用户提供更精准和个性化的内容推荐。
另一方面,利用协同过滤算法和低成本的交互设计为用户打造循环:TikTok的流行与算法优化之间存在闭环关系,算法原理正向影响用户留存意愿,用户使用频率与算法推荐准确率成正相关。
2020年6月,《连线》发布了一篇名为《TikTok最终解释了它的“为你推荐”算法如何工作》的文章。该文通过TikTok官方博客发布的内容指出,“这一推荐算法依赖一组复杂的加权信号来为用户推荐视频,包括标签、歌曲到用户使用的设备等一切的一切。”在这篇“第一次揭开了TikTok算法神秘面纱”的博文中,一些关键因素得以呈现:
1.视频“完播率”权重高于用户交互
TikTok算法为用户提供他们感兴趣的内容,彼此之间经常互动的账户更有可能看到对方发布的帖子。但是在这一类别中排名指标最强的是视频“完播率”(video completion rate),即某个视频如果被更多用户完整地看完,那么它更有可能被推荐给其他用户。
2. 特定阅听兴趣权重高过网红个体
TikTok算法与Instagram的“探索”(Explore)页面非常类似,该算法更有可能给用户推送他们经常搜索的某个特定标签(#),或带有某种特定声音要素的内容。推荐的结果取决于视频的标题、声音和标签,并结合用户的拍摄内容、点赞过的视频等。
3. 注重挖掘新人并跟推相关内容
相比其他平台更倾向于生产具有大众吸引力的内容,TikTok的推荐算法似乎更有可能从默默无闻的创作者中发掘出新星。
与一般依靠博主画像的推荐方式不同,粉丝数量、是否走红过等因素并不会成为TikTok推荐算法的核心判断依据。这也可以解释为什么“为你推荐”页面上高度参与的视频会和几乎没有任何浏览量的视频并置出现。
通过将网红博主的视频与新人博主的视频混放在“为你推荐” 页面,通过浏览量奖励创作,这种方式将更多新人博主的作品推荐给了广大用户。
随着相关内容被提供给有着共同兴趣、爱好或特定身份的用户群体,新人快速获得大规模的网络可见性,其他用户也得以轻松发现海量的多样化内容。这一方式对该应用的惊人增长做出了关键贡献:不仅能够精准地为用户推荐感兴趣的内容,还能通过推荐算法帮助用户拓展与其有交集的新领域。
4. 关注帐户设置但倡行“去地方性”
用户的地理位置、语言偏好和设备类型等也是推荐算法衡量的重要指标。虽然没有其他指标排名靠前,但据此可以优化用户的观看体验。“地方性”并不一定是TikTok算法的核心,甚至在一定程度上,“去地方性”才是考虑的重点:全球内容和本地视频都有可能获得推荐。
2021年7月,《华尔街日报》通过实验方法在TikTok上开设了多个自动账号。在观看了成千上百条短视频后,《华尔街日报》试图发现TikTok推荐算法的核心要义。
与一般分析不同,该报道称TikTok的推荐算法甚至可以不需要用户的个人信息或者其他场景要素变量,只需要跟踪并记录用户在某一类内容上停留的时间总和即可——这一停留时间(linger time)既包括观看时间,也可以是犹豫的时间等。
算法是交互式网络效应的技术体现
TikTok算法推荐的巨大能量促使其迅速走红,多语言版本使得其可以在全球150多个国家下载和使用,推荐算法就成为了各方关注的焦点。但对“核心算法”的理解不能仅仅限于算法特征,而需要将其看作是一个系统、一种网络效应和参与式的集体行动。
作为数字经济的典型代表,社交媒体俨然已经成为“软性”基础设施,用户的使用与反馈经由数字印记追踪技术统一为可被识别、计算、累积、组合的数据原料,而数据原料正是这一庞大而隐秘的基建的能量来源。
2020年的一项研究发现,随着近年来TikTok越来越受欢迎,其推荐算法模型有助于平台做出各种战略决策,成为TikTok上的名人是给用户个体以及企业带来利润的好方法。
在TikTok爆红之后,很多社交媒体公司、网络红人都试图通过多种方式在自己的应用程序上复制TikTok上的功能,或者重现个人成功的案例。“创建一个像TikTok这样的音乐视频应用需要多少钱?”是当今创业公司最常问的问题之一。
一位TikTok创作者对自己在平台上的成功感到惊讶,他认为自己只是比较擅长“搞笑”,此外别无它长,然而22岁的他在TikTok上却稳稳坐拥180万粉丝。
如何诱发“网络效应”也是数字经济关注的重点。作为行动者的实体、作为运作机制的策略、作为外部环境的市场、甚至是入场时机和推广范围等的差别,都会带来截然不同效果。
因此即便掌握了推荐算法的基础应用和高级特征,不同经济环境下的网络效应也会千差万别。Facebook之前力推的Lasso,Instagram的Reels以及YouTube的Shorts,技术能力不可说不强,但最终效果依然需要时间观察。
算法是否需要监管
而关于推荐算法还有一个争议:即“算法技术”既然无法被完全照搬,那是否就无需担心或者不用监管?
前谷歌大数据分析专家Guillaume Chaslot解释称,“这一算法会探测到,比如沮丧的内容会引发长时间的在线观看行为,因此就会持续给用户推送类似的内容。这样的算法会让用户越来越多地接触到某些极端的情绪内容,但也会带来更多的卷入时间。”
在《算法社会:技术、权力与知识》一书中,两位编者对算法规制的社会影响进行了深入分析。其中关于“算法运用的透明度和问责程序”也单独列出作为重要的一章予以讨论。在英国竞争和市场管理局(CMA)年初发布的关于“算法伤害”的报告中,也提出了“对于更加复杂的算法,需要包括可解释的算法系统。”
在2020年7月的一篇博客中,当时的TikTok首席执行官表示,“所有公司都应该向监管机构披露它们的算法、审核政策和数据流”,并概述了TikTok为此采取的一些措施。
但关于这个问题,也有相关研究认为,“在某些情况下,广泛的透明性和详细的解释只应与需要理解它们的人(即审计员或监管人员)共享,因为它们可能会增加对算法进行不必要的操纵,即‘博弈’(gaming)的风险,或者在定价算法的情况下助长市场参与者的串通。”
近日,由中央宣传部、文化和旅游局、国家广播电视总局、中国文联、中国作协等五部门联合印发的《关于加强新时代文艺评论工作的指导意见》中明确指出,“要健全完善基于大数据的评价方式,加强网络算法研究和引导,开展网络算法推荐综合治理,不给错误内容提供传播渠道。”
算法可能无法被copy,但需要适度透明。
编者按:
作者:方师师,上海社会科学院新闻研究所副研究员,互联网治理研究中心主任,德外5号特约作者。
转载引用声明:
请原文转载或不加修改地引用文中数据、结论及数据说明,并注明来源。除此之外的任何自行加工与解读均不代表CTR观点,对由此产生的不良影响,CTR保留诉诸法律的权利。
延伸阅读