计算品味:算法与音乐推荐的缔造者
Computing Taste: Algorithms and the Makers of Music Recommendation
作者:尼克·西弗(Nick Seaver,塔夫茨大学人类学系)
译者:陈荣钢
来源:同名著作(芝加哥大学出版社,2022)导论〈技术与人性〉(Technology and Humanity)
2013年8月,音频技术公司Beats Electronics宣布推出一项新的音乐流媒体服务——Beats Music。在美国,Beats凭借深受欢迎的耳机品牌成为家喻户晓的名字,标志是一个红色的卷曲字母“b”。这个标志似乎无处不在,在音乐视频中,在明星狗仔队的照片中,在街头行人的脑袋上,在洛杉矶各地的广告牌上。评论家们抨击这些耳机的质量,说Beats耳机的部件很廉价,低音被调得很重。许多人认为Beats的流行其实是一次成功的营销。该公司利用了联合创始人、制作人Jimmy Iovine和说唱歌手、制作人Andre Young(艺名Dr. Dre)的名人社交网络和文化号召力。Iovine和Dre是音乐行业的资深人士,他们缔造了20世纪80年代和90年代最流行的一些专辑,从那时起,他们的行业地位和净资产上升到一个相当高的水平,记者们通常将他们描述为“大亨”或“巨头”。Iovine利用他身为制作人的声誉来回击人们对耳机的批评。他被称为“拥有金耳朵的人”,他驳斥了那些批评Beats声音质量的人。他说,竞争对手使用花哨的设备来确定耳机应该如何听,而他和Dre自己就知道应该如何听。一边是技术,另一边是不可描述的、身体形式的专家知识。耳机的包装盒上有一段Dr. Dre的名言,也是他个人经验的体现:“人们没有听到所有的音乐。使用Beats,人们将听到艺术家所听到的,以及以他们应该的方式听音乐——就像我一样。”当Beats建立新的音乐流媒体服务时,它沿用了耳机业务的模板。Beats Music由一对具有文化背景的音乐行业资深人士领导——Ian Rogers和Trent Reznor,前者在20世纪90年代是说唱团体Beastie Boys的网站管理员,后来做过一些数字音乐公司的领导,Trent Reznor则是工业摇滚乐队Nine Inch Nails的主唱。当时,面对一个已经饱和的市场,Beats Music似乎是一个迟到者。在那之前的五年间,点播音乐流媒体服务终于在美国成为朝阳业务,克服了自20世纪90年代末以来一直扼杀公司的法律和技术挑战。到2013年,像Spotify和Rdio这样的公司已经与大多数主要唱片厂牌达成了许可协议,而智能手机和高带宽互联网的普及意味着他们的用户几乎可以连续不断地从他们的目录中播放音乐。但在那时,这些项目漫长而昂贵,参与竞争需要有深厚的财力和行业关系,不然得不到准入许可。一位数字音乐产业专家对我说,当时的情况是“僧多粥少”。随着流媒体音乐库的增长,这些公司很难从彼此中区分出来,因为它们提供的音乐大多相同。一位 Rdio 工程师向我解释说,最终将流媒体服务区别开来的是它们提供的“资源探索层”(discovery layer)。听众可以使用它们的接口和工具,在数千万首歌曲的集合中找到自己想听的内容。这就是算法推荐。例如,Whisper提供的算法服务就有了用武之地。主要的音乐流媒体服务设计了个性化的“主页”屏幕和算法电台,满足听众的特定兴趣,引导他们浏览目录并介绍新的音乐。为了将自己与市场上的其他公司区分开来,Beats再次利用了其在音乐行业的关系。其他流媒体公司起源于“技术”(例如,Spotify和Rdio的创始人从广告和电信公司的技术中获益),而Beats拥有更深的文化敏感性:我们了解音乐。我们痴迷于它,并将我们的生命献给它。我们知道,音乐是一种体验,而不是一种工具。我们知道制作音乐所需的心血和灵感,并珍惜艺术家和听众之间的联结。音乐品味是复杂的、不断发展的和独特的东西。我们相信,在正确的时间听到正确的音乐会丰富你的生活。这就是我们的职责所在。提供音乐的福祉,推动文化的发展。
在采访中,Ian Rogers认为Beats将是“一种服务,而不是一个服务器”,他拒绝像竞争对手那样过度关注技术。为此,Beats宣布,它将启用一个“策划人”团队——乐评人、DJ和明星,他们的工作将取代竞争对手典型的算法“资源探索层”。他们将创建播放列表,通过利用他们自己的、难以捉摸的文化专业知识帮助用户发现新音乐。“算法去死!”,这是一篇行业媒体文章的标题。文章写道:“Beats的新音乐服务让名流策划帮你介绍新音乐。”Beats认为,算法推荐不可能真正发挥作用,因为算法不可能像人类专家那样理解音乐品味。识别和培养品味需要人类专家的关注,而不是算法推荐。“狗屁!”一家电影流媒体公司的推荐负责人Oscar在Twitter上说:“看看他们雇用了谁!”当Beats Music问世的时候,我已经对像Oscar这样的人进行了为期数年的民族志田野调查。这些科学家和工程师的职业生涯都在开发Beats声称永远无法真正发挥作用的算法机器。我参加了他们的会议,学术界和业界的研究人员在会上介绍了新的方法,并努力寻找新的数据来源。我也采访了从CEO到暑期实习生的工作人员。我将在Whisper驻留几个月,观察“算法”背后的人如何工作。不出所料,这些人对Beats的论点持怀疑态度。如果Beats想拥有大量的音乐和大量的用户,没有算法的帮助,就没有办法实现。推荐系统不可能被一个名人团队取代——有太多的歌曲和太多的人。Reznor和Rogers要为每个用户手工制作播放列表吗?即使Beats的策展人收集了数以千计的播放列表,该公司仍然需要某种方式将这些播放列表与相关用户相匹配,而没有算法就无法做到这一点。果然,当我按照Oscar的建议,查看Beats的招聘信息页面时,我发现里面充满了寻求工程师和数据科学家的招聘广告,这些人的任务正是建立该公司新闻稿中批评的算法基础设施。当Beats Music在2014年1月推出时,比原定计划晚了些时日。它有一个名为“只为你”(Just For You)的主屏幕,上面有一组播放列表,由Beats的策划人创建,这些策划人包括匿名工作人员和脱口秀主持人Ellen DeGeneres——奇怪的是,还有零售连锁店Target。然而,这些播放列表是通过算法推荐的,借鉴了像Jeremy这样的数据科学家的工作(Jeremy是我在旧金山的一个攀岩馆采访的Beats工程师)。鉴于雇主对他工作的矛盾心理,他开玩笑说:“反正技术只是营销。”为了配合发布会,Beats发布了一个宣言形式的广告,由Reznor朗读,其中显示了一系列红黑相间的动画图像——接吻的剪影、旋转的转盘、在暴风雨中翻腾的帆船,变成一片1和0的海洋。宣言一开始就重申了该公司早先对算法的批评:音乐不仅仅是数字文件,它有呼吸,有血有肉。(要理解它),你需要在你的脑袋上安装比电路板更多的东西。因为代码不能从一个乐队的影响中听到Bowie的声音。如果你想得到一些满意的完美曲目,你需要的是大脑和灵魂,而不仅仅是软件本身。你需要的是对音乐充满热情的人。
宣言强调大脑、灵魂和激情等人类品质的重要性,但它以一种更加温和的方式结束:“我们创造了一套优雅、有趣的解决方案,将最好的技术与友好、值得信赖的人性结合起来,它把音乐理解为情感和快乐、文化......以及生活。”Beats Music不可能没有算法,因为我的对话者已经指出,它不可能没有算法,但它是人类专业知识和它所谓的“最佳”技术的综合体。当广告接近尾声时,一个脉动的红色心脏出现了,泵出的血液扩散到一个电路板的形状(下图)。这一形象再次出现在Beats的在线广告活动中,一块流淌着血液的电路板,中间写着:“有人性的技术”。
在我刚开始音乐推荐算法缔造者的田野调查时,Beats Music正好反映了那时围绕“算法”的矛盾和暧昧的流行话语。不久之前,算法还是一个相当晦涩的技术问题,正如一家广告贸易杂志所言:“大多数人几乎从未听说过这个有趣的词。”但它很快成为了公司炫耀的对象,渴望展示其技术实力。而且,算法也很快成为大众和学术界批评的对象。常如Beats营销材料所言,算法和人被定义为相互对立的东西。人类是一种东西,算法是另一种东西。例如,在2012年行业会议South by Southwest提出的讨论小组中,有“发现音乐:人类 vs. 机器”、“ 音乐探索空间:编辑 vs. 算法”和“音乐/广播内容:品味缔造者 vs. 自动化”等标题。大众和行业新闻报道通常将算法技术描述为人类专业知识的终结。通过这一切,人们从未完全清楚什么是算法,什么使服务成为“算法”,以及它是否重要。要么,算法只是Jeremy眼中的“营销”。然而,算法的形象吸引了大量的关注,并引起了非常强烈的感受,不仅在音乐流媒体世界,而且在许多其他领域,多样性成为算法重要性的另一个象征。在医学和法律领域,在公司的招聘和解雇程序中,在从威胁生命的无人机打击目标到选择下一首歌曲的微不足道之举重,都可以发现算法在计算并取代人类的专业知识。当我采访一家名为The Echo Nest的音乐推荐公司联合创始人Brian Whitman时,他马上回忆起了这种争论:“我接受的每一次面试,我参加的每一个小组,他们都会以人与机器的废话开始,好像你只有这两种选择,这让我们很生气。”对于在“人类/算法”二分法中选择“算法”一方的人来说,这种框架是一个持续受挫的来源。这种废话不仅对他们的工作造成了伤害,而且也不足以描述人和软件在“人类”或“算法”的系统中可能出现的多种方式。2012年,Brian Whitman在他的博客上写道:“是的,我们使用计算机程序来帮助管理堆积如山的音乐数据,但每个人都是如此,我们获取和使用这些数据的方式就像外面的其他东西一样,是人类的东西。”算法从来都不是简单的、无人陪伴的机器,它们总是被人类思想关照。Whitman在Twitter上说:“真正有血有肉有爱心的人类为所有流行音乐平台提供动力,包括我们。只使用所谓的‘机器人’,不可能诞生一项成功的服务。”Whitman的论点在我在该领域遇到的人中得到了广泛认同,呼应了技术社会研究的一个真理——大多数技术系统最好被理解为社会技术系统,是人类和机器元素的混合聚集体。虽然大众的和学术的批评家可能会把人类与算法对立起来,但这些“算法”充满了人们的决策,它们改变着事物,并对永无止境的大小危机做出反应。在当代软件工程的快速开发周期中,人类的行为不断地交织在算法的运作中。在学术界,对算法的关注出现在人文和社会科学的许多学科中,从社会学到新闻学,从法律理论到科学史,它们构成了一个所谓“批判性算法研究”的研究体系。回答这个问题是建立批判的重要一步。早期,许多批评家转向教科书的定义,因为他们试图使算法有意义。例如,一本常用的本科生教科书这样定义“算法”:“算法是任何定义明确的计算程序,它有一些值或一组值,也就是输入(input),并产生一些值或一组值,也就是输出(output)。因此,算法是将输入转化为输出的一系列计算步骤。”根据这样的定义,人们经常认为算法本质上是简单的过程。在计算机科学的入门课程中,典型的算法是排序算法,它被视为一种将列表按顺序排列的过程,就像整理一副牌。这种简单和直接常常是人们想象算法难以理解社会生活复杂性的原因。识别某人的音乐品味似乎比重新洗牌要复杂得多。但是,这种技术上正确的“算法”的定义并不能捕捉到实际应用中的不确定性和人类判断的社会技术网络。我们可以将这些实际存在的技术设备称为“算法系统”,以区别于课堂上的理想主义。但是在现实世界中,即使在技术从业者中,人们通常也只称它们为“算法”。显然,这些算法系统扭转了教科书中定义算法的许多特征。排序算法是简单、定义明确和稳定的,实际的推荐系统是复杂的、多孔的,并且不断变化。如果算法的定义里没有“人”的位置,那么算法系统充满了做选择和改变事情的人。这种反转很重要。如果我们感兴趣的对象是算法系统,那么只研究技术细节就会割裂掉所有参与者,而这些参与者的动机和世界观实际上会改变算法的运作方式。更近一步说,我们可以认为,在算法系统中,这些“文化”细节是技术细节,工程团队对工作的看法之于系统的运作方式和排序算法的结构一样重要。如果我们试图忽略所有人,只关注算法,我们将错过这些系统运作方式背后重要的部分。虽然算法让人们再次想起了自主技术(autonomous technology)的幽灵(specter),但不能止步于“算法是社会技术”的论调,这还不是什么结论。然而,这种论调是一个有用的起点。我们不能把算法看作人类影响的缺场,这不是它的定义特性,而那些将人类和技术对立为公理的批评,可能会加强这种文化常识而不是分析它。正如女性主义技术学者Lucy Suchman和Donna Haraway所言,批判研究者的目标不应是在人类和机器之间画出更清晰的界限,而是要分析我们的社会技术“产生了哪些类型的人性和机器性”。鉴于所有的音乐流媒体服务都依赖于人类和算法的混合处理,所以,标签的公开应用可能是反复无常的事。一个系统被描述为“人类”还是“算法”,取决于谁在说话以及他们想表达的观点。在大众媒体中,“人性化”指向文化敏感性,“算法”指向大规模工作。Willow这家流媒体广播公司的首席科学家Mike向我解释说,他的公司用算法生成播放列表,但它使用的是由人类专家制作的音乐数据。因此,大众批评者会嘲笑该公司的播放列表是缺乏人类敏感性的“算法”,竞争对手则会指出,它使用人类专家是一种局限。Willow公司在经过人类的分析后才能推荐歌曲。随着算法的大众声誉不断变化,Willow的营销会强调算法流程的不同部分。2015年,当Spotify推出了一项名为Discover Weekly的新推荐功能时,反算法情绪高涨,在采访中,公司代表们拒绝了标准的二元对立:“人类和算法的对立根本无法描述Spotify的工作方式。”产品经理Matthew Ogle坚持认为,Discover Weekly基于Spotify用户制作的播放列表分析,“自始至终都是人类的……我们的算法站在(人类)巨人的肩膀上”。将算法理解为“无人参与”并不合理,正如Ogle所说,人类无处不在,他们编写代码,生成数据,做出系统如何运作的决策,诚如一位工程师对我说:“算法也是人类的创造。”这本书研究那些身陷算法系统和讨论中的矛盾的人。尽管他们常常被描述为不带感情色彩的理性行动者,但他们自己表示受到音乐的深刻驱动。像他们的批评者一样,音乐推荐算法的缔造者也认识到自己的愿景里存在某种奇怪的东西——技术的封闭、形式化的理性与品味的开放、有条件性的主观性之间的张力。Whitman将这种张力描述为“一台能理解你音乐感受力的电脑的后现代精神错乱”。本书的标题“计算品味”旨在指出这种张力,这种张力连接了难以言说的品味观念和我们称之为推荐系统的复杂计算形式之间。这种张力是这本书探讨的文化背景之一。人们试图通过借鉴自己在计算和感受领域的经验、编程计算机和运用他们对品味和音乐的文化直觉来解决这个问题。音乐推荐的制作者并不像一些批评家所认为的那样,只是把品味这种难以捉摸的主观感受机械地加入到计算机的刻板机制中。相反,他们发展了一些思考音乐偏好和软件的方法,试图将它们彼此协调起来。这些思考方法通常受到本书序言所描述的开放计划启发,旨在促进探索和发现的技术,将品味视为具有潜力、可以培养和发展的东西。音乐推荐算法的缔造者的思考之所以重要,是因为他们指出“没有单独的算法存在”。随着算法的变化和增长,它们不会遵循某种必然算法逻辑来决定它们的样子。相反,每一刻,人们都在做出决策并评估它们的后果。至少在我的田野调查范围内,这些人不是那些将个人判断置于幼稚数据客观性和自动化渴望之上的“数据原教旨主义者”,而是寻求在算法和人类、计算和品味之间寻找一条道路的矛盾角色。对人类和机器之间关系的焦虑,以及它们独特的能力,是算法推荐产生的文化中长期存在的主题。在西方语境中,僵化、不带感情的机器和微妙、富有表现力的人性之间的区分是一种强烈的文化价值,是一种随时可用的阐释资源。在技术背景下,社会技术系统的概念有助于使这幅图景复杂化。正如我刚刚描述那样,当我们不再假设它们是人类行为的对立面时,像算法这样的技术看起来就会非常不同。大众对品味的理解恰好与技术相辅相成。如果技术是必要决策的领域,那么品味则是人类任意和主观判断的领域。我们可以对音乐有品味,但对喷气发动机的力学没有品味。同样,在这方面,社会科学家喜欢反过来强调工程的灵活性和品味的决定性。影响技术发展的不仅仅是对效率的不懈追求,我们的品味实际上是由我们自己无法控制的力量决定的。大多数社会科学家会把这种围绕品味的观点回溯到Pierre Bourdieu,这位社会学家的著作《区分》(Distinction)提供了“品味是什么”以及“它如何起作用”的常识。简而言之,品味不是由其对象引起的,而是社会秩序的结果。高雅的人喜欢高雅的东西,普通的人喜欢普通的东西。偏好是地位的一个函数,这有助于强化社会等级制度。这个品味和地位之间的“同源论”(homology thesis,或译作“对应论”)并不是Bourdieu关于品味的唯一论点。可以说,这种论点在Bourdieu之前就出现了,见于Thorstein Veblen在1899年出版的《有闲阶级论》(Theory of the Leisure Class)。但对许多社会科学家来说,品味和地位之间的同源论来自Bourdieu的品味理论。如果我们想用这套理论来构建一个推荐系统,我们可能会得到一种令人不安的设计——评估用户的社会地位,给予他们相应的文化产品。这一理论的批评者认为,品味是“一种必须加以解释的任意选择,有不为人知的社会原因”,这留下了一个解释的漏洞——品味最初是如何获得的?品味的语用学的研究回应了Bourdieu理论中这种明显的缺失,见于对歌剧迷、品酒或音乐品味的研究。音乐是一个有用的领域,在其中,我们可以研究这些关于算法的问题意识,因为它体现了文化和技术之间的矛盾关系。人类学家Georgina Born认为,音乐“破坏了我们曾经最珍视的一些二元论,这些二元论不仅涉及主体与客体的分离,而且涉及现在与过去的分离、个体与集体的分离、真实与人工的分离以及生产与接受的分离。”音乐也破坏了文化与技术的分离,是任何定义的“文化”典范,是人类情感表达的象征,同时也体现了不可磨灭的技术。Born描述道,音乐通过各种技术中介组合而存在,包括乐器的集体演奏、书面记谱、音频记录的流通等等。音乐是技术和文化的混合,长期以来,这一直是一个令人不安的问题,尤其是在西方传统中,音乐的标志便是混合和杂质。品味的语用学研究通常描述品味如何与特定技术纠缠在一起。社会学家Antoine Hennion写道:“品味非常依赖它的情境和物质载体,包括时间和空间框架、工具、环境、规则、做事的方式。它涉及细致的时间组织、集体安排、各种物品和工具,以及管理这一切的广泛技术。”基于这种理论,品味来自工具性的相遇,它不会因为个人的社会地位而奇迹般地表现出来。Hennion批判道,在庸俗的Bourdieu追随者看来,偏好的对象根本不重要,彼时的品味经验是社会结构力量的偶然产物,它迫使某些人具有某些品味。但说句公道话,这不是Bourdieu的意思。Omar Lizardo指出,《区分》的大部分内容都关乎“品味如何获得”这个问题,它只是深埋在这本“大部头著作”的“奇怪结构”的后面部分。鉴于Bourdieu在发展实践(practice)理论方面的核心作用,我们会很讶异他突然站在结构决定论一边,认为人们只是大尺度社会力量的接受者。但是,Bourdieu的品味理论取决于他对惯习(habitus)的理解——人们在社会化过程中获得的一系列具身的(embodied)倾向,获得他们在做出品味判断(以及其他事物)时运用的这些倾向。对于Bourdieu而言,惯习的概念提供了一种替代方案,可以替代将人视为自由意志的自主主体或不假思索的结构动力载体的观点。人们在充满无数实体的世界中获得构成惯习的感受力。Hennion描述说,一个人的音乐品味将受到周围人的行为方式、他们与音乐相遇的形式以及许多其他情境因素的影响。处于相似社会地位的人在相似的条件下成长,他们最终拥有相似的惯习。这样,品味如何反映社会结构的谜团就部分解开了。在Bourdieu对惯习的使用和Hennion对品味的工具化本质的坚持中,我们发现了品味与技术之间和解的潜力。惯习在某种程度上是一个技术概念。人类学家Marcel Mauss用它来涵盖他的身体技术理论,包括文化的不同实践,如走路、坐着或游泳。历史学家Jonathan Sterne认为:“技术本质上是惯习的子集,它们是有组织的运动形式。”如果我们将品味和技术理解为不同种类的有组织的技术,它们就会变得比我们想象的更相似。品味不仅是人们拥有的东西,也是他们所做的事情。品味是一套与世界交互的技术,而它所交互的世界充满了技术——人们有喜欢的唱片、唱片公司、电台;他们通过传播的基础设施遇到他们钟爱的对象;他们学会喜欢特定的媒体生态。因此,品味的含义会随着时间而改变——1940年调收音机,1970年购买黑胶唱片,2000年下载MP3,2020 年收听点播流媒体服务,这些都改变了音乐偏好的经验和发展。因此,我们预计,在充满算法推荐系统的世界中,拥有音乐品味的意义将会发生变化。这些系统不仅会从外部模拟品味,判断对错。当它们成为音乐基础设施的一部分时,它们实际上会改变音乐的运作方式。阐述这种品味理论的目的并不是要设定一个学术基准。有关品味的想法不需要正确(甚至不需要明确),就可以被构建到算法系统中,一旦被构建,它们就可以构成“可执行的基础设施”,将世界与它们所体现的理论保持一致。通过沿着某些方向而非其他方向向人们推荐音乐,一个足够大规模的推荐系统可能会让自己变得正确,哪怕这个系统的缔造者没有读过Bourdieu。将品味视为一种工具化的技术,通过无数设备进行中介和组织,便可以帮助我们避免技术本质主义观点,不再认为技术应该让品味单独存在,也不再认为计算机必须始终从外部接触品味,以技术干扰者的名义抵制它,以维护所谓人类主体性。