黄雅兰 | 声音的性别：新闻客户端自动语音播报中的刻板“音”象

Original 黄雅兰全球传媒学刊 2022-04-25

作

者

黄雅兰：暨南大学新闻与传播学院传播学副教授。

概

要

【摘要】声音正在成为未来传播的主流介质，在这一背景下，不少新闻客户端推出了自动语音播报功能。本文对我国15个具有代表性的新闻资讯客户端进行检视后发现，大部分新闻客户端提供自动语音播报功能，播报声音的性别比重基本平衡，音色、音调也呈现出多元化的特征；但绝大多数新闻客户端仅提供一种性别的声音，用户没有自定义的权限；在今日头条中，声音的性别与报道题材表现出相关性：男声多用于对政治、经济、科技等硬新闻的报道，而女声被更高比例地用作文娱、社会等偏“软”新闻的报道。从新闻客户端音频节目的整体布局来看，仍然存在偏向男声的性别差异。

【关键词】自动语音播报；合成声音；新闻客户端；性别；刻板印象

随着移动互联网和移动智能终端的发展，声音这种解放双手和双眼、伴随性强的传播介质重新得到关注，围绕“声音”发展起来的智能音箱、智能语音助手、音频播客、付费音频课程、语音搜索等数字产品近年来发展迅速，一些学者称声音为“未来传播的主流介质”(喻国明等，2020)。不少新闻客户端围绕声音开展实践创新，人民日报、今日头条、腾讯新闻、财新等新闻客户端纷纷推出了自动语音播报功能：点击新闻报道页面右上角或标题后的耳机标志，文字报道就能被自动转化为语音播报。该功能能够帮助视觉障碍者、处于移动情境中以及有伴随收听需求的用户更有效地获取信息。

此前，与该功能类似的智能语音助手以及智能音箱最初出现时，曾因几乎全部使用年轻女性的声音而被诟病，被认为强化了女性作为服务者和处于较低权力等级的刻板印象；在新闻播报中，男性声音却因为被认为更具权威性而长期占据主导地位。基于人工智能技术的新闻自动播报既与智能语音助手的功能有相近之处，又与传统的广播新闻一脉相承，那么，当前我国新闻客户端中的自动播报是以女声为主还是以男声为主？不同性别声音的使用是否存在刻板印象？

一、研究背景与文献综述

(一)声音作为未来传播主流介质的回归

声音是最早的传播媒介，人类社会初期就形成了以听觉为中心的口语文化，构成了部落化时期最基本的传播形态；印刷术的发明使传播活动从以听觉为中心的口语文化向以视觉为中心的文字文化转型，人类社会进入了“脱部落化”时代；如今，随着电子媒介和互联网的发展，声音回归成为主流传播介质，人类社会进入“重新部落化”阶段(麦克卢汉，2000)。近几十年来，随身听为城市用户在日常行动中创造了一个中介化的和私人化体验的无缝网络(a seamless web of mediated and privatized experience)(Bull，2000)，声音因而成为现代都市人群使用和控制空间、位置和他人的方式(Bull，2004)。此外，声音的伴随性特质更使其成为现代人信息接收的重要选项：“音频是我们在进餐、办公或开车时耳旁的低声细语。它并不喧闹或突兀……它就在耳畔。”(Stewart，2018)

移动互联网的发展使早先在互联网传播中不被重视的声音愈发成为重要的传播介质，“耳朵经济”蓬勃发展。根据德勤公司(Lee，2020)预测，全球有声读物市场规模将在2020年扩大25%，达到35亿美元；全球播客市场将在2020年增长30%，规模达到11亿美元；美国和中国分列全球有声读物市场的第一位和第二位，二者在全球市场规模占比共达75%。

在美国，“在线音频收听”与“社交媒体使用”并列，被权威数字媒体消费行为调查机构爱迪生和特里顿数字研究所(Edison Research and Triton Digital)作为重点调查对象。根据其调查推算，到2020年，在12岁以上的美国人中，27%的人(7600万)拥有至少一个智能音箱，62%的人使用过至少一种由声音控制的智能私人助手，60%的人在过去一周内收听了在线音频，并且收听在线音频人口的比重呈逐年上涨趋势；对于在过去一周收听了在线音频的1.69亿美国人而言，他们每周的平均收听时间超过15小时(Edison Research，2020)。此外，被称作“广播的新生”的播客近些年快速发展(McHugh，2016)，2020年，美国的播客用户预计将达到1.55亿人，占总人口的55%，而五年前美国的播客收听比重仅为33%(Pew Research Center，2019；Edison Research，2020)。播客的收听者通常是“忠诚的、富裕的以及受过良好教育的”(podcastinsights.com，2020)，听众的性别结构基本平衡(男性占比51%，女性占比49%)，平均收听时间为每周6.7小时，而随着智能音箱的进一步发展和普及，播客收听比重、收听时间等数字还会持续上升(nielson.com，2020)。

在我国，随着互联网基础设施建设的推进，声音介质的主流化和移动化也成为显著趋势，如喜马拉雅FM、荔枝FM、蜻蜓FM、企鹅FM、懒人听书、阿基米德等音频内容生产机构和分发平台蓬勃发展。根据艾媒咨询(2019)的数据，2019年，中国在线音频市场用户规模达4.89亿人；2020年预计将达到5.42亿，其中，37.2%的在线音频用户每日使用时长小于一小时，41.4%的用户每日使用时长1~2小时，使用时间主要集中于晚间和午间两个时段；从内容上来看，在线音频用户偏好的音频类型排名前三的是音乐电台(52.4%)、有声阅读(46.1%)和新闻资讯(43.5%)。

根据艾媒咨询的预测，人工智能技术、5G技术以及物联网的快速发展将持续拓宽在线音频使用的场景和空间，语音合成、语音搜索、声控技术等为人们的交流与生活提供便利的同时，也在塑造和培育用户的内容消费习惯。媒介对不同性别的呈现方式会对受众的性别观念产生影响(van Zoonen，1994)，进而影响到整个社会的性别权力结构，在声音日渐成为主流传播介质的今天，关注声音的性别问题非常重要。

(二)男声主导：媒介技术演进中的声音与性别失衡

女性的媒介形象是性别与传播研究中最重要的话题之一，其中，对女性视觉形象的研究构成该领域的主流；事实上，声音也是女性媒介形象的重要维度，从广播新闻到电视新闻，女性的声音与视觉形象一样，都经历了“符号性歼灭”(symbolic annihilation)。

在广播等现代声音媒介技术产生之前，女性的声音就被认为是负面的或引诱性的，最具代表性的就是荷马史诗《奥德赛》中关于海妖塞壬的歌声的描述(王以欣，2019)；而在亚里士多德、索福克勒斯等的文学作品中，也会出现“沉默是女性的无上荣光”“沉默是女性特有的美德”等内容(Aristotle，1998；Sophocles，1999)；即便到了18、19世纪，依然存在这样的说法，“如果女性坚持在公共场合说话，她们的子宫就会干涸”(Jamieson，1988)。

在20世纪初广播诞生后的很长一段时间内，女性是缺位的，这种缺位被归咎于下列因素。首先，女性的声音被认为无法与技术相容，例如，1927年贝尔实验室的报告称：“当女性的声音被转化为电子脉冲信号，她们声音的特征无法与我们当前的广播设备相融合，”并称经过一系列实验发现，女性声音虽然可以和男性声音一样响亮，然而却不像男性声音那样明白易懂(less intelligible)(McKay，1988)；其次，女性的音色被认为不适合广播，例如女声被认为音调过高、语速过快、经常强调不重要的词语或者为了取悦听众而故意说得花里胡哨；再次，女性的声音被认为承载了过多个人特质或者缺少个人特质(Karpf，2006)。因此，迟1933年，英国广播公司(BBC)才雇用了第一位女播音员贾尔斯·博里特(Giles Borrett)，但她并不播报新闻，而是播送节目预告等边缘内容；同年八月，博里特开始播读晚间6点新闻快报，但这项“实验”两个月后就在男性同事的压力下宣告失败；美国的第一位女性新闻主播的命运也类似，她被全国广播公司(NBC)雇用不久后就被解雇了(McKay，1988)。直到1970年代，女性才真正进入广播的核心领域，代表性事件为1972年苏珊·斯坦伯格(Susan Stamberg)成为美国全国公共广播(NPR)黄金时段新闻节目的主播，直到今日，NPR都被认为是美国最有力地发出了女性声音的主流媒体，尽管女性记者和编辑在整个新闻编辑室中比重超过50%，评论员中女性所占比例却仅为37.8%(Loviglio，2008)。

在电视新闻中，女性发出声音的历程同样曲折。1974年，芭芭拉·沃尔特斯(Barbara Walters)被任命为美国广播公司(ABC)黄金档新闻节目《今日》(Today)的主播，成为美国黄金时段电视新闻中的首位女主播；而第二位成为美国主流电视网晚间新闻主播的女性则迟至1993年才出现，为华裔女性宗毓华(Connie Chung)(Hilmes，2013)。时至今日，尽管女性新闻主播的比重不断上升，在新闻播报、商业广告、政治广告等电视节目中，女性声音仍被认为与男性声音有不同的特征，可信度有差异。例如，有研究认为，音调较低的声音有着更强的可信度和更成熟的人格(Tigue et al.，2012)，因此，政治候选人、商家都会谨慎对待电视广告的旁白，策略性地选择与内容和目标受众相关的声音性别(Strach et al.，2015)；类似的偏见还出现在电影的旁白叙述中(Silverman，1988)。这种低音调声音更可信、更成熟的迷思根源于，在男性主导的社会中，男性被视作标准性别(standard gender)(Perez，2019)，作为“第二性”的女性则要向男性规范靠拢。与该现象相关的有趣事实包括：NPR最早启用的女性主播均声音低沉(Loviglio，2008)；一些日本女性甚至为了更低沉的嗓音而去做手术(Karpf，2006)；受到女演员和其他女性电视形象的影响，女性观众也在努力将声音限制在特定范围内(Linke，1973)，一项对18~25岁澳大利亚女性的研究发现，从1945年至1993年，女声的音调降低了23赫兹(Pemberton et al.，1998)。

总体而言，在从广播电台到电视的发展历程中，新闻播报都更青睐男性声音，那么，在由人工智能技术推动的合成语音播报中，男性声音是否仍会被置于优先呈现的位置？

(三)女声主导：智能虚拟助手的声音与性别失衡

近年来，人工智能技术的发展便利了公众的日常生活，但也因缺少价值观引领而导致的歧视、偏见、强化固有权力结构等而为人诟病。在性别问题上，2019年，剑桥大学的未来智能研究中心发布的报告《人工智能与性别：对于未来研究的四项建议》(Collett & Dillon，2019)提到，当前人工智能技术中的性别问题主要存在于三方面：首先，人形机器人(humanoid robotic)被赋予的外表、声音以及行为方式等都模仿并强化着当前社会中的性别刻板印象；其次，绝大多数虚拟私人助手(virtual personal assistants)的声音都被默认设置为女声，这种推广“数字家务”(digital domesticity)的方式会强化女性作为辅助者和臣服者的角色；另外，当前的人工智能遵循性别化的认识论(gendered epistemology)，即聚焦于特定的知识或智能形式，排除或压制了传统意义上被认为属于女性领域的“智能”。

其中，虚拟私人助手的发展速度较快：从2008年至2018年，基于语音的网络搜索增加了35倍(Bentahar，2017)，仅2018年，全球就卖出一亿台智能音箱(Canalys，2018)。基于虚拟私人助手的高普及率，其女性化的偏向得到了更多关注。在欧美地区，大多虚拟语音助手在推出时无论其命名还是声音都被设定为女性：亚马逊推出的Alexa得名于古埃及亚历山大港的图书馆；微软的语音助手Cortana得名于电子游戏Halo中的一项合成智能，它将自己投射为一位性感迷人的、没穿衣服的女性；苹果的语音助手Siri的名字由一位挪威工程师创造，在挪威语中指“带你走向成功的美丽女性”；谷歌的语音助手尽管只是叫作“谷歌助手”，但其声音也是女性的(West et al.，2019)。国内方面，百度的语音助手小度、小米的语音助手小爱同学以及阿里巴巴的天猫精灵也均以女声呈现。在构思和制造过程中时，工程师们已经为虚拟助手们准备好了“人设”：Cortana的设计师之一认为“她”应当有讨喜的功能(Foster，2019)；谷歌助手的首席设计者指出，谷歌助手被想象为“一位来自科罗拉多的年轻女性，图书馆员和物理教授的小女儿，她从西北大学获得了历史学士学位，并且在一项电视益智比赛中获得了10万美元奖金”(Shulevitz，2020)。面对虚拟助手的性别争议，一些科技公司将虚拟助手的声音设置为可选择的，但大部分默认声音仍为女声。例如，苹果于2014年为Siri提供了男声选项，但有趣的是，当用户将系统语言设定为阿拉伯语、英式英语、荷兰语或法语时，Siri的默认声音为男，选择其他语言时的默认声音则为女；而亚马逊的Alexa等语音助手目前仍仅提供女声选项。

对于这一性别偏向，亚马逊、苹果等公司援引学术研究证明，相比于男性声音，人们更偏向于女性声音(West et al.，2019)；然而，也有研究认为大部分人更喜欢低频的男性声音；或者当声音内容是权威性说明时，人们更偏好男声，而在呈现帮助性内容时，人们更偏好女声(Mitchell et al.，2011)。事实上，最早的关于虚拟助手的想象出现在1968年的电影《2001太空漫游》中，表现为摄像机镜头Hal，和如今大多数语音助手的女性声音相反，Hal的声音被设定为男性；这种变化与电影中AI角色的性别变化相关，早年电影中的AI角色多为男性，近20年的电影中则以女性居多；伴随着这种性别变化的是，AI角色从威胁者转变为臣服的辅助者(Schnoebelen，2016)。

2019年，围绕着虚拟助手的性别问题，联合国教科文组织和EQUALS Global partnership联合发布报告《“如果可以，我会脸红”》，这句引语来自Siri面对用户说“你是个荡妇!”(You’re a slut)时的反应。2017年，美国新闻媒体Quartz对女性化虚拟助手如何对言语骚扰(verbal harrassment)做出反应进行研究，结果发现，虚拟助手要么轻佻地回避骚扰(如Siri的回应)、要么积极地回应(例如，alexa回应“谢谢你的反馈”)，几乎没有虚拟助手对此进行反驳或者指出这是不合适的语言(Fessler，2017)。此外，虚拟助手的女声也导致了对女性声音的命令式语言的增加(Lever，2018)，而随着女声虚拟助手的扩散，现实生活中女性也被越来越多地与助手这一角色联系起来(Lai & Banaji，2019)。

基于上述背景和研究，本研究提出以下研究问题：

Q1：我国新闻客户端中的自动语音播报是像广播和电视新闻那样偏好男性声音，还是像智能语音助手那样偏好女性声音？

Q2：播报语音的音色、音调具有怎样的特征？

Q3：用户是否能够设置声音的性别？

Q4：默认播报声音是否与记者的性别相关？

Q5：默认播报声音是否与报道题材相关？

Q6：默认播报声音与新闻客户端整体的音频节目以及媒介属性间有怎样的关系？

二、研究方法

作为对上述问题的探索性研究，本文以内容分析法和案例分析法展开。考虑到新闻客户端的普及率、排名以及机构属性等因素，文章选择了聚合类新闻客户端(今日头条、趣头条、一点资讯)、门户类新闻客户端(腾讯新闻、搜狐新闻、网易新闻、新浪新闻)、中央级新闻客户端(人民日报、新华社、央视新闻)以及市场类新闻客户端(澎湃新闻、新京报、财新、南方周末、凤凰新闻)共15个新闻客户端作为研究对象。经过一段时间的基本观察，首先对其是否提供自动语音播报、默认语音播报的声音性别、用户是否能够自主设置播报声音等问题进行探索(Q1~Q3)。初步探索后发现，在提供了自动语音播报的九个新闻客户端中，仅财新客户端、腾讯新闻客户端和今日头条客户端的语音播报包含男声和女声两种声音。为解决Q4和Q5，本研究于2020年4月7日至16日对每天打开客户端后首页的前20条新闻的语音播报内容(共600条)进行编码，编码维度包括报道自动播报的声音性别、记者性别和题材。①最后，本文将自动语音播报置于各客户端音频节目的整体内容结构中加以考量，通过个案分析探索当前新闻客户端中语音播报和音频节目中的性别偏向。

三、研究发现

通过对15个新闻客户端的自动语音播报功能进行观察和分析可以发现：整体而言，播报语音未出现明显的性别偏向；但在某些新闻客户端中，播报声音的性别与新闻题材之间具有相关关系；以及，当把自动语音播报置于新闻客户端的整个音频节目结构中考量时，也能发现某些隐性的性别歧视。

(一)概况：男声女声均分，仅财新允许用户自主设定声音性别

在研究选取的15个新闻资讯客户端中，除一点资讯、趣头条、网易新闻、搜狐新闻、澎湃新闻、凤凰新闻外，其他新闻客户端均提供了自动语音播报(详见表1)。在提供了语音播报的九个新闻客户端中，新华社、新浪新闻和新京报的语音播报全部为男声，人民日报、央视新闻和南方周末的语音播报全部为女声，今日头条、腾讯新闻和财新的语音播报的默认声音则有时为女声、有时为男声(关于这三家的声音性别分布将在下一小节中着重说明)。由此看来，目前的新闻自动播读并未出现明显的性别偏向，女声和男声均有出现，且分布较为平均，Q1得到回答。

从音色、音调来看，各家新闻客户端所采用的合成声音的音色并不一致，各有特色。例如，新华社、财新的男声比较低沉，类似中年男性的声音；今日头条、新京报的男声则比较明亮，接近青年男性的声音，而新京报的男声由于流畅度不够，被一些用户描述为“好像声音子弹朝我射过来”。女声也各不相同，例如人民日报、央视新闻、财新的女声音调较高并且咬字清晰，类似中年女性的声音，呈现出坚定、成熟等人格特征；今日头条的女声音调也高，但带有俏皮、甜美、温柔的感觉，口语感和流畅度更强，接近年轻女性的声音；腾讯新闻的女声同样温柔，但是音调较低。这些差异化的音色与早期广播中出现的偏好低音调的声音有较大差异，不同媒体采取的不同音色的声音或与媒体定位相关：三家中央级媒体的合成声音尽管具有性别上的差异，但都呈现出沉稳、成熟、坚定等特征；而相较之下，今日头条和腾讯新闻的播报语态就更平易、亲切。Q2得到回答。

在所有提供了语音播报功能的新闻客户端中，大部分允许用户自主设置播读的语速和时长，仅财新允许用户自主设定每篇报道主播的声音性别，Q3得到解答。

(二)差异化的声音性别呈现：今日头条中声音性别与报道题材相关

在今日头条、腾讯新闻、财新这三个同时包括女声和男声的客户端中，其默认声音性别的分布表现出较大差异。在财新客户端中，男声和女声所占比重基本持平，分别为46.5%和53.5%，每日男声所占比重的变化区间为30%~65%；在今日头条中，男声比重更高(63.5%)，每日男声所占比重的变化区间为45%~75%；在腾讯新闻中，女声为绝对多数(91%)，每日男声所占比重的变化区间为0~30%。

就自动播报声音的性别与作者性别的关系(Q4)而言，由于今日头条和腾讯新闻中的大部分报道仅以媒体机构署名，而未标明记者的信息，因此无从判断；从财新的情况看，刨除未署名和记者性别无从判断的36则新闻外，94条新闻的作者性别和播报声音性别保持一致，70条不一致，播报声音性别和记者性别的关联较弱。

就自动播报声音的性别与新闻题材的关系(Q5)而言，由于三个新闻客户端声音性别的整体分布差异较大，因此未基于总数对二者的相关性进行分析，而是对不同新闻客户端的情况逐一分析。就财新而言，女声和男声在各新闻题材中的分布均比较平衡。在腾讯新闻中，女声在各题材中均占绝对多数，未表现出题材和性别的相关性。

题材和性别的相关性在今日头条中有较明显的表现：政治、经济、科技、卫生等题材的新闻中，男声所占比重分别为75.5%、78.8%、100%和73.3%，均高于总体占比的63.5%；而在文娱、教育和社会题材报道中，男声所占比重仅分别为0%、16.7%、28.6%。以政治新闻为例，在今日头条、腾讯新闻、网易新闻、搜狐新闻等新闻客户端中，其每日的置顶的2~3条新闻基本一致，均是转载人民日报、央视新闻、新华社等中央媒体生产的关于中央领导机构或领导人以及有关国家发展全局的文字报道或视频报道，如《中共中央政治局常务委员会召开会议习近平主持》(2020年4月9日)、《抓好新形势下防控常态化工作用心用情为群众服务》(2020年4月11日)等；在本研究的样本中，今日头条和腾讯新闻中分别出现这样的“核心头条”17则②和22则，其中男声分别出现了12次和1次，男声更多地出现在今日头条的政治新闻播报中。此外，关于手机、汽车等带有软广告性质的科技资讯也均有男声播读，这呼应了电视广告中男性多出现在电子产品、汽车等比较昂贵的商品广告中而女性多出现在洗衣粉、食用油等家庭商品中的现象(Bartsch et al.，2000；Paek et al.，2011)。

这种相关关系并非偶然，在现实的新闻编辑室里，女性新闻工作者也主要分布于“软新闻”领域，若要踏足“硬新闻”则要承受更多的压力与偏见(李艳红、石义彬，2008)。中国社科院“中国女新闻工作者现状与发展”课题组(1995)在1994年、1995年所作的全国女记者状况调查显示，女记者在硬新闻报道领域(如经济、政法、体育等)人数比重较低；此后，有关女性新闻工作者的全国大规模调查几乎没有出现过，上海市新闻工作这协会在2001年和2013年分别对上海新闻机构的女性进行调查(贾亦凡，2001；上海市新闻工作者协会女记者工作委员会，2014)，但并未涉及报道领域；而根据2010年至2011年一项对中国调查记者接近全样本的调查，在属于硬新闻的“调查记者队伍中，男性占81.6%，女性占18.4%”(张志安、曹艳辉，2017)。而从更深层的权力结构来看，这也呼应了媒介文化中的性别化的二元等级机制(gendered binary hierarchies)(Dorer，2008)。

(三)数量对等意味着平等吗？整体音频节目背景下的自动语音播报

在“听时代”，除了主打声音传播的平台快速发展，各类媒体机构和平台也都注意到声音这一未来流量的增长点，纷纷在音频节目领域布局。本研究所涉及的新华社、人民日报、央视新闻和财新都设置了专门的音频节目板块，发展出两个以上的相对固定的音频栏目；而今日头条和腾讯新闻这样的平台型应用尽管没有独立制作的音频节目，也通过与喜马拉雅APP合作或者音频自媒体入驻等方式吸引声音流量。那么，新闻客户端的自动语音播报是否与其整体的音频节目布局相关？这种关联又透露出怎样的性别权力格局？

从目前的统计数据来看，财新新闻客户端在自动语音播报中的性别平等程度最高：不仅在总体数量上男声和女声的比重基本持平，在不同题材的分布上也基本对等，但是，这种数量上的对等并不意味着两种声音的“重量”是相等的。熟悉财新的用户很容易发现，其自动语音播报功能中的男声来自财新音视频部总编辑张鸿，女声却不那么熟悉，却也来自财新真实的工作人员——音视频部主持人袁小珊。财新APP和财新网中都设置了音频节目板块“财新FM”，该板块目前最具影响力(根据其在页面排布的位置)的音频栏目包括《财新Morning Call》(每个工作日上午8点左右更新，对头一天重要新闻的快报，时长通常在13分钟以内)、《重点来了》(每个工作日更新，对当下重要新闻事件进行解释和评论)、《财新十年调查报道故事集》(每期15分钟左右，由财新的调查记者讲述报道背后的故事)等，而这些节目的主播均为张鸿。在这些节目中，张鸿兼具新闻播报和新闻评论的职责，他的声音沉稳、成熟，播报内容简明扼要，口语化色彩很强，语速较快，符合互联网用户的收听习惯，带有鲜明的个人特征，可以说，张鸿已经成为财新的“声音名片”。而女声的来源袁小珊在财新视听节目中的“存在感”远逊色于张鸿，袁小珊先前主持的周播音频节目《财新时间》已于2020年1月停播，而她主持的视频节目也并未获得很大的影响力。因此，在财新的自动语音播报(“财小新”)中，源自张鸿的男声比来自袁小珊的女声有着更强的识别度，而来自可识别的主体的声音和该声音所包含的个人特征通常会给用户留下更深的印象。因而，尽管财新语音播报中的男声和女声的数量不相上下，但由于其对应的真实人物的影响力差异，仍会形成和强化不同的传播效果。其他两个使用了两种性别的播报声音的新闻客户端今日头条和腾讯新闻，由于其声音并未对应真实的人物，并不存在此类现象。

除财新外，另外三个有自制音频新闻节目的客户端为新华社、人民日报和央视新闻，后两者的自动播报声音与其音频节目主持人并无对应，新华社的自动播报语音则来自新华FM的音频栏目《早知天下事》的主播陈兵。事实上，《早知天下事》共有七名主播，包括四位女性和三位男性，但最终仅陈兵一位男性主播的声音被作为用作合成语音的音源。

四、结论与讨论：如何推动智能语音播报中的性别平等

通过对当前我国新闻客户端自动语音播报中的性别现象进行分析，本文发现：目前大部分新闻客户端提供了自动语音播报，整体而言，播报声音的性别比基本平衡，并未像早期广播电视新闻那样偏好男性声音或像智能助手那样偏好女性声音，音色、音调也呈多元化特征；然而，绝大多数新闻客户端仅提供一种性别的声音，未向用户提供自定义权限，限制了用户的选择；另外，如果从更微观的角度对不同新闻客户端中的合成语音进行检视，就能发现更细微的性别偏向，如在今日头条中，男声更多用于对政治、经济、科技等硬新闻的报道，而女声被更高比例地用作文娱、社会等偏“软”的新闻的报道；以及，当合成声音来自现实生活中的主播时，那么这些主播在其他节目中的影响力也会延伸到其合成声音中，现实新闻编辑室中的性别失衡就会延伸到智能语音播报中。

针对自动语音播报这一新出现的传播现象，本文作为一项探索性研究所涉及的深度比较有限，一方面是因为当前自动语音播报的普及率还没有非常高，另一方面则在于当前的自动语音播报的内容和场景相对简单，例如新闻客户端中均未提供每条新闻自动语音播报的点击量和收听量，因而无法对不同性别声音的传播效果加以有效考察。本文仅对文本的声音呈现进行了研究，未来还需要从生产和消费这两端进行进一步探索：从生产端来看，需要深入新闻编辑室或音频设计研发团队内部，通过对播报功能的设计者进行访谈，了解其设计机制与理念，并获得诸如点击量、收听率等后台数据；从消费端来看，需要以实验、问卷调查、访谈等方式检验智能语音播报与真人语音播报声音的传播差异，不同性别的智能语音的传播效果差异等，喻国明等(2019)学者已通过实验法发现，当新闻播报声音性别为男时，女性受众比男性受众对新闻的喜爱度更高。

未来，自动语音播报的形式和应用场景或将更加丰富，播报语态更加自然，但如何防止(或者至少减少)当前现实生活或新闻编辑室中的不公正、不平等现象延续至智能传播场景中，则是当前值得深思的问题。在大多数情况下，人工智能技术产生并服务于以盈利为核心的商业模式，体现出某种工具理性的目的取向，强调“效率”“资源优化配置”等原则；以传播效果测定为主要目标的实证研究则可能反映着当前的性别刻板印象，基于这类研究的技术应用可能进一步强化刻板印象。但就技术发展的初衷和归宿而言，只有真正嵌入人本精神、推动社会的公正发展，才能真正实现技术的价值。因此，不少学者呼吁反思人工智能的合理性及人工智能与人的价值冲突等，“进一步展开对人工智能的价值校准和伦理调试”(段伟文，2017；陈昌凤、翟雨嘉，2018)。就如何实现智能语音播报中的性别平等，本文认为，可以借鉴和采取其他领域的相关手段来推动智能新闻播报中的性别平等，并在反思“新闻业女性化”迷思的基础上推动数字新闻业的发展。

(一)实现智能语音性别平等的操作化手段

联合国教科文组织在关于虚拟助手和性别平等的报告《“如果可以，我会脸红”》中建议，科技公司可以通过以下方式推动虚拟助手产品的性别平等：1)增加男性声音选项并移除默认设置；2)自定义和个性化，即不仅仅只提供男女两种声音选项，而是像字体库那样提供更加多元的“声音包”，拓展用户的选择空间；3)使用去人格化、去性别化的机器声音，特别是一些调查显示，用户更青睐性别中立的数字助手(West et al.，2019，pp.115-122)。这些建议同样可以应用于当前新闻客户端的自动语音播报中：提供更多元的声音选项，允许用户自主设置；使用性别中立的机器声音，例如，2019年全球多个科技机构共同开发了首个无性别声音(genderless voice)“Q”，Q的音调为145Hz，高于男性的平均音调而低于女性的平均音调③，Q的声音不仅在听觉上舒适迷人，而且能够减少声音与现实性别的对应，规避当前社会中的性别刻板印象。

(二)反思“新闻业女性化”迷思

21世纪初出现的“新闻业女性化”(feminization of journalism)观点包含两方面内容：一方面指在媒体行业工作的女性数量不断增加，另一方面则指在此基础之上新闻业曾经的“男性化”标准、价值观和行为方式逐渐变得“女性化”。然而，尽管我国和全球范围内女性新闻工作者的数量和比重不断上升、自我能力评价也较正面，但这似乎并不意味着新闻业在走向女性化或者性别平等程度更高。例如，王海燕(2012)通过对女性记者的深度访谈发现，市场化并没有带来新闻业的女性化，反而“使得新闻业性别不平等的问题有趋于严重的危险”。近年来，社交媒体、平台型媒体的蓬勃发展使得情绪劳动(emotional labor)在新闻生产中的角色不断被强化(Lecheler，2020；Wahl-Jorgensen，2020)，基于长期以来形成的女性和情绪劳动间的密切联系，媒体行业尽管吸纳了更多女性工作者，但也更将女性囿于刻板印象化的“数字女性工作”(digital “women’s work”)中：社交媒体工作要求工作者充满热情、擅长社交互动、能在多种角色间切换以及随时在线(Duffy & Schwartz，2018)，这与虚拟助手的特征有很多吻合之处；而在新闻传播中扮演更核心角色的输出观点的评论类工作，仍基本由男性把持(Hetsroni & Lowenstein，2014)。产生于这一大背景的新闻智能播报若要实现性别平等的诉求，就不仅要关注不同性别声音在数量和比重上的对等，更要关注其播报内容的平衡和公正。

注释

①财新客户端中的一些博客内容未提供自动语音播报，今日头条中也有部分报道或资讯未提供自动语音播报，编码时遇此情况就顺延至下一条，确保每天对每个客户端的20条语音播报进行编码。对自动播报声音的编码包括以下题项：

(1)新闻标题

(2)发布日期

(3)媒体机构：1.财新；2.腾讯新闻；3.今日头条

(4)自动播报声音：1.男声；2.女声

(5)记者性别：1.男性；2.女性；3.无法识别或机构；(在此项中，编码员通过网络搜索确定记者的性别，无法确定的选3；另外，在今日头条和腾讯新闻中，大量新闻只出现媒体机构而未标明记者，这种情况也选3)

(6)新闻题材：1.政治；2.经济；3.文娱；4.科技；5.教育；6.卫生；7.体育；8.军事；9.宗教；10.环境；11.社会；12.其他

由于本研究的编码表较为简单、编码条目并不多，所以正式研究中的编码由作者本人独自完成；但在编码实施的第一日请另一位编码员共同对60条(总样本的10%)新闻播报进行试编码，以Cohen’sKappa指数测量编码员间信度，结果显示，除新闻议题的指数为0.95，变量的指数均为1，信度强。

②在今日头条中，有些以视频形式呈现的“核心头条”未提供自动语音播报，而腾讯新闻会对所有的报道提供自动语音播报。

③可访问Q的官网https：//www.genderlessvoice.com/，对比Q的声音与常见的男声和女声。

该研究是教育部人文社会科学研究青年项目“自媒体中性别暴力的传播机制与协同治理研究”(20YJC860013)的阶段性成果。

本文参考文献从略，完整版请参看刊物原文

原文刊载于《全球传媒学刊》2021年第1期。

全球传媒学刊

微信号 |

GJMS2014 (←长按复制)

邮箱 |

gmj2014@tsinghua.edu.cn

唯一指定投稿系统地址 |

http://qqcm.cbpt.cnki.net

*本刊不以任何形式向作者及单位收取版面费、审稿费、中介费等费用。

望学界业界垂青，我们共同助力中国新闻传播学研究。

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！

黄雅兰 | 声音的性别：新闻客户端自动语音播报中的刻板“音”象

您可能也对以下帖子感兴趣

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！

生成图片，分享到微信朋友圈

黄雅兰 | 声音的性别：新闻客户端自动语音播报中的刻板“音”象

您可能也对以下帖子感兴趣