查看原文
其他

合成语音新闻的传播效果评测——关于语速影响的EEG证据

喻国明 王文轩 等 国际新闻界 2021-05-14

喻国明,教育部长江学者特聘教授、北京师范大学新闻传播学院学术委员会主任、认知神经科学与传播学创新实验室主任。

王文轩,中国人民大学新闻学院博士研究生。

冯菲,北京师范大学新闻传播学院博士研究生。

修利超,北京师范大学新闻传播学院认知神经科学与传播学创新实验室副主任。


引言


近年来,人工智能发展迅猛,与之相伴随的智能合成语音应用迅速普及,渗透到人们生活中的方方面面,如智能硬件设备的人机交互界面、视觉障碍人士的辅助软/硬件、文本信息的语音转换等等。日常接到的销售电话、网购咨询的客服、开车使用的导航、通勤路上听的新闻等等,都充斥着智能合成语音的身影,有些交互领域甚至只有合成语音没有真人语音,如汽车导航、智能音箱交互等。


技术的进步使得合成语音越来越逼近真人,如极高相似度的音色、真假难辨的语音语调,然而,收听时对“倍速”功能的频繁使用,又用技术扭曲了逼近真人的合成语音。由于声音传播具有的高弹性接收、低门槛接入、低成本制作等优势,语音产品早已“飞入寻常百姓家”。人们浸润其中,却对这种技术赋权的媒介——合成语音的影响知之甚少。那么,长期接受合成、加速的内容产品会对人们的使用体验产生哪些影响?其作用机制如何?即是本次研究聚焦的主题。


(一)LC4MP理论内涵与意义


Lang、Potter、Bolls、Schwartz等学者以及他们的学生开始了一系列媒介生理心理学实验,实验成果逐渐形成了涵盖内容丰富的LC4MP理论(Limited Capacity Model of Motivated Mediated Message Processing),即人类拥有的是一个有限的、不变的认知资源池,利用这一有限的资源池对信息进行动态的、平行的编码(encoding),储存(storage)和检索(retrieval)。由于个体认知资源有限,能够编码、储存和检索的信息存在一个上限,不可能对消息中的所有信息进行编码和储存,因此需要不断地选择要对哪部分内容进行编码、处理和储存;个体、媒介和内容都会影响认知资源的分配(Lang,Bolls,Potter & Kawahara,1999;Lang,Zhou,Schwartz,Bolls & Potter,2000)。


认知资源的调配通过无意识的自动分配和有意识的自主控制来实现。LC4MP模型即是聚焦于自动分配处理,探究普遍的、意识控制之外的反应(Lang,2006;Lang,2017)。自动分配主要包括动机激活(motivational activation)和定向反应(corienting response)两种分配机制;人类的动机系统包括趋近和回避动机,即环境中的机会(如食物、金钱等)和威胁(如具有攻击性的人或动物、武器等);定向反应是用于提醒生物体注意 环境中新的、异常(相对环境是新的,但对个体而言,未必是新的)的或具有信号特性(个体之前学到的重要或相关信息,如电话铃声,自己的名字)刺激的认知机制;当有关动机的或定向的刺激出现,就会有认知资源被自动分配来处理(Lang,2017);这种自动分配的机制响应时间相对较短,在几秒钟内就会发生。信息的内容和结构特征会引起定向反应和资源自动分配。


(二)研究问题


LC4MP理论将个体大脑中处理媒介信息的“黑箱操作”解剖开来,从生理心理学角度呈现受众的媒介信息感知加工。目前已有的研究多集中于语音的注意和记忆,对说服、评价的研究不多,研究对象以视频居多,聚焦于纯音频的研究很少。


这些有关语音结构方面的研究主要是对真人语音的研究,很少有专门针对合成语音形式特征的研究,且这些基于真人语音的研究结果是否适用于合成语音,不得而知。与此同时,在新闻传播领域,由于新闻质量的评价不易测量,因此研究者以更易获得的信任度(credibility)和喜爱度(liking)测量为主。研究人员先后编制了适用于印刷和在线新闻(Sundar,1999)以及人工智能生成新闻(Clerwall,2014)的测量指标。研究者还发现在内容的信任度和喜爱度等方面,真人语音与合成语音对受众的感知影响几乎一样(Nass,Foehr,Brave & Somoza,2001)。然而,这些研究多为行为实验,很少结合生理实验。此外,前人的诸多研究显示,个体对语音信息的评价存在性别差异。


鉴于此,本研究基于LC4MP理论,将合成语音作为研究对象,以信任度和喜爱度作为因变量,将语音结构特征之一的“语速”和受众性别作为自变量进行研究,进一步丰富LC4MP理论在声音结构——语速方面的研究,同时将这一理论应用拓展至合成语音领域。


(三)语速影响传播效果的文献回顾


语音信息处理过程中,语速决定了基本韵律元素的变化,其对传播效果的影响,在理解、劝服、评价等方面已被诸多研究者讨论。


在过去的几十年中,广播电视新闻的播音速度不断加快。一项以中央人民广播电台《新闻和报纸摘要》节目为对象的调查结果表明,60年代,该节目每分钟播出185个字;80年代,200-220字;90年代240-260字;2000年以后,每分钟播出250-270字,最快时达每分钟300多字(谢礼逵,周振玲,2002)。随着声音速度逐渐加快,人们接受信息、理解信息的能力也在提高。


有实验发现,语速能够影响说服力。较快(226词/分钟,常速的1.18倍)的语速会引发年轻人更多的与情感相关和与呈现信息相关的反应,比如产品或品牌想要产生对受众的吸引力,使用快语速说服效果更佳。而如果劝服目的聚焦于更细节的,关于产品的理解,那么选用慢速(163词/分钟,常速的0.85倍)语音效果更好(Megehee,Dobie & Grant,2003)。


以往的研究还发现,语速影响人们对信息内容的信任、喜爱以及对音源人的评价。慢语速会降低人们对信息内容的关注和兴趣(Mastropieri,Leinart & Scruggs,1999)。适度快速的演讲比缓慢的演讲更受欢迎(Murphey,Dobie & Grant,2003)。一项有关电视购物主持人的语速的研究也发现,语速越快,人们的喜爱度越高(李维婕,2017)。而一项有关教学语速的研究发现,说话速度较慢(116词/分钟,常速的的0.67倍)的教学录音,被学生认为不太可信,且教授的内容影响力也更低,而说话速度中等(172词/分钟,常速)以及较快(213词/分钟,常速的1.24倍)的教学录音的可信度和内容影响力却没有明显的差异(Simonds,Meyer,Quinlan & Hunt,2006)。Kenta和Naomi(2018)的研究也发现,在可靠性(Reliability)方面,快速(1.2倍速)与常速语音之间差距极其微小。也有研究发现,相比语速更慢或更快的人,受众评价与自己语速相近的人的能力和社会吸引力最高(Feldstein,Dohm & Crown,2001)。


语速还影响用户理解语音信息内容。Rodero(2015)测量了五种不同的语速(150、170、190、210和230词/分钟),在两种信息要素密度(低密度和高密度)条件下,受众对新闻的感知,结果显示,用户最喜欢170词/分钟和190词/分钟语速的新闻,认为最正常和容易理解。Kallinen和Ravaja(2005)的研究发现,年轻用户认为快速(1.2倍速)新闻更愉悦、更有趣,老年用户却认为慢速(0.7倍速)新闻更愉快、更有趣、更容易理解。Kenta和Naomi(2018)的研究表明,常速和慢速(0.8倍速)比快速(1.2倍速)语音更容易理解。较低的语速给了人们更多的时间进行认知加工,因此引起人们对于广告文本所传达的产品的大量反应,相反,较高的语速引发了更多与信息(广告文本)相关的反应(Megehee,Dobie & Grant,2003)。


除了上述外显的影响效果以外,语速的影响还表现为一些内隐的效果,如语速在人类大脑信息处理过程中的影响。根据LC4MP理论,结构复杂度增加,如节奏加快,语速(语音信息基本韵律元素的变化)加快,个体会自动分配更多的资源来编码快节奏的消息,与此同时节奏的提升也引发了更高的生理唤起,进而增加了额外的资源分配(Potter et al.,1997)。进一步的研究发现,大学生受众在接收中性平静的语音信息时,节奏越快生理唤醒(皮肤电导反应频率,SCRs)越高(Lang,Schwartz,Lee & Angelini,2007)。


不同性别受众对声音的认知加工存在差异。两项采用功能磁共振成像(functional magnetic resonance imaging,fMRI)的研究发现,性别差异体现在大脑的颞中回(middle temporal gyrus)中部和颞上回(superior temporal gyrus)中部,在这些区域所控制的语音(如成人男女、老人、小孩录制的单词、句子等)和非语音(如自然、动物、乐器、工业等声音)的分类识别准确性上,女性比男性更高(Ahrens,Awwad,Giordano & Belin,2014)。一项识别熟人声音的实验表明,女性比男性更容易识别出熟悉声音的来源(Skuk & Schweinberger,2013)。


研究还发现,女性受众感知到的说话者速度越快,评价其社会吸引力越低,男性受众感知到的说话者的语速越快,评价其社会吸引力越高(Feldstein,Dohm & Crown,2001)。Kallinen和Ravaja(2005)的研究显示,男性受众评价快速(1.2倍速)语音新闻比慢速(0.7倍速)语音新闻对自己更重要,女性受众则认为慢速新闻更重要;此外,快速新闻引发了男性受众更高的皮肤电导反应,但不同速度新闻对女性的皮肤电导却没有差异。


与采用心率、肌电、皮肤电来研究大脑信息加工机制相比,脑电图(electroencephalography,EEG)的测量方式更为直观精准。对于用户体验来说,EEG技术可以不依赖于个体的行为反应而对其脑活动进行“内隐”的观察,并且可以在使用产品的过程中对其体验进行评估,而且造价低廉、方便携带,特别适用于各种使用媒介产品的场景。这对传统的行为测量手段是一个有力的补充。


一些EEG频段的活动强度和人类的认知、情绪等内在心理活动有着密切的关系:alpha波是成人意识清醒、身体放松期间EEG的主要频率(Angelakis,Lubar & Stathopoulou,2004),其活动越强表明该脑区活动越弱;在复杂和认知要求高的任务中,alpha波会下降(Borghini,Astolfi,Vecchiato,Mattia & Babiloni,2014);alpha波的下降还与提高警觉性和注意力有关(Frey,RuhnauP & Weisz,2015)。此外,beta波与个体精神状态的活跃有关(Khanna & Carmena,2015);注意力集中,思维活跃时,beta波增强。theta波的增强与工作记忆的激活有关,任务难度的增加及任务时间的延长伴随着theta波段活动的增强(Gevins,Smith,McEvoy & Yu,1997);此外,theta波与情绪唤起呈正相关关系。delta波段为处于无意识状态、深沉睡眠时的脑波,成年人在极度疲劳和昏睡状态下也会出现。一些EEG指标也可以体现人脑信息加工特征的某些方面,比如TAR(theta/alpharatio)与工作负荷有关;在高度心理工作负荷中,theta功率增加,alpha功率减少,TAR增大(Borghini,Astolfi,Vecchiato,Mattia & Babiloni,2012)。TBR(theta/betaratio)与注意控制呈负相关关系;在注意力缺陷和多动症人群中较高(Angelidis,van Dose,Schakel & Putman,2016)。因此,本研究拟采用EEG技术结合行为评价,通过实验手段综合考察不同语速条件(1.0倍速、1.5倍速)下,不同性别受众对于合成语音新闻的用户体验。


方法


(一)实验参与者


51位实验参与者(其中女性26人),年龄在18-28岁之间,以在校学生为主,右利手,无精神、神经疾病史及家族史(如癫痫等),实验时无头部外伤,实验前一周内未服用精神兴奋类药物或影响中枢神经功能的其他药物。参与者在实验之前填写中文版贝克焦虑量表(Beck Anxiety Inventory,BAI)、贝克抑郁量表(Beck Depression Inventory,BDI)和积极消极情绪量表(The Positive and Negative Affect Scale,PANAS)对其情绪状态进行考察,参与者没有表现出临床上的焦虑和抑郁症状,各组量表的得分如“表1”所示。所有实验参与者实验前均签署了知情同意书,实验后获得一定数额的报酬。



随机分成4组,2组男生,2组女生。第一组由12名男性组成,收听1.0倍速的合成语音新闻,第二组由13名男性组成,收听1.5倍速合成语音新闻。第三组包含13名女性,收听1.0倍速的合成语音新闻,第四组由13名女性组成,收听1.5倍速的合成语音新闻。


(二)实验材料


实验语音材料共有4种条件,每种条件下都包含1段练习语音和7段正式语音,共32段语音新闻,正式语音新闻每段包含的字数在614-764之间,练习语音新闻字数为405字,长度为1分28秒。所选新闻内容控制信息类别,取材自传统媒体已经发布的新闻,均为非热点新闻,题材包括经济和科技两方面,没有明显的男女偏好内容(如美妆、体育等),也没有明显的专业深度。以降低信息难度和内容相关性对个体认知资源控制分配的影响(Lang,Bolls,Potter & Kawahara,1999),或影响忽略不计,且未做二次编辑加工。将初选的12篇文章分发给15位新闻传播领域的老师、博士、硕士生,并让他们判断情感偏向,最终选取8篇情感偏向为中性且无争议的文章,作为本实验材料。以往的研究表明,唤起情绪的内容(积极和消极)比平静的内容需要更多的认知资源来处理(Lang,Dhillon & Dong,1995;Lang,Newhagen & Reeves,1996),因此内容情感的中性化可以降低对认知资源自动分配的影响,或者影响忽略不计,语音录制选用科大讯飞的智能合成技术,得到合成语音1.0倍速(即常速,270-290字/分钟)的音频,然后进行加速处理,得到1.5倍速(405-435字/分钟)的音频。


实验量表总结Meyer(1988)、Newhagen和Nass(1989)、Sundar(1999)、Clerwall(2014)、Graefe(Graefe,Haim,Haarmann & Brosius,2018)等人的新闻、语音实验,筛选出其中一些测试项目,作为本研究可信度和喜爱度测量指标:


可信度:公正的(fair)、无偏的(unbiased)、准确的(accurate)、清楚的(clear)、值得信赖的(trustworthy)、可靠(reliable)、可信的(believable)、客观的(object)、权威的(authoritative)。


喜爱度:有趣的(interesting)、令人享受的(enjoyable)、有娱乐性的(entertaining)、令人愉悦的(pleasing)、生动的(vivid)、写得好(well-written)、令人厌烦的(boring)、转发(repost)、分享(share)。


(三)实验程序


实验参与者端坐于电脑前,在静息5分钟后,开始收听电脑扬声器外放的合成语音新闻,第一段为语音新闻练习版,接下来为正式版,为排除因实验材料顺序产生的干扰问题,每段材料出现的顺序预设为随机排序,每段新闻播放完毕后,填写信任度和喜好度评分表。在收听新闻阶段同步采集EEG信号。可信度与喜爱度评分表采用9点评分表的形式,实验参与者被要求在1(一点儿也不)到9(非常)的范围内评价语音新闻的可信度和喜爱度,其中令人厌烦的(boring)一项为反向计分。


(四)数据处理和分析


对实验参与者的可信度与喜爱度评分分别进行平均。分数越高,表明可信度、喜爱度越高。脑电数据采用Cognionics Quick-30 32导无线干电极脑电设备记录,采样率为1000Hz,按照10-20系统排列电极位置。DC记录,前额接地,0-100Hz带宽。参考电极为左侧乳突,离线分析时转化为双侧乳突平均参考,实验参与者在安静、无干扰的实验室内完成实验。采集数据后,使用EEGLAB 14.1.1进行离线分析,手动去除漂移较大的EEG,并使用独立成分分析(Independence Component Analyse,ICA)剔除眨眼、扫视、头动等伪迹。得到干净的数据后,选取F3、Fz、F4、C3、Cz、C4、P3、Pz、P4这9个电极点的数据进行离线分析。通过快速傅里叶变换(Fast Fourier Trans-form,FFT)(Hanning窗函数,1s宽度和50%交迭比)提取alpha、beta、delta、theta波段在9个电极点上的功率谱密度值(Power Spectral Density,PSD),以及快慢波比率的数值(theta/betaratio,TBR;theta/alpharatio,TAR),为了进行归一化,对这些PSD数值取自然对数,然后计算9个电极的PSD平均数。采用SPSS23.0进行统计分析。


结果


(一)行为实验结果


行为实验中各组被试的信任度和喜爱度分数如“表2”所示。



1.喜爱度


对喜爱度分数采用两因素方差分析(two-way ANOVA)进行统计,其中声音速度是组间因素,受众性别也是组间因素。结果发现:声音速度的主效应不显著(F(1,47)=1.337,p=0.253,η2P=0.028),受众性别的主效应显著(F(1,47)=4.627,p=0.037,η2P=0.090),女性受众对语音新闻的喜爱度(M=4.935)比男性受众(M=4.502)要高。声音速度和受众性别的交互效应不显著(F(1,47)=0.280,p=0.599,η2P=0.006)。


2.信任度


对信任度分数采用两因素方差分析(two-way  ANOVA)进行统计,其中声音速度是组间因素,受众性别也是组间因素。结果发现:声音速度的主效应不显著(F(1,47)=2.085,p=0.155,η2P=0.042),受众性别的主效应不显著(F(1,47)=0.011,p=0.918,η2P=0.0002)。声音速度和受众性别的交互效应显著(F(1,47)=8.217,p=0.006,η2P=0.149),进一步进行简单效应分析发现,在合成语音新闻为1.5倍速时,男性受众的信任度(M=7.620)高于女性受众信任度(M=6.631);当合成语音新闻为1.0倍速时,男性受众的信任度(M=6.185)低于女性受众信任度(M=7.104)。


(二)脑电实验结果


脑电实验中各组被试的各个波段EEG强度和快慢波比率如“表3”所示。



采用两因素方差分析(two-way ANOVA)分别对各个波段的脑电数据功率谱密度(PSD)以及TBR、TAR指标进行了统计分析。其中声音速度是组间因素,受众性别也是组间因素。


delta波段PSD结果显示:声音速度的主效应不显著(F(1,47)=0.947,p=0.335,η2P=0.020),受众性别的主效应不显著(F(1,47)=0.323,p=0.573,η2P=0.007)。声音速度和受众性别的交互效应不显著(F(1,47)=0.105,p=0.748,η2P=0.002)。


theta波段PSD结果显示:声音速度的主效应不显著(F(1,47)=2.426,p=0.126,η2P=0.049)。受众性别的主效应不显著(F(1,47)=3.721,p=0.060,η2P=0.073)。声音速度和受众性别的交互效应不显著(F(1,47)=0.277,p=0.601,η2P=0.006)。


alpha波段PSD结果显示:声音速度的主效应不显著(F(1,47)=2.937,p=0.093,η2P=0.059)。受众性别的主效应不显著(F(1,47)=2.649,p=0.110,η2P=0.053)。声音速度和受众性别的交互效应不显著(F(1,47)=0.387,p=0.537,η2P=0.008)。


beta波段PSD结果显示:声音速度的主效应不显著(F(1,47)=1.848,p=0.180,η2P=0.038)。受众性别的主效应显著(F(1,47)=5.496,p=0.023,η2P=0.105),女性受众(M=0.475)在听合成语音新闻的时候相比男性受众(M=-0.417)beta波段强度更大。声音速度和受众性别的交互效应不显著(F(1,47)=0.299,p=0.587,η2P=0.006)。


TBR结果显示:声音速度的主效应不显著(F(1,43)=0.0003,p=0.987,η2P=<0.001),受众性别的主效应不显著(F(1,47)=0.004,p=0.949,η2P=<0.001)。声音速度和受众性别的交互效应不显著(F(1,47)=0.931,p=0.340,η2P=0.019)。


TAR结果显示:声音速度的主效应显著(F(1,47)=5.094,p=0.029,η2P=0.098),受众在听合成语音1.5倍速的时候(M=1.486)比听合成语音1.0倍速的时候(M=1.283)的TAR更大。受众性别的主效应不显著(F(1,47)=0.329,p=0.569,η2P=0.007)。声音速度和受众性别的交互效应不显著(F(1,47)=0.067,p=0.796,η2P=0.001)。


讨论


本研究试图探究不同语速条件(1.0倍速、1.5倍速)下,不同性别受众对于合成语音新闻的用户体验。行为实验结果发现,女性受众对合成语音新闻的喜爱度比男性受众更高。受众对合成语音新闻的喜爱度与速度无关。合成语音新闻为1.5倍速时,男性受众的信任度高于女性受众信任度。当合成语音新闻为1.0倍速时,男性受众的信任度低于女性受众信任度。脑电结果显示,女性受众在听合成语音新闻的时候相比男性受众的beta波段更强。男女受众在两种速度条件下,delta、theta、alpha波段的强度以及TBR差异不大。受众在听合成语音1.5倍速的时候比听合成语音1.0倍速时的TAR更大。


(一)喜爱度与脑电指标


喜爱度的研究发现,女性比男性对合成语音的喜爱度更高。脑电结果显示,女性受众在听合成语音新闻的时候相比男性受众的beta波段强度更大,语音速度对beta波没有影响。


以往研究发现,beta波的活动反映了因刺激处理过程导致的任务或者状态的激活反应(Barry,Clarke,Johnstone,Magee & Rushby,2008),注意力集中,思维活跃时,beta波增强。这表明在倾听的过程中,女性确实比男性投入了更多的注意资源,合成语音中不熟悉的语音语调、韵律、停顿等副语言线索更容易被女性注意到;或者男性在听的过程中,开始时注意到了合成语音,之后则可能更关注内容本身;而女性则在开始时注意到合成语音播放,之后则可能更多注意合成语音本身。那么全程听下来,女性比男性对合成语音印象更深刻,对它的技术更感到惊喜。此外,女性用户比男性更青睐语音输入,搜狗智能语音输入大数据显示,女性用户占比62%,可见女性对合成语音接受度更高(人民网,2018)。以上这些可能是导致女性更喜欢合成语音的原因。

(二)信任度与脑电指标


信任度方面,当合成语音新闻为1.5倍速时,男性受众的信任度高于女性受众。当合成语音新闻为1.0倍速时,女性受众的信任度高于男性受众。以往研究发现,男性受众评价快速新闻更重要,女性评价慢速新闻更重要(Kallinen & Ravaja,2005)。本研究的结果与这一发现比较相似。原因可能是基于性别刻板印象和社会角色期待,女性往往将舒缓、平和等顺从性的特质与自己联系在一起,男性往往将快速、高效等主导性的特质与自己联系在一起。且女性听众比男性听众对与自己相似语速的说话者评价更高(Feldstein,Dohm & Crown,2001),因而女性更信任与她相似的常速(1.0倍速)语音,男性更信任与他相似的快速(1.5倍速)语音。


脑电结果显示,男女受众在两种速度条件下,delta、theta、alpha波段的强度以及TBR差异不大;受众在听合成语音1.5倍速的时候比听1.0倍速时的TAR更大,性别对TAR没有影响。TAR(theta/alpharatio)指标被认为与认知负荷有关,这一指标越大,表明认知负荷越大。Antonenko等人(2010)的研究发现,当被试睁开眼睛开始执行心算任务时,alpha波明显受到抑制,随着任务难度的增加,alpha活动减少,theta波活动增加,TAR变大。本实验中,随着语速的加快,人们在一定时间内处理的内容也越多,认知负荷增大。theta波上升和alpha波下降还被视为“注意加工指数”,其与电视收视率具有较大相关性,研究表明电视节目必须吸引和维持观众的注意力,才能留住观众(Avgusta et al.,2019)。据此推测,语速加快导致TAR指标上升,意味着引发了更多注意力资源的分配,验证了LC4MP理论。


综上所述,LC4MP理论中信息结构特征的变化——结构复杂度增加——语速加快,引发了认知资源的自动分配(Lang,Chung,Lee & Schwartz,2002),这一论点与本实验结果一致。受众性别对TAR指标没有影响。与此同时,信任度评价同时受到语音速度和受众性别的影响,男性更信任快速语音,女性更信任常速语音,这一结果可能更多的受到社会传统性别观念和自我角色期待的影响。此外,女性比男性beta波更强、喜爱度评价更高,表明女性对合成语音的关注更多,喜爱度评价及beta波均不受语音速度影响。


除此之外,以往LC4MP理论下的研究聚焦于对信息的理解、记忆、说服、评价等方面,而在有关说服和评价的研究中,很少有人将喜爱度和信任度这两个衡量新闻传播效果的关键指标单独进行测量。很多时候这两个指标被合并到一起测量,而本研究的结果显示二者之间的影响机制大相径庭:喜爱度与语速无关,信任度则与语速有关,这两者还都存在较明显的性别差异。这些发现都提示应该把喜爱度和信任度区分对待,尽管在直觉上我们可能认为对某一对象的喜爱度越高就越有可能对它产生信任感,但实际上二者之间有着微妙的差别,受众对喜爱度与信任度评价是相互独立的,不能一概而论。


此外,基于LC4MP理论的研究很少聚焦受众性别,本实验发现就合成语音新闻的感知体验而言,性别差异不但表现在行为评价层面,还表现在不同脑电波的唤起层面。语速和性别的影响在脑电EEG层面是相互独立的。需要指出的是,限于实验法本身的特点,这些发现仅适用于本次实验的材料类型和受众类型,其他场景下的传播和目标受众是否适用,仍然有待更多的研究和实践去检验。


总而言之,以上结果从外显的行为态度到内隐的神经机制层面表明了语速和受众性别对合成语音传播效果的影响。本研究的理论价值在于将国际上获得广泛认可和研究应用,但在国内新闻传播领域很少有人研究的LC4MP理论,应用至中文媒介,进一步拓展至合成语音领域,同时引入受众性别变量,丰富了LC4MP理论框架下语音结构特征之一——语速的研究,展现出了性别变量对脑电结果及行为态度的影响,为日后相关研究提供了更多可待开发的议题线索。值得注意的是,由于不同性别受众对声音的敏感度不同,细分受众群体仍然是有必要且有价值的,未来有关声音的研究,需要将受众性别作为调节变量,以便更好的观察自变量的影响效果。


(致谢:感谢科大讯飞股份有限公司的技术支持与帮助。感谢北师大新闻学院刘彧晗、冯婉茹、林瑾、陈雪娇、余冰玥、邱璐、王俨蓉等硕士对本实验给予的帮助。)


本文系简写版,参考文献从略,原文刊载于《国际新闻界》2021年第2期。

封面图片来自网络

本期执编 / 彤昕


订阅信息


全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!


您也可通过下方二维码或网址https://weidian.com/?userid=1185747182,进入国际新闻界微店,购买当期杂志和过刊。


您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存