查看原文
其他

学术探论 | 董理、林扬:昆曲小花旦情感念白声学特征分析

甘于恩 语言资源快讯
2024-09-12


由于微信公众平台推出新功能,“语言资源快讯”左边显示的名称并非原作者,而是公众号管理者,原作者将于大标题和文末显示,感谢各位读者的谅解!



视频来源:腾讯视频

0  引言


语言中不仅包含语义信息,还包含性别、年龄、情感、态度等信息。语音的情感表达和感知会受到性别、年龄及个体特征的影响。相比于日常口语,戏剧中语音的有效情感特征被放大化,使得情感表现更加鲜明,更容易得到较为统一的感知。因此,从戏剧入手研究语音的情感特征,更易得到较为鲜明的结论。

昆曲念白是诠释角色特征与感情色彩的重要语言手段,情感表现既有角色程式又有个人特征。小花旦是昆曲女性行当中的一类,多饰演年轻活泼但地位比较卑微的女子,其语音特征[1-2]和情感表现策略与其他女性角色不同。

自1935年Skinner[3]使用实验手段对情感语音的声学特征进行研究后,基频、声强、时长和嗓音音质等声学线索被发现与语音的情感表达有关[4-6]。一方面,各参数的平均情况在情感间会表现出明显的差异,愤怒和高兴均表现为基频均值、变化范围较高、音强较强,而悲伤则表现为基频均值和变化范围较小,音强较弱[7,8]。另一方面,声学参数随时间的变化曲线也负载了一定的情感信息,如愤怒与高兴相比,基频曲线在句末的下倾更为剧烈[9]。此外,实际语言中的情感更为复杂,具备不同性别、年龄、身份等特征的人在情感表达上会存在一定的程度差异,也提示我们在分析情感时综合考虑各种变量。

汉语是声调语言,字调与语调共同影响着句子的基频特征。因此,仅依赖基频来分析汉语的语音情感存在一定的局限[10],需要同时考虑多个维度的声学特征[11,12]。据此,本文将从音高和音强两个维度探讨昆曲小花旦念白语音的情感特征。

本文将从以下角度入手,对昆曲小花旦愤怒、高兴、中性和悲伤念白进行研究:(1)昆曲小花旦各情感念白的声学特征如何;(2)凭借音高和声压参数是否足以将四种情感念白有效区分;(3)两两情感间的差异程度是否相似;(4)各类型参数在区分情感时效度是否相同;(5)参数间是否存在共变特征及其对区分情感的贡献。



1  方法



1.1实验材料


录音材料由演员根据情感要求自行选择,出自以下剧目:《牡丹亭》、《西厢记》、《孽海记》、《钗钏记》、《浣纱记》和《小放牛》等。愤怒、高兴、中性和悲伤每种情感各选了四个段落,每个演员16段。两位演员选择的段落大部分相同。录音结束后,将念白段落按句切分,由九名普通听众(8女1男)听录音判断念白情感。五名以上听众认定为某种情感的句子被认定为具有该情感特征的念白。各演员、情感最终筛选出的句子数量不同,最少的22句,最多的50句。选出的句子经过了演员和半数以上听众的双重认定,情感特征鲜明。



1.2发音人和数据采集


研究选用了两名国家级专业女演员,均来自江苏省演艺集团。录音时年龄在分别为40岁和39岁,专业从业生涯均为32年。录音时,要求她们按照台上表演的方式念白。

录音在安静的起居室完成。语音信号由索尼电容式传声器采录,录音时传声器挂在演员的胸前,距离唇部15厘米。采样频率为40kHz,分辨率16比特。每段录音后都包含了一段用于校准的1000Hz的声音,以及该声音在相同距离下用TES-52型声级计测量出的声压数值。



1.3数据处理


使用了两种语音分析软件提取参数。一种是WaveSurfer,用于提取基频和能量参数,0.01s为一帧;另一种是SoundswellCore Signal Workstation 4.0,用于计算等效声级。

基频被转换为与感知匹配的半音形式,公式如下[1]:                                   Pi=39.86×lg(F0i/F0ref),i=1, 2, 3, …, n           (1)

其中,Pi为i帧的音高,n为帧数,F0i为i帧的基频测量值,F0ref为基频参考值,本文设为55Hz,220Hz对应24半音。软件提取的声功率被校准为绝对声压级(单位dB),公式如下:

   SPLi= Poweri+△SPL,i=1, 2, 3, …, n              (2)

其中SPLi为i帧的绝对声压,Poweri为i帧的声功率测量值,△SPL为校准音的声功率测量值与声压计的实测声压的差值。

参数的统计特征由Python软件计算得出。分析时,首先以句为单位,计算音高或声压的均值、标准差和斜率,以这些参数作为各句的代表特征。其中斜率为以音高或声压为因变量、时间(以s为单位)为自变量进行线性拟合得出的斜率。

两位演员的音高均值和声压均值存在较大差异,中性的平均值分别为39.3半音、36半音和95.6分贝、80.4分贝。为了减少不同演员间数据的离散度,将两位演员各句的音高(声压)均值均下调(上调)中性均值差异的一半,即1.65半音和7.6分贝,随后将两位演员念白的各统计特征按情感合并,作为该情感的分析样本,进行样本间的差异检验和相关分析。



2  结果


2.1声学参数统计特征


为了反映出各情感念白句子层面的声学参数统计特征的差异,计算了各统计特征的均值和百分位点,以反映句子的平均情况和句间变异幅度,结果见图1。


图1 各情感念白音高、声压的句统计特征分布情况(箱线图中“+”表示均值,箱上下边界表示75%和25%位点,线的上下端表示90%和10%位点)

正态性检验结果显示,一半以上数据不符合正态分布,为了比较各情感相应参数的差异是否显著,对各参数集合进行了曼惠特尼U检验,结果见表1。当p<0.05时,两组数据具有显著差异,下文提及的“显著”均以此检验结果为依据。


表1 情感间各参数曼惠特尼U检验渐近显著性(双侧)



综合图1和表1的结果可以发现,小花旦各参数在情感间的表现不同。句音高均值将情感分为两组,中性和悲伤一组,高兴和愤怒一组,组间差异显著,组内差异不显著,前一组比后一组低1.7个半音,变异程度上,中性四分位距最小、数据最集中,悲伤和愤怒则较大、数据较分散。句音高标准差整体上中性、愤怒>高兴>悲伤,其中除愤怒和中性外差异均显著(符号含义下同);变异程度上,愤怒的四分位距明显大于其他情感。高兴的句音高斜率绝对值显著大于中性和悲伤;愤怒的句音高斜率均值和四分位距与其他情感的差异很大,但组间差异不显著。句声压均值整体上高兴>中性、愤怒>悲伤,悲伤与中性/愤怒的差异(7dB)大于高兴与中性/愤怒的差异(4dB),四分位距从大到小依次为愤怒、悲伤、高兴、中性。句声压标准差中性、愤怒、高兴>悲伤,愤怒、高兴和悲伤的四分位距明显大于中性。愤怒句声压斜率显著大于中性和悲伤,其他情感间差异均不显著;愤怒的四分位距明显大于其他情感。

各参数区分情感的效度不同,音高标准差和声压均值可以区分的情感数量最多,其次是音高均值和声压标准差,最少的是音高斜率和声压斜率。情感间都可以通过部分参数加以区分,但存在显著差异的参数个数不同,结果见表2。其中,悲伤与愤怒、高兴存在显著差异的个数最多,愤怒与中性、高兴的最少。从表2中显著差异参数特点描述可以发现,从声学参数均值和变化率(绝对值)来看,悲伤<中性<愤怒<高兴,从声学参数标准差来看,悲伤<高兴<中性<愤怒。


表2 情感间差异汇总





2.2参数相关性分析


音高和声压参数可能存在一定的相关关系,为了验证其相关程度,以句为单位对各情感的多参数间进行了Spearman线性相关分析,所有呈现显著相关的相关系数见表3。

表3各情感参数间Spearman相关系数。(仅标出p<0.05的相关系数。各子表格的右上部数据为某一情感对应分析结果,左下部数据为另一情感对应分析结果。)

从表3可以发现,不同情感参数间的关系不同。以中性情感为参照:1)当念白带有其他任意情感时,原存在的音高均值与音高标准差、声压斜率与音高标准差之间的显著负相关以及音高斜率与声压斜率之间的显著正相关都表现为不显著;2)当念白带有悲伤、愤怒等消极情感时,音高均值和声压均值间的相关系数明显大于中性,音高均值与声压斜率、声压均值与声压斜率之间呈现显著负相关,声压均值与声压标准差之间呈现显著正相关,以上显著相关悲伤的相关系数均大于愤怒;3)当念白带有高兴情感时,音高均值与声压均值的相关系数明显小于中性,音高均值与音高斜率、声压均值与音高斜率、音高标准差与声压标准差之间呈现显著正相关。从显著相关的数量来看,悲伤和愤怒呈显著线性相关的参数对最多,高兴和中性略少,愤怒和悲伤同时表现出显著相关的参数对数量明显多于其他情感间。从参数上看,音高均值与其他参数显著相关的数量最多,其次是声压标准差,音高标准差与其他参数显著相关的数量最少;参数间大部分表现为正相关,小部分表现为负相关,情感间线性相关的方向相同;音高均值和声压均值、声压标准差在各情感中都显著正相关,相关系数的最小值都出现在高兴情感中。

对比表1和表3的结果可以发现,当某些参数在情感间未表现出显著差异时,参数间的线性相关显著性在情感间不同。以悲伤和中性为例,音高均值和声压斜率均未表现出显著差异,中性念白中音高均值与声压斜率不显著相关,而悲伤念白中二者呈显著正相关,表明悲伤情感中两参数具有规律的共变特征,而在中性中二者的配合关系则规律性较弱。表1中差异参数较少的愤怒和中性情感、愤怒和高兴情感,其不具备显著差异的参数中,有三组参数是否显著相关在情感间的是不同的,即使参数都相关,其相关程度也不同。因此,参数间的线性关系是区分语音情感的一项重要补充。



2.3多元回归分析


情感间参数表现出统计学差异,但从图1中可以发现,数据的分布存在较大范围的交叉区域,大部分情况下不能依靠单一标准将念白归入某一情感类别,表3中的相关系数也并非离散指标。为了探索各参数与情感的定量关系,基于图1结果将愤怒、高兴、中性和悲伤分别赋值为4、3、2、1和3、4、2、1,采用进入法对数据进行了多元回归分析,结果发现,两种情况下声压标准差均被剔除(p<0.05),且在其他五个变量都进入模型时,R值达到最大,分别为0.639和0.578,回归方程均显著(p<0.05)。前一种赋值R值更大,其对应的回归方程为:

E=-8.474+0.033×SPLM +0.338×PSD +0.176×PM+0.013×SPLS -0.005×PS     (3)

其中E为情感,4、3、2、1分别代表典型的愤怒、高兴、中性和悲伤,SPLM为句声压均值,PSD为句音高标准差,PM为句音高均值,SPLS为句声压斜率,PS为句音高斜率。



3  讨论


从图1可以发现,差异不仅体现在各参数的均值上,还体现在其四分位距等特征上,如两名演员愤怒情感对应的音高斜率和声压斜率,其四分位距都明显大于其他情感。四分位距的大小体现了数据内部一致性的程度,四分位距大,则数据内部一致性弱。仍以愤怒念白的音高、声压斜率为例,斜率值有正有负,即音高和声压可能在句中整体升高,也可能整体下降,且二者的差异比较明显。斜率与文本有一定关系,如在短句子中音高斜率大部分为负值,在长句子中则出现了较多正值。长句子中音高斜率为正时,整句并非音高持续上升,如图2所示,句子中有比较明显的停顿和音高变化,将全句分成了三个部分,每一部分中音高斜率均为负,而三部分的平均音高则是不断上升的,导致了整句斜率为正。而对于比较短的句子,则只体现为音高的下降,斜率为负。这暗示着句子长度对情感的感知和表达是有影响的,一方面,局部特征(如音高下倾)就可能引发情感信息的感知,另一方面,长句中各部分的配合关系也可能影响情感的感知。这些假设还需要进一步的实验验证。从图2还可以发现,线性拟合结果同时受到声调和语调的影响,因此r值较小。前人研究表明,情感语调的调阶与中性语调有较大差异[13,14]。相比于自然语言,昆曲的字调不仅受到字本身调类的影响,还受到艺术语音的影响,因此很难用研究语言的五度标调法反映出移调变化。使用文中的音高斜率,虽然不能排除声调的影响,但可以在一定程度上反映出移调的趋势,也是对情感语调研究方法的一种探索,多元回归分析也验证了该参数的有效性。


图2 愤怒情感下音高斜率为正的句子的音高曲线


小花旦情感念白的声学特征与自然语言有共性,也有差异。前人的多语言情感语音研究发现:愤怒一般具有较高的基频均值、基频方差和平均能量,并有下倾的基频轮廓;悲伤一般具有较低的基频均值、基频范围和平均能量以及下倾的基频轮廓;高兴通常具有较高的基频均值、基频范围、基频方差和平均能量[15,16]。其中悲伤与各情感的区分度较高,而愤怒和高兴的区分度较低,甚至不能区分[17,18]。小花旦念白的声学特征与自然语言存在部分差异。首先,念白中愤怒和高兴能够有效区分,一方面音高标准差和声压均值都具有显著差异(p<0.01),另一方面,参数的相关性在情感间差异较大,但这两种情感相比于其他情感的区分度仍较小。其次,中性和愤怒的区分度较小,与自然语言的差异较大。这可能由昆曲念白字音的特征决定,以音高为例,念白中多数字读为降调,如“春香”二字,在普通话中均为平调,但昆曲念白时,都用降调来读出,字的声调可能体现在字的平均音高上。因此,在进行数据分析时,使得主要表现为参数下降的愤怒念白与中性念白差异很小。从听辩实验结果来看,中性念白中几乎没有被判别为愤怒情感的,暗示着在听感上二者的差异是比较大的。本研究未考虑句以下单位参数变化的速率,未来可以从此方向出发研究中性念白与愤怒念白的具体差异。

前人研究表明,时长对情感的表达是有贡献的[5,12,16,19]。本文没有采用时长参数是源于昆曲念白的特殊性及当前语料数量有限。在昆曲念白中,有时会将句中的一个或几个字拖长,很大程度上影响了时长的分析结果。拖长字音可以达到特殊的艺术效果,在各种情感念白中均有体现,与表现情感的关系尚不明确。当前语料数量较少,不足以按照句子长短、拖音出现的位置、停顿的位置等因素对句子进行分类,进而排除其他因素干扰、单独考察情感对语音的影响。未来可以搜集新的语料来验证昆曲念白中情感与时长的关系。


4  结论


本文分析了昆曲小花旦演员四种情感念白的音高和声压,发现各情感念白的声学参数表现出不同的统计特征,且其与自然语言中相同情感的声学表现有所不同,各声学参数统计特征在区分情感时效度不同。研究一方面呈现了戏曲中年轻活泼、地位较低女性的语音情感表现程式,一方面在昆曲等戏曲语音研究方法上进行了探索。主要得出以下结论:

(1)以中性念白各项参数为参照,悲伤念白所有参数均小于中性及其他情感念白;愤怒念白所有参数均大于中性念白,其音高、声压的均值和变化率(绝对值)小于高兴念白,参数四分位距则大于后者;高兴念白参数的均值和标准差整体大于其他情感念白,标准差介于悲伤和中性念白之间。

(2)情感间都可以通过部分参数加以区分,悲伤情感与愤怒、高兴存在显著差异的个数最多,愤怒与中性、高兴的最少。

(3)在区分情感的效度上,各参数的表现不同,音高标准差和声压均值可以区分的情感数量最多,音高和声压斜率区分效度最低。

(4)参数相关性方面,不同情感参数间的关系不同,参数间的线性关系是区分语音情感的一项重要补充;悲伤和愤怒显著线性相关的数量最多、共性较多,二者有别于高兴;音高均值和声压均值、声压标准差在各情感中都显著正相关,相关系数的最小值出现在高兴情感中。

(5)可以通过多元回归方程来计算念白情感类型,音高均值、声压均值、音高标准差、音高斜率和声压斜率均进入方程。

参考文献(略)



(董理、林扬,任教于深圳大学,原载《南方语言学》17辑,世界图书出版有限公司,2021)

往期推荐

学术探论 | 甘于恩:广东四邑方言形容词重叠式的综合研究

学术探论| 张屏生:高屏地区客家话次方言的词汇差异

学术探论 | 李菲:大埔光德(九社)方言音系——客家方言包围下闽南方言代际语音特点变异研究


本期编辑|刘益嘉

本期审读|刘益嘉

责任编辑|甘于恩


投稿邮箱:jnufyzx@163.com


做语言资源保护公众号不容易,每天更新公众号更不容易,而每天提供新语料尤其不容易。很多读者还没有养成打赏的习惯,提倡每个月打赏一元钱,积少成多,我们的事业就有希望,谢谢各位!




继续滑动看下一个
语言资源快讯
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存