专论| 梁嘉莹、刘新中：基于大数据的粤方言阳江话（市区）声调实验研究

梁嘉莹、刘新中语言资源快讯 2020-01-18

基于大数据的粤方言阳江话（市区）声调实验研究

梁嘉莹、刘新中

（暨南大学中文系/暨南大学汉语方言研究中心

广东广州 510632）

［提要］本文录制了《方言调查字表》中的所有有效汉字条目的读音，提取这些音节的音高和时长等相关声学数据，在提取分析所有有效音节的声调声学数据的基础上，运用统计分析的方法，对粤方言阳江话的声调做了全面考察，归纳了以大数据为依托的单字音共时声调音高所反映的声调系统、考查了阳江话各调类时长的情况；本文还在声学数据分析的基础上，用对号入座的方式全面记录了阳江话所有常见单音节声调的古今对应，在此基础上概括了古今阳江话声调的古今演变规律。

［关键词］阳江话声学数据声调调长

一、引言

黄伯荣早在20世纪60年代就发表了《阳江话“入声非声”实验报告》（1960）【1】，讨论阳江话入声是否自成调类；《阳江话声韵调》（1962）对阳江话的声韵调系统作初步的描述【2】。甘于恩《广东两阳粤语语音特点概说》（2008）列举阳江市区话的声韵调，再从两阳方言内部差异出发，借助与周边粤方言（尤其是广州话、四邑话）的对比，初步揭示出两阳粤语的语音特点【3】。冼文婷《阳江话声调实验研究》、《新老派阳江方言单字调实验研究》（2014）运用实验语音学的方法对当代阳江话声调的音高、时长和音强进行研究【4】，把该方言声调的实际情况客观地描写出来【5】。以上研究均在一定程度上揭示了阳江话声调系统的特点，但就声调而言，只是基于对部分典型例字的记录描写，未见到系统的基于大数据的实验研究。本文尝试采用一种相对较新的实验方法来研究阳江话的声调系统，即尝试立足于较大规模的字音声学数据，全面分析阳江话的字音声调系统及其演变规律，进一步客观反映阳江话的声调系统特点。

二、研究方法与实验过程

本文主要采用声学数据分析与方言学、音韵学相结合的方法来研究阳江话的声调系统。

本次实验依据《方言调查字表》，在相对安静的环境中进行语音采集。

发音人的选择，是在初步调查比对的基础上，选择较为理想的一男一女中老年，两位都是土生土长的阳江人。男发音人（M）生于1952年，税务退休，目前在阳东生活，日常交流的语言为阳东话，与阳江城区的方言没有差别；女发音人生于1951年，公务员退休，目前在阳江江城区生活，日常主要的交流语言为阳江话。两位发音人发音稳定清晰，能够代表阳江话的语音面貌。

本次实验的录音材料是《方言调查字表》【6】，男发音人例字共3416个，女发音人例字共3412个。（1）录制《方言调查字表》的汉字条目并提取音高和时长等语音数据，（2）依据汉字的古声调类型（平、上、去、入）和古声母清浊类型（全清、次清、全浊、次浊）作为分类依据，统计各类字的语音数据，（3）在得出的数据结果的基础上分析阳江话声调演变规律和调类体系。

实验过程如下：1、在相对安静的环境中进行录音。2、生成并修改TextGrid数据，对全部的录音材料进行音段切分和标注，如图1所示。3、生成并校验PitchTier数据。对断点、跳点、缺点的音高数据进行修改。4、根据音高数据作均值分析，画出“古调+清浊”音高曲线图，分析声调演变规律。5、通过提取音高数据的脚本，得到各自录音样本的音高数据，进行归一化运算后，得出直观声调调值的结果。

［基金项目］（1）粤方言语音特征的实验语音学研究，2014年度国家社科基金一般项目（编号14BYY038）；（2）广东粤方言的实验语音学研究，广东高校人文社科重点研究基地2012年度重大项目（编号2012JDXM_0007）；（3）汉语方言学大型辞书编纂理论研究与数字化建设，2013年度国家社科基金重大项目（编号13ZD135）。（4）中国语言资源保护工程濒危汉语方言调查·海南东方付马话项目（编号YB1618A009）。

黄伯荣：阳江话“入声非声”实验报告[J].甘肃师范大学学报，1960，123-128

黄伯荣：阳江音系[J].亚非语言计算研究，1986，26

甘于恩：广东两阳粤语语音特点概说[J].桂林师范高等专科学校学报，2008，22（2）：3-5

冼文婷唐七元：阳江话声调实验研究[J].柳州师专学报，2014，29（5）：37-39

冼文婷唐七元：新老派阳江方言单字调实验研究[C].第十一届中国语音学学术会议(PCC2014)论文集，2014，193-194

中国社会科学院语言研究所：《方言调查字表》[M].北京：商务印书馆2012年版。

图1：语音材料标注样例

图2：音高曲线的校对

三、阳江话单字调音高

所反映的共时声调系统

在方言声调中，单字调系统是声调原生系统历史发展的积淀，是动态演变的结果。在声学实验仪器以及统计学、数学公式的帮助下，我们可以比较客观地了解声调的声学特性，以确定声调格局。

将每个音节的基频曲线等间隔地分为9段，即提取10个测量点的基频数据，再使用石锋先生编写的公式T=(lgx-lgmin)/(lgmax-lgmin)×5，把基频数据转换成相对应的T值（对数值）。

根据所得的全部音节的语音数据，以绝对时长(毫秒)为横坐标，T值为纵坐标，可得出发音人阳江话绝对时长的声调曲线图：

图3：阳江话声调音高曲线图（M）

图4：阳江话声调音高曲线图（F）

由上述结果可知，与大部分粤方言“阴高阳低”声调格局不同，阳江话声调呈现的是“阴低阳高”。而且，调类之间具明显的对应关系：上声对下阴入，阴去对上阴入，阳去对阳入。

根据实验所得，将本次结果与前人的研究结果加以简单比较：

由上表可知，基于声学数据得出的阳江话声调结果与前人的研究结果基本一致。有所不同的是，前人把阳去和阳入记作54，而根据本次实验所得的结果，阳去和阳入是曲折调454，这说明，传统的田野调查中，根据听感所得的结果大致能反映该方言的语音面貌，但基于声学数据得出的声调结果，更能反映其实际的声学表现。根据声调音高曲线图，还可以进一步将阳江话各个声调的语音特性概括如下：阴平为中平调，阳平表现为高降（降幅较大），上声表现为低平（略有降势），阴去表现为升调（升幅较大），阳去为高平（略有降势），上阴入表现为升调（升幅较大），下阴入表现为低平（略有降势），阳入表现为高平调（略有降势）。

詹伯慧：《广东粤方言概要》[M].广东：暨南大学出版社2004年版，209-210

甘于恩：汉语南方方言谈论[M].广州：世界图书出版广东有限公司，2014，193-194

四、实验数据分析

（一）阳江话中古调类的演变和对应

汉语方言的声调主要与古声调类型、古声母的清浊类型等因素有关。以汉字的古声调类型和声母的清浊类型为分类的依据，分析各类例字的实际音高曲线，并在此基础上探讨古声调在阳江话中的分化和合并情况。

基于两位发音人的录音材料，根据古声调类型和声母的清浊类型对录音字表中所有的整体音节进行分类，每一类所包含的例字数目如下表所示：（注：表格中的“未知”是指无法确定其中古地位的字，包括有音无字的例字、方言俗字等。

下面按古调类型和古声清浊类型作为分类依据，分别统计两名发音人的音高和时长的均值数据，并自动生成音高曲线图【1】。这一过程由Praat脚本程序实现，运行结束后直接输出音高曲线图，借助归一化的时间点信息，即不论基频短长短，都等间隔提取出10个点的基频值，以计算音高均值。如下图所示，其横轴表示音高时长（单位：ms），纵轴表示音高均值（单位：hz）。

【1】本文所有数据的提取分析都使用中国社会科学院语言研究所熊子瑜先生编写的程序脚本。

图5：古平声字的音高曲线图（M）

图6：古平声字的音高曲线图（F）

根据上图音高曲线的走势，可以得出：

（1）阳江话古平声字表现为两种调形，全清和次清呈中平调形，全浊和次浊呈下降调形；

图7：古上声字的音高曲线图（M）

图8：古上声字的音高曲线图（F）

（2）古上声字表现为中降、高降调形；

图9：古去声字的音高曲线图（M）

图10：古去声字的音高曲线图（F）

（3）古去声字表现为两种调形，全清和次清呈上升调形，全浊和次浊呈下降调形；

图11：古入声字的音高曲线图（M）

图12：古入声字的音高曲线图（F）

（4）古入声字在阳江话中表现为两种调形，其中，全清和次清呈平调形，全浊和次浊呈下降调形，且与全浊去、次浊去走势大体一致。

（5）时长方面，由上面各图可知，两位发音人非入声的时长大约是300-400ms，入声的时长约为200-300ms。

接下来按下列八条规则为所有汉字指派初始化调类：

1、古全清和次清的平声字标记为阴平1a。

2、古全浊和次浊的平声字标记为阳平1b。

3、古全清、次清和次浊上声字标记为阴上2a。

4、古全浊上声字标记为阳上2b。

5、古全清和次清的去声字标记为阴去3a。

6、古全浊和次浊的去声字标记为阳去3b。

7、古全清、次清的入声字标记为阴入4a。

8、古全浊和次浊的入声字标记为阳入4b。

下面以两位发音人的字音数据分析推导调类和感知调类之间的对应关系，以简要考察上述规则的适用性

根据表4和表5的交叉列表数据可以看出，推导调类与感知调类之间大多具有较高的一致性。例如表4中，推导调类标记为阴平1a的汉字一共有691个，其中共有609个属于阴平字，这表明阴平1a与阴平调之间具有较高的关联性，二者的一致率达88%。一致率越高，则表明推导调类越可靠，内部的一致性就越强。而在两个表格中，关联性最低的是阳去和阳去3b这一组，一致率分别只有71%和67%。其次，在表5中，关联性较低的是上声与阴上2a，上声（感知类）主要对应于阴上2a的调型，但其中有90个字被判别成了阳平1b调型，有28个字被推导成阳上2b调型，28个被推导为阴去3a调型，根据上文的第2条规则“古全浊和次浊的平声字标记为阳平1b”，而在表5中实际上有90个古浊、次浊的平声字被感知为上声，说明了今读的上声不仅来源于古上声字，还有相当一部分来自于古全浊、次浊平声。根据测算，表4中的推导调类与感知调类之间的综合一致率为79%，表5中的推导调类与感知调类之间的综合一致率为77%，据此可以认为绝大部分汉字符合前文所述的八条调类推导规则，但当中存在相当一部分汉字的古音演变规律发生分化。例如，根据表4和表5的交叉列表数据还可以看出，有一些类型的汉字明显例外于上述推导规则，其中问题最为突出的就是下阴入与阴入4a这一类，按照上文的第7规则“古全清、次清的入声字”均标记为“阴入4a”，但实际中，阳江话分上、下阴入。从表4可知，128个被标记为阴入4a的汉字被感知标记为下阴入，在表5中，则有135个被标记为阴入4a的汉字被感知标记为下阴入，这表明在阳江话中，古全清和次清的入声字发生了分化，今读上阴入、下阴入。

下面，就上述结果找出阳江话中不符合古音演变规律的例字，以考察其分化的具体情况。其中古全清和次清入声的分化问题最为突出，下表根据上述结果整理出阳江话古上、下阴入的具体分化情况：

从上表可知，阳江话的上阴入主要来源于古全清、次清入声的臻、曾、梗、通摄；下阴入则来源于古全清、次清入声的咸、山、宕摄。

此外，被标记为“阳上2b”的字绝大部分今读为阳去，也就是说，阳江话中，古全浊上中的相当一部分字今读为阳去；同时，全浊上中也有一部分字今读为阴上，说明阳江话的古全浊上声分化的情况为：古全浊上→阳去、阴上。

而根据实验结果所得的其余不符合古音演变规律的例字，分别存在以下情况：（1）多音字，发音人在录音时读的是其中一个音；（2）推导判断有误；（3）罕用字，发音人容易误读；（4）文白异读；（5）具有标记的作用。

（二）声调判别分析与讨论

为了验证调类听辨的结果是否正确，接下来将根据每个音节的实际听感标注来建立声调判别模型。然后在这个基础上，细致对比声调实际标注（感知类）结果和声调判别结果，以考察两者的一致性。如果一致性越高，说明声调的听辨结果越可靠，越符合语音实际，同时也能说明声调判别模型越有效【1】。

（【1】林佳颖熊子瑜：基于音高数据的天津塘沽话声调系统分析[C].第10届中国语音学学术会议论文集（PCC2012）。）

在建立判别模型时，考虑了与声学数据相关的因素，包括音高起点值、末点值、音高平均值、音高标准差、音高最大值、最小值及音域范围等，并借助脚本对阳江话所有整体音节的声调推导调类进行自动的判别分析。表6-表7分别给出了两名发音人判别结果实际标注（感知类）结果的交叉列表数据：

根据上述交叉列表数据可以看出，判别调类与感知调类之间大多具有较高的一致率。例如表6中，阴平（感知类）主要对应于阴平1a的调型，有689个例字判别一致，这表明阴平1a与阴平调之间具有较高的关联性，二者的一致率高达99%。一致率越高，则表明该调类内部的一致性就越强。在表格中，两位发音人关联性最低的是下阴入这一组，例如表6，被感知为下阴入的，相当一部分字被被判别为阴上2a，究其原因有：1、阳江话下阴入和上声音高非常接近；2、阴入4a的初始化模型不理想，详见表4-5的相关数据。由于古全清和次清的入声字在阳江话中分化为上、下阴入这两种类型，而基于古调类型和古声清浊的组合方式来推导初始化调类时却只能指派成一种调类，因而导致阴入4a的训练样本过于离散，声调模型的精度不高，最后的判别结果自然也就发生了偏差。这说明，仅根据古调类型和古声清浊的组合方式来推导初始化调类难以解决古今字调之间一对多的分化问题。

五、阳江话声调的时长

通常我们根据声调音高曲线图，就可以基本确定一个方言的声调系统，但是随着调查的不断深入，研究工具的改善提高，我们看到，声调中的时长、嗓音情况都对声调产生不同的影响。以大多数粤语而言，舒声、促声往往会是同一个音高范围，它们的区别就在于时长以及嗓音以及其他因素。我们在前人卓有成效研究的基础上，扩大并验证了所有音节的音高，同时加入了所有音节的时长，这样我们就可以对阳江话（城区）的声调有了较为全面的认识。

从阳江话的情况来看，（1）所有的舒声时长都长于促声的时长，（2）音高的中、高调的时长比低调的时长要长，（3）舒声中的升调时长比降调的时长要长，（4）同调型的舒声时长明显长于促声。以图13为例，阴去与上阴入同调型，但是阴去310毫秒，上阴入147毫秒，促声差不多是舒声的一半；舒声阳去与促声阳入的情况类似。具体情况见图13-图14。（单位：毫秒）

图13：阳江话声调时长图（M）

图14：阳江话声调时长图（F）

六、结论

通过所有有效音节的声学数据，我们可以得出阳江话“古声+清浊”的音高曲线图，以考察其声调演变规律，并能找出所有不符合声调演变规律的例字，探讨古声调在阳江话中的分化和合并情况。

通常我们看到的很多的方言音系归纳，是利用若干典型例字能够得出一个方言的声调系统的特点。本文采用了一种相对较新的、立足于较大规模的字音声学数据的方法，较全面分析出阳江话的字音声调系统及其演变规律。在此基础上我们还加入了时长因素，这样就可以有效区别音高变化与时长的影响和作用。

我们将实验得出的阳江话音高调值总结如下：阴平33，阳平41，上声31，阴去25，阳去454，上阴入25，下阴入31，阳入454。

阳江话各个声调的语音特性概括如下：阴平为中平长调，阳平表现为高降长调（降幅较大），上声表现为中降长调，阴去表现为升调长调（升幅较大），阳去为高域长调，上阴入表现为上升急促调（升幅较大），下阴入表现为中降促调（略有降势），阳入表现为高急促调（略有降势）。

音节时长情况如下：（1）所有的舒声时长都长于促声的时长；（2）音高的中、高调的时长比低调的时长要长；（3）舒声中的升调时长比降调的时长要长；（4）同调型的舒声时长明显长于促声。

本文在实验的基础上得出上述结果，但该研究还有很多地方需要补足的地方，例如感知听辨实验；发音人年龄层的对比等等。

参考文献：

[1]甘于恩：汉语南方方言谈论[M]，广州：世界图书出版广东有限公司，2014

[2]黄伯荣：阳江话“入声非声”实验报告[J]，甘肃师范大学学报，1960

[3]黄伯荣：阳江音系[J]，亚非语言计算研究，1986（26）

[4]林佳颖熊子瑜：基于音高数据的天津塘沽话声调系统分析[C]，第10届中国语音学学术会议论文集（PCC2012）

[5]刘新中：《广州话单音节语图册》[M]，广东：世界图书出版广东有限公司2014年版

[6]冼文婷唐七元：阳江话声调实验研究[J]，柳州师专学报，2014

[7]冼文婷唐七元：新老派阳江方言单字调实验研究[C]，第十一届中国语音学学术会议(PCC2014)论文集，2014

[8]詹伯慧：《广东粤方言概要》[M]，广东：暨南大学出版社2004年版

[9]中国社会科学院语言研究所：《方言调查字表》[M]，北京：商务印书馆2012年版

（原载《南方语言学》11辑，2017）

编辑：半生少年

主编：老甘

投稿邮箱：jnufyzx@163.com

苹果用户专用打赏

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…