查看原文
其他

学术探论 | 秦绿叶:语言保护工程多媒体录制方案研究

甘于恩 语言资源快讯 2022-12-22

由于微信公众号平台推出新功能,“语言资源快讯”左边显示的名称并非原作者,而是公众号管理者,原作者将于大标题和文末显示,感谢各位!


一、引言

包含汉语方言调查、濒危方言调查以及少数民族调查等内容的中国语言资源保护工程(下文简称“语保工程”)自启动以来,逐步在全国各地推进,记录了许多宝贵的语言资料。


广东语保工程之汉语方言调查项目在2016年开展了近20个点的调查,调查点涵盖粤、客、闽三大方言。项目以纸笔调查和多媒体摄录两种形式采集语料,最终成果为纸质版和电子版:纸质版为纸笔调查材料;电子版包括与纸质材料一致的电子文档、视频和音频材料,便于交流传播及后期数字化处理。方言类语言保护工程的工作标准——《中国语言资源调查手册·汉语方言》(2015[1](俗称绿皮书,下文简称为调查手册)上介绍了音视频材料制作的流程和处理方式、规格参数;还介绍了音视频录制和编辑的相关软件。语保工程专题网站——语宝网提供了校验软件,以供检查音视频材料的规格参数。下面以调查手册为依据,结合实际调查情况和当前方言研究中的计算机处理技术[2-3],分析语保工程多媒体语料摄录要点,探索最佳的工作技术路线。


二、录制团队

调查手册提供了两类多媒体录制方案(20158),一是由调查团队自行负责录音、摄像工作,二是由专门的摄录团队负责录音、摄像等工作。浙江、广东等省语保工程课题团队采用了第一类摄录方案,即由课题调查团队邀请或聘请专业人士负责摄录工作,课题负责人全程参与,以确保摄录材料准确性。从目前情况来看,广东汉语方言课题团队中负责多媒体录制的人员可以分成三类,一是有摄录经验的课题负责人(如梅州、南澳、高州)或研究生(如台山、佛冈);二是从事教育技术(如佛山)、影视传媒专业(如阳江)的学生或教师;三是地方电视台、电台技术人员(如中山)、影视公司技术人员(如从化)等。


一般情况下,语保工程调查需先进行纸笔调查再摄录多媒体语料。课题负责人的调查经验、理论基础以及对调查点语言的了解程度决定着纸笔调查的进展,环境和录制器材则影响着多媒体语料录制时间。若进展顺利,不包括重录和补录,一个课题团队大约需要15~20天才能基本完成单个语言点的调查工作,其中多媒体录制时间约占总调查时长的50%60%。为了保证所录制多媒体材料的质量,在调查团队可分为摄录和同步校验两个小组,分组方案与团队的设备和人员密切相关。调查团队通常有2~5名成员,3人或3人以下的团队,可由2人进行摄录操作,1人进行录音和视频的同步校验。4~5人以上的可分1人进行同步校验,其余人员分为为两组轮换摄录。同步校验和录制最好不要在同一个房间,因为摄录现场不需要太多的人,以免产生过多环境噪音,影响多媒体质量。


三、摄录要求

摄录器材与多媒体质量密切相关,因此多媒体摄录要从器材、软件和操作流程把关,才能够保证录音和视频的质量要求。调查手册(201512)对语保工程录音质量和视频质量有明确规定,如下表所示:

1 音视格式参数表


格式

参数

时长

录音

Windows PCM *.wav

前景:-18 dB ~ -6 dB

背景:小于-48

前后要1秒钟左右的留白

视频

*.m2ts/ *.mpg

1920×1080/50i

前后要2~3秒钟左右的留白

录音文件涉及文件类型、声量和背景噪音(也称为白噪音)三方面的要求:录音文件一律采用 Windows PCM*.wav)格式;背景噪音:不能大于“-48dB”,最好控制在“-60dB”以下;语音音量:最大值应达到“-18dB”以上,最好不要超过“-6dB”。录音文件的有效语音部分和背景噪音部分有具体的数值要求,而且差值越大越好。例如背景噪音为-58dB、音量为-10dB的录音材料比背景噪音为-50dB、音量为-17dB的材料好。调查手册(201515)对发音的时长也有要求:1秒钟后开始发音,发音结束1秒钟后进入下一条或停止录音。也就是说录音材料前后要1秒钟左右的留白,因此单字一般应该在2秒钟以上,一般是3秒钟,双字录音在4秒钟左右,以此类推。值得注意的是,单字调的语图和长篇语料大概要有80%左右的语音音量达到-6dB-18dB这个区域,如果只有50%语音音量达标是不符合要求的。


调查手册(201516-17)对视频文件主要从质量和画面进行规定:视频文件一律选择摄像机的最高画质,采用全高清模式拍摄,视频文件参数不低于 1920×1080/50i;文件格式视摄像机而定,例如*.m2ts *.mpg;话筒放在发音人前方的适当位置或夹在领口;发音人的背景应整齐干净平整,最好使用纯蓝色背景;摄像场所光线应充足,发音人的脸部应正对镜头,不要背光。结合实际视频文件的录制,我们在摄录时应当注意以下四点:


其一,背景环境。除了背景和发音人、话筒以外,不能出现其它物品。在摄录时,一旦视频录入了背景以外的物品,例如椅子扶手或者椅子背,这就不符合环境要求。而且为了后期处理的需要,纯蓝色的背景不能有阴影,也不能有褶皱。


其二,现场光线。在发音人的脸部是亮光而不是背光,而且不能反光发白,应该和自然光色下的色彩相近。在室内应该有底灯、顶灯和左右两边的侧灯,才能达能光线均匀的效果。


其三,人物前像。发音人所坐的位置端正,直视镜头,左右空白位置匀称。发音人不能坐得太左,或者是太右,也不能过高或者过低,约屏幕高度2/3处。语保工程的摄录主要是保存语音文档,对于发音人面部表情没有太多的要求。眨眼和咂嘴等行为和动作只要不发生在发音过程中,不影响视频质量就可以了。


其四,底噪杂音。调查手册对视频文件里的录音没有非常具体的要求,可参照录音文件的要求,背景音除了白噪音以外,没有诸如关门声、车鸣、鸟叫、他人说话等明显的外部杂音,就达到了录制的要求。


  四、摄录设备

“工欲善其事,必先利其器”,摄录设备是多媒体语料录制的核心。因为编辑软件的选择和音频、视频的文件类型有关,而录音和视频文件类型又受录制设备影响。调查团队录制的设备主要包括背景布、灯光、计算机、声卡话筒和摄像设备等;录制背景可以参考拍摄证件照的纯蓝色的背景;灯光可以用自然光或者是灯箱;背景布和灯光可以参照证件照的拍摄进行布置,不再详述。下面从主要的录制设备——计算机、声卡话筒和摄像设备进行分析。


(一)计算机

计算机是整个录制工作的核心。计算机选择决定了摄录方法和编辑软件。如果课题团队采用的计算机内存和硬盘的质量配置较高,就可以使用语保摄录一体软件进行单字词的摄录,因为语保摄录一体软件对计算机要求配置比较高。如果课题采用计算机软件配置比较低,则最好采用摄录机摄录。调查所用计算机运行一般采用Windows系统的机型,因为语保摄录一体等软件只在Windows环境下工作。也有个别调查团队采用苹果机MAC系统搭配Praat软件进行录制,但是摄录的效率就会大受影响。下面以摄录一体软件为例,详述语宝摄录一体软件的要求。


计算机是一个整体,各个组件配置需要合理搭配,否则会产生不兼容现象。一般采用商家的原装配置,如果需要提高一个组件的性能,其它组件的性能也需要相应地提高。计算机有适合不同用户的需求类型,比如商务、游戏以及学生机。计算机挑选关键是看性能,比较切合语保工程要求的是游戏类型的计算机。调查手册对计算机的要求为CPUi5以上,内存4G以上。对近期计算机配置而言,这是最基本的。计算机内存对于软件的运行速度有非常大大影响,而计算机硬盘最好选用读取和写入速度最快的固态硬盘,或者是有固态硬盘为系统盘,以传统硬盘为存储盘的计算机。实践证明,最好能够采用i7-6700HQCPU8G以上的内存、最好配有128G以上的SSD固态硬盘,总空间容量在1T左右。


个别类型计算机在同类配置的机型中价格最高,但是价格高不一定适合语保工程项目使用。需要注意的是,商务类的计算机的CPU一般为了续航和省电,均采用了低电CPU,它的CPU型号最末端有个U字,例如i5-6200U。支持低电压的CPU在运行摄录一体软件时,性能不是很稳定,主要表现在摄录时出现不同步现象的频率较高。此外,考虑到计算机需要外接的设备比较多,最好所选用的计算机有比较多类型的接口,除USB接口以外,还需要有VGA接口、HDMI接口、耳机/麦克风插孔接口。下面提供一线品牌四款计算机供参考[4]

2供摄录用计算机参考型号

计算机型号

CPU

内存

硬盘

USB/光驱

华硕玩家国度 Strix S5

i7-6700HQ

8GB DDR4-2133

1TB HDD

4/

宏基V5-5916 GEDG

i7-6700HQ

8GB DDR4-2133

128GB SSD

1TB HDD

3/

惠普OMEN 15-ax219tx 暗影精灵 II Pro

i7-7700HQ

8GB DDR4-2400

128GB SSD

1TB HDD

3/

联想拯救者

R720-15IKB

i7-7700HQ

8GB DDR4-2400

256GB SSD

1TBHDD

3/

(二)话筒

常用的录音设备有录音机、录音笔和话筒,话筒分为内置声卡和外置声卡两类。语保工程调查手册提供的方案(2015:9)推荐录音话筒包括山逊公司的SAMSON C03U和专业声卡搭配AKG心形指向话筒。内置声卡的SAMSON C03U使用比较简单,但它体积较大,放置于桌面上容易倒伏;况且SAMSON C03U指向性不是很好,在录音时对周围环境要求较高,相对领夹式和头戴式话筒而言,所录制的文件容易出现较多背景杂音。在实地的录制中曾经出现过以下现象:计算机和SAMSON C03U放置在同一张桌子上,SAMSON C03U会将计算机风扇转动的杂音录入;SAMSON C03U与青年男性发音人距离太近,发音人强有力的心跳也进入收音范围。而且SAMSON C03U音量效果不甚理想,特别是当发音人发低声调单字时,区别于常态发音方法或者发声态的字音音量较低,很难达到-18dB以上的要求,若一定要发音人提高音量,则容易走调,影响材料的原始性。外接声卡的佩戴式耳麦AKG C520使用也比较方便,关键是收音比SAMSON C03U效果好。因此,领夹式或者是头戴式话筒是录音首选,它不用使用桌子或者架子放置话筒,录制的前景影像也比较美观。

 

(三)摄录仪器

摄录设备主要包括摄像头和摄像机。调查手册没有推荐摄像头的品牌,但是在北京召开的语保培训会议推荐了罗技摄像头ProC920。摄像机可选用索尼、佳能等一线品牌。家庭级别的DV机或录播级的摄录机都能摄录,只是操作的难度和可以调节的参数不同:录播级的摄录设备参数较多,需要专业人士操作;家庭级别DV摄录机使用比较简单,只要拍摄得当,所摄录的文件也可以达到语保达到的质量要求。


摄像头不能单独摄录,它必须依靠摄录一体软件完成摄录工作。该软件对计算机的配置要求比较高,它将摄像与录音两个部分分别进行,最后再进行合成,合成之后偶尔会出现不同步的现象。因此在摄录一体软件环境下,适合拍摄30秒钟以内的短视频文件,例如单字、词汇、俗语以及歇后语。而摄像机不需要依靠任何软件就能够摄录,适合拍30秒钟以上的视频文件,例如地方普通话、口头文化以及讲述。要注意的是摄像机拍摄时有多个参数需要调节,分辨率一定要调节为1920×1080/50i,还要注意在不同的环境下调节它的白平衡、亮度、饱和度等参数;而语保摄录一体软件界面就有相关的参数调节窗口,操作比较方便。

 

五、录制编辑软件

软件在语保工程中起到非常重要的作用。用录音笔录制声音不需要软件,而话筒录制声音要依靠软件完成;摄录机摄录视频文件不需要软件参与,而摄像头的摄像工作要依靠软件完成;录制后的声音文件和视频文件的编辑都需要依靠软件完成。下面介绍常用的录制编辑软件。

(一)录音软件

语保工程课题团队中常用的录音有三种Audacitybyly(北语录音)和Adobe Audition。前两者是免费软件,Adobe Audition是收费软件Audacitybyly(北语录音)在语宝网上都可以下载,解压安装后就能运行,非常方便。Adobe Audition软件是adobe公司旗下产品,这款软件有MAC版也有Windows版本,需要购买序列号才能使用。上述三类录音软件一般用于录制长篇语料,单字词的录音用摄录一体软件能够在摄像的过程中同步完成录音工作,不需要另外录音。有个别课题团队采用了Praat进行录音,Praat语音分析的功能强大,其录音功能一般,而且在录音的时候不能监听底噪;也有个别课题组采用田野调查系统TFW进行录音,但其录音编号不符合语保工程资料整理的要求,因为语保要求的数字编号是4位,而田野调查系统的数字编号为5位,需要后期批量处理。


Audacitybyly(北语录音)和Adobe Audition除了具备录制功能还有编辑功能,语保摄录一体软件本身没有编辑语音文件的功能,它所录制的文件还是要依靠Audacity等软件进行编辑。


(二)视频软件

视频的录制软件为语保摄录一体软件。已经多次提到这款编辑软件录制的时候对设备要求比较高,而且有不同步的现象,但由于其操作方便,能够同时获得音视频,并且能够自动编号,所以在调查团队的使用率非常高,在录制单字词的时候一般不会用到其他的录制软件。


视频文件的编辑软件较多,调查手册上推荐的视频编辑软件PMB,只能进行初步的视频编辑,例如两个视频合成一个视频,或者将一个视频分割成两个视频。如果视频有背景杂音,要切掉部分视频的话,PMB操作起来就非常不方便。该软件没有视频和音频对照界面,不能精准对应切入和切出的时间轴,操作步骤也比较繁琐,首先要把中间混有杂音的视频切成三份,前、后部分不带杂音,中间部分带杂音,再将前后两个部分合成。


国内有一款名为爱剪辑是免费的软件,不过它的功能过于简单,不太适合用于语保工程视频文件的编辑。较常用的视频剪辑软件是会声会影和Adobe公司的PE系列软件,它们都是是收费软件。这两款软件在进行编辑的时候一定要设定视频的参数,否则处理过后的视频的比特率等、分辨率、速率和帧数偏离了拍摄时设定的数值,不符合多媒体材料的质量要求。一般情况下,采用VegasEdius编辑系列软件进行视频处理,得到视频文件参数都是与原始材料一致的。上述这几款视频编辑软件在进行编辑的时候界面可控性非常强,可以看到视频当中音频的波纹,通过听音进行对比和放大,可以非常精准地找到杂音位置,并且为杂音设置入点和出点之后,可以在软件内进行切除,非常快捷方便。不同品牌的视频软件的价格有差别,普通课题团队会选择比较大众化的会声会影和Adobe Premiere,有一定摄录基础的团队则会选择VegasEdius软件。

3 常用视频编辑软件

序号

名称

公司

适用型号

1

会声会影

加拿大corel公司

X9

2

Adobe Premiere

美国Adobe公司

CS6/CC2017

3

Vegas 

日本Sony公司

Pro 14 Edit

4

Edius

美国Grass Valley公司

Pro 7.50 Build

这些软件商在中国都有公司也有相应的网站,提供详细帮助文件,并有大量相关书籍,可以按照指引进行操作,非常适合课题组团队编辑使用。


六、小结

语保工程多媒体语料摄录量比较大,纸笔调查与多媒体文件一一对应:有老年男发音人1000个单字、1200个词汇,还有50条语法;青年男发音人1000个单字,还有所有发音人的话题讲述部分、口头文化部分和地方普通话部分都是需要摄录的。课题团队在调查的过程中,组建专业录制团队人员,熟悉摄录要求,精心准备摄录设备、控制现场录制严格把关,必能有效提高多媒体语料摄录的质量,提升工作的进程。

 

参考文献

[1] 教育部语言文字信息管理司. 中国语言资源调查手册.汉语方言[M]. 商务印书馆, 2015. 1—20.

[2] 李斌. Elan建设单点方言多媒体语料库[J]. 方言,  2012,  (2): 178190.

[3] 李爽,张松. 计算机软件技术在满—通古斯语言调查中的应用初探[J]. 黑龙江民族丛刊, 2016, (6): 171177.

[4] 红色, 王旭. 游戏八金刚8款游戏本纵评[J]. 个人电脑,  2016,  22(5): 2238.

 

(秦绿叶,任教于广东技术师范大学)

(原载《嘉应学院学报》2017年第4期)


 *本文为中国语言资源保护工程广东汉语方言调查项目台山课题(课题号YB1602A009)成果,在调查过程中多次得到福建省电教馆关俊伟老师的指导,在此表示感谢。

往期链接:

学术探论 | 金美:《汉语语法:漳州话语言艺术》的音系与语法——兼与近现代西班牙传教士闽方言汉语教材比较(下)

学术探论 | 金美:《汉语语法:漳州话语言艺术》的音系与语法——兼与近现代西班牙传教士闽方言汉语教材比较(上)

学术探论 | 李菲:大埔光德(九社)方言音系——客家方言包围下闽南方言代际语音特点变异研究




本期作者|秦绿叶

本期审读 | 柯鸿棋

责任编辑 | 老甘

投稿邮箱:jnufyzx@163.com




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存