如果我们把面部按照五官划分区域,相较眉眼、鼻部、双耳,嘴部无疑是最忙碌的器官。因为嘴部既要参与表演,又有着对应口型的重担。在二维动画中,动画师们往往会以比较讨巧或者有所取舍的方式进行口型动画的绘制。口型动画的绘制也往往会受到音源语言、角色性格、项目预算、作品风格、景别大小等因素的影响。
这篇文章,就让我们从这个动画的小要素出发,来简单地分析一下二维动画当中的口型演出,都有着什么样的奥秘。在二维动画中,口型动画的绘制分为拆层与不拆层的情况。如果不拆层,口型参与角色的其它表演,嘴部的表情也是角色表达情绪的重要部分。原画师直接绘制出口型,主要表达角色的状态或是情绪。嘴部的运动融入表演之中,结合台词、句意,能够从视觉上给出与声音结合更为紧密的画面。
如果拆层,那么在摄影表上则会有专门的一层用来指示口型动画的绘制,用以对应音源,便于多人配合完成动画。
与角色台词匹配的口型动画,涉及到一个关键问题:唇形同步(lip sync)。唇形同步对于引导观众进行视频文本理解作用非常巨大。当唇形无法与视觉画面同步时,会影响到观众对于文本内容的判断。1976年学者Harry McGurk提出了麦克古尔效应(McGurk Effect)。这是一种感知现象,证明了语音感知中听觉和视觉之间的相互作用。他经过研究,发现如果视频中先说着【bababa】然后是【dadada】【wawawa】,但音频一直是【bababa】,观众会通过读唇而不是实际听到的来辨认他说的内容。[1]
但唇形同步永远不是简单地把所需所有口型依次绘制而已。就英语而言,根据音素(phoneme)所需口型分组,在绘制口型动画时,按照发音选择对应口型,再进行绘制。
英语是一门使用时讲究节奏的语言。不同音之间除了调动唇齿舌作为发音基础外,实词重读、虚词弱读,产生轻重节奏。连读技巧使得词与词之间发音相接,以一意群为单位,意群内部的发音充满了滑动性,再根据语境、性格及情绪,做发音上的强调或弱化处理。
省略了部分辅音口型之后得到的“融合口型”,同一个口型可以对应多个辅音[2]
在同一个句子或意群的发音时间内,具有滑动性的口型动画能够以较少的变化,展现出更流畅的效果。对于实词元音的强调,也能帮助观众更好地理解句子所要强调的重点。如《瑞克和莫蒂》,作为情景喜剧动画,语言为美式英语,人物对白占据了动画中声音的绝大部分。在第一季第三集中,Dr.Bloom有这样一句台词:【I don’t know why.】,耗时1秒。
按照音标来看,整个句子一共有13个口型。如果全部展现出来,不仅每个口型的辨识度会降低,画面也容易显得匆忙且混乱。因此,在进行选择时,首要表现元音的口型。没有特别唇部运动的辅音,对应的是各元音之间的中间帧,即成为了过渡的部分。在此台词中,由于句子中的元音都是双元音,因此出现了8个口型,对于发音重点有清晰的表现。
当然,这是辅音没有出现特别唇齿舌运动的情况。上句中/d/、/n/、/t/等辅音虽然有较为复杂的舌部运动,但由于被唇齿遮挡,而且发音时面部肌肉变化细微,在二维动画中成为了“被简化”的部分。但如果句子中有咬舌音、咬唇音等,即使持续时间很短,但依旧要表现出来,因为这是判断音画能否同步的重要标点。
同时,句子以意群为单位,意群内运用连读,呈现出一致的升调或降调。意群间不连读而显得有所停顿,使口型跟随句子产生节奏变化。
Youtube博主Diazrar为其角色做的口型同步动画可能很多人都知道“美式发音卷舌,英式发音不卷舌”,但除去/r/的发音,在某些元音发音上,英式发音也不如美式发音饱满。因此一些对应口型,也做得没有那么夸张。
从音标可以看出,英音比美音的唇形收拢一半左右。如果看不太懂,可以尝试搜索一下“Harry Potter”的英美发音,跟读时注意“Potter”中“o”和“r”的发音。
卡通沙龙(Cartoon Saloon)的作品《海洋之歌》然而并不是所有语言都是如此。英语的音节结构为“辅音+元音+辅音”,音节尾用辅音收尾,多为闭音节,不发出实音,很难拖长语调。而汉语普通话“韵多声少,响亮悦耳”,音节结构大量使用元音和元音组合,每个音节以韵母结尾,多为开音节,且极少有辅音连缀,显得更加响亮。[3]从节奏上,英语由于使用大量连读技巧,有些词发音会显得比较模糊,极容易产生节奏变化;普通话一个字为一拍,每个字都发得清楚,节奏较为平均。
即使如此,普通话中也有过渡口型的存在。比如“我可爱”,“可”的口型【e】的形状处于“我”的口型【o】和“爱”的口型【a】之间,因此可以直接把“可”处理成中间帧,而不是单独再做出额外的口型。同一句话,在音频所耗时间比做出所有字的口型所耗时间少时,可以对处于过渡位置的口型进行省略。由于汉语是象形字,因此在做台词与口型的转换时,需要在对话栏中写上对应拼音,然后根据口型表进行绘制。普通话口型表的绘制并没有统一标准,但大同小异,根据作品的风格进行调整。
按照唇部上下、左右张开幅度划分口型。图中的字母相当于口型的【编号】,编号的读音与其对应的口型并不匹配。在实际运用中,一种口型不只对应一种发音如果作品没有要求口型要做到一字对一字那么严谨,默认就是按照台词的关键字来绘制,那么需要抓台词中某些关键字的闭合、张开来绘制符合整句台词的口型。例如,台词:“青小趴,你好。”关键字便是“青”“趴”“好”。在拿到音频后,在这三个字发音时把这三个字的口型帧对准时间轴位置,其他两个字只需要根据三帧关键帧补帧,画完后听着音频播放看是否感觉一致即可。这和主动省略口型殊途同归。
但不一定所有动画都有充足预算用于唇形同步。预算有限的情况下,一般是四帧为一个循环,张、微张、闭、微张,用这四张去对所有音频,但是张合要卡在关键字眼上。也可以理解为这四张就是口型素材库。预算紧缺时,口型动画并不会省略掉绘制上细节,而是牺牲与音源的匹配程度。也正因如此,在译制时,二维动画相较于三维动画更容易对口型。由此可见,有限动画中的口型,更多地参与的是与台词的匹配,并不会涉及到过于复杂的表演。台词和情绪都需要角色进行演绎。在剧本中,角色拥有较为鲜明的个性,性格内敛与性格活泼的人做同一种表情,嘴部的表演也不会相同。原画师在绘制口型时,会先通过剧本、人物性格、分镜、layout中单帧的角色表情,判断角色是哪一种说话方式和情绪。
Youtube博主OddKat以《全职猎人》中奇犽的台词“baka”为音源制作的口型动画二维动画里,口型和画风有很大关系,不同作品风格有不同口型概括的方式,因此会有一些风格化表演。写实化的表演与卡通化的表演概括和归纳的程度并不一致,在视觉上会呈现出不一样的特点。
前文提及的《海洋之歌》与《狮子王》无疑就是不同风格的归纳与表演。前者造型上更卡通,风格上画面的装饰感更强,在某些动作上为了构图的完整性会牺牲一定的写实感,具体到口型的部分则是人物说完话马上闭嘴,不会有更多表达情绪的口型;后者刀疤说话时常穿插语气词,它的表演更有层次、偏重写实。
需要明确的是,在制作时动画师往往会根据关键帧绘制动作,但很多观众并不会在连续动作中注意到“关键动作”的存在,而是对于时间长的静帧或刚刚结束的动作有更深的印象。
因此,句末的口型处理也是重点,可以影响人物个性甚至是整体表演风格。普通话语句节奏变化平均,念白过程中表现力较弱,句末的处理显得更加重要。
景别对口型的影响
大小景别对于口型处理的逻辑是不一样的。
小景别中(尤其是特写)嘴部的细节更加清晰,不仅需要匹配台词,也需要进行更细致的表演。如果条(预)件(算)允(充)许(足),除了做出“唇-齿-舌”的重叠动作之外,最好能和配音演员的发音习惯匹配上,这样的嘴型更有灵魂。
特写中口型细致的表演
在较大的景别中,口型可以被简略成“音源”去理解,中远景中更重要的是嘴张开的张数节奏,可能所有张嘴的词都是一张,因为看不见,细节也就没那么重要。
大景别中,人物发声的处理方式还有同描抖动和利用装饰暗示音源等,这是把台词作为音源放在了更大的概念里进行讨论,此处暂按不表。兼顾表演与唇形同步一直是口型绘制需要达到的目标。在预算有限的情况下,在二维动画中也有较为讨巧的绘制方法。但不论哪种形式,都要综合考虑到作品风格、角色性格、情绪状态、音源语言等多种因素。很显然,虽然口型只是动画中一个细小的组成部分,但也是有很大的学问的。[2]https://animataurus.tumblr.com/post/165577409571/the-lip-sync-tutorial-they-dont-give-you[3]韦唐.浅析不同语言的音素、音节对其发音效果的影响——以英语、普通话、吴方言为例[J].湖州职业技术学院学报,2013,11(03):35-37.