其他

从电影艺术到媒介素养——人工智能对电影教育的功能性改变

2017-06-26 杨文火 中国电影教育研究中心

从电影艺术到媒介素养——人工智能对电影教育的功能性改变

From Film Art to Media Literacy :  A Functional Change of Film Education under The Era of Artificial Intelligence


(北京电影学院 杨文火)

 

摘要:人工智能正在改变我们的一切,电影教育也毫无例外地受到影响。本文集中探讨人工智能是如何对电影艺术进行功能性改变,并且影响电影教育的功能从单纯的艺术教育转换为一种媒介素养。 

关键词:人工智能;电影语言;电影教育;媒介素养



一、 媒介特性:人工智能与电影产生关联的基因


凡事都有不同侧面,不管外在的观察和思考角度有多大差距,多数情况下还是可以指向同一个内核的,这个思维套路在早期朴素哲学家那里可以得到最好的证明。就电影这个领域而言,关于电影的本质论、本体论、哲学观已经有了众说纷纭的概念乃至自成一说的体系,但是选择怎样一种角度可以更加接近它宽广未来的渐近线,或者说更好地把握它在人类发展中的思维脉络呢?笔者的答案是——媒介的角度。


媒介在广义上无所不包,甚至涵括生物体的物质交换器官、交通行业的运输工具、仪器设备的导体,等等。但是狭义上从传播学领域来看,我们更注重它的信息交流特性,这个也是电影作为视觉艺术所秉持的最重要特征,所以从狭义上来讨论显得更合情合理。

讨论一切事物的根据都在于人,只要把人剖析完整,其事物的面目也自然就显露出来。所以一切问题的根源得从“人”这个怪胎说起,就比如我们为什么会思考?为什么会展望?为什么会探索?


一种观点认为,人的不完整性来源于神话和想象,因为神话可以把人塑造成无所不能的完整体,他不仅器官发达,意识超群,而且随心所欲。这种对人无限度的追求就是类似于麦克卢汉所谈及的那个词——延伸,无限地延伸以达于神。


那么,该如何来认识这种延伸呢?按神话学角度来看,人能够追求延伸,只能说明人的体内埋下了神的种子,他们生于凡尘却又不满足于淳朴的土地,他们和动物斗争却用脑袋战胜了肢体,不发达的双手却干掉了皮粗肉糙的凶猛动物。


这种既“达尔文”又“伪达尔文”的进化史使得我们思考大脑、重视大脑、开发大脑,大脑的延伸已经成为人类文明的极地。这个重要的事实也为神话学提供了实体依据,那就是人类具有的“自我意识”(Self-awareness)使得他们把自己与自然力量分隔开,他们不会像一只猪或一条狗那样听任自然(是否在意识上也听任),而是要去模仿自然、超越自然。

于是,“自我意识”的概念在解释了人与自然之后,也便可以用来解释人与人工智能,其原理极其相似(表1)。



意识主体

是否有“自我意识”

与外界的关系认识

人服从大自然力量,不能抗拒大自然。

人寻找独立的力量,反抗自然的压迫。

人工智能

AI

AI服从人的力量,不能抗拒人。

AI寻找独立的力量,反抗人的压迫。

 {大自然}∩{人}∩{人工智能}=自我意识


于是,人突破“自我意识”的尺度之后,便开始追求各种延伸,开始了全方位的布局,只要是人身上的器官都企图进行延伸,在这里我们还是把重点放置于信息传播的器官(图1)。

肉体、意识、媒介、机器结构关系图


图1中A区和B区分别代表人的肉体和意识两大象限:A区中五大信息源分别对应五个重要的信息器官——眼睛(视觉)、耳朵(听觉)、鼻子(嗅觉)、中枢神经(触觉)、脑部(感觉)。


B区主要是说明意识象限对器官所采集的信息进行转码和表达,从这个图表我们可以发现一个现象就是——意识接受信息都是图像化的——眼睛看到的、耳朵听到的、鼻子闻到的、身体感应到的和脑袋想象到的,都是图像化信息。


C区解释了器官作为媒介发送和接收信息时的符号性特征,但同时说明了触觉和嗅觉的传输残缺,因此这个区所代表的就是简单的机器延伸媒介(目前“电影”还只是属于这个区域)。


D区表达了两个重要的事情:第一个事情是展示了高级人工智能可以弥补触觉和嗅觉符号缺失的矛盾,第二个事情是说明了图像与意识的最高级形态互动关系的两样东西——无屏和梦境。


通过图像中的结构关系,我们就可以很好地理解现阶段“电影”这个概念的最本质含义了:电影是一个传达视、听一体化信息的媒介。


在整个结构图所展现的媒介系统下,电影(截止当前的形态)只是一个机械学意义上的低能学科,它传达的只是一些宏大信息的采样片段,要做到信息的更大采样率传输,显然需要从C区升级到D区。

 

二 、反“机器人三大定律”以及电影进化的必然

 

在人工智能尚未成风之前,借助于科幻小说的兴起,人们便已经给还没到来的机器人时代立了法则,比如阿西莫夫的“机器人三大定律”。

 

第一法则:机器人不得伤害人类,或坐视人类受到伤害;

第二法则:除非违背第一法则,机器人必须服从人类的命令;

第三法则:在不违背第一及第二法则下,机器人必须保护自己。

 

这三个法则不管说它自私、奴化、狭隘或什么贬义词都不过分,因为它依然没有摆脱人类狭隘的世界观,如果按照这个法则来对待未来的机器人,那也就无异于用黑奴法典来统治奴隶。


当时提出这样的法则,只能说明科技还不够发达,人类还不够自信,伦理还过于保守。现在,技术的进一步发展,使我们看到了这些法则的僵硬,于是我们不禁要想,究竟应该是一种什么样的机器人才代表未来呢?笔者在这里提出了对未来机器人的“新三律”:

 

1.机器人是人的延伸,它不会比人更冷漠或恐惧;

2.如果机器人伤害人(终极问题),依然只是人在伤害人,与金属无关;

3.人工智能的“奇点”必将到来,“奇点”之后是人的质变和超越,机器人再次回到人。

 

如果说单纯从字面上还很难理解“旧三律”与“新三律”的区别和内涵,那么我们就从文字和电影的历史发展来理解。


首先,信息集中和媒介稀缺使得知识集权统治多数人。在口头语言阶段,信息传播口口相传,因为声音信息(时间编码)无法集中存放,所以没有相应的信息源存储中心,这就暂时不存在知识集权的问题,当然可以催生酋长制的部族制度。文字语言阶段,文字的应用使得知识可以以图像信息(空间编码)的方式集中存放,所以有了相应的信息源存储中心,这为知识集权的可能提供了第一步。接下来,由于传播媒介的稀缺,信息的集中经历了漫长的岁月,直到印刷术的发明和应用,才使得文字得以广泛传播,富兰克林就是一名专业的印刷匠。


其次,媒介泛化使个体民主逐步扩展。信息发达以什么为标志呢?在回答这个问题之前,我们先来理解一个事情,就是生命体的运行机能。生命体就是一个复杂的信息系统,每一个器官与另一个器官的信息沟通都是需要及时和协调的,一旦有个别地方的信息出现断电、障碍、紊乱,整个有机体就出现相应的变异。从这点上来看,社会的信息系统也有同样的标准,即信息的迅速和有效是衡量社会信息系统发达的标志。在经历了印刷文明、电子文明的洗礼之后,媒介开始泛化,虽然也出现了很多负面的结果,比如信息冗余、景观消费,但有一点是最重要的,那就是信息对称性的提升。


电影在这个过程中扮演了重要角色,因于它独特的媒介特性,当然有两点需要特别说明:第一,我们这里所说的电影不是局限于影院故事片的电影,而是包含了一切视听一体的媒介手段,涵括电视、新媒体、游戏等方式;第二,采样率是视听媒介在传达有效信息上优于文字的重要因素(表2)。


媒介形式

直接视觉

听觉内容

采样率

书本文字

文字

0≤X≤0.5

书本插图

图像

≈0.5

收音机

声音

≈0.5

电影

运动图像

声音

0.5≤X≤1

以“金门大桥”的现场全息信息为1,表格列出不同媒介的采样值X对比


从表2中可以看出,视听结合的媒介手段使得信息的采样率较之文字时代有了大幅度提升,但是它仍然是无法达到1的全场采集。况且,许多艺术现象也深刻表明,影视在表现想象力方面仍然面临着巨大的不足,要是说想象力表达,它远远不如文字。于是,提升采样率成了媒介发展的新趋势。


至此,我们从个体发展的需要来看,智能化必须应用于每一个个体,因为他们在新的媒介世界里有了更复杂的信息系统,这个系统涉及到媒介的丰富化,而信息量越大所要求的自动化也就越高。诚然,我们的大脑一直在发达,但是鉴于自身硬件条件的限制,我们不得不借助于机器计算,或者部分机器化,而这些步骤无一不是需要智能化的。

 

三、电影的智能化发展和电影教育的新变化


在不谈及集权控制、母体世界、美丽新世界等极端话题的情况下,社会发展必然朝着个体化和多元化的方向前进,这是我们追求的目标。按照上述采样率观点,影视的制作要素应该是在走向细致化,这一点我们在这几年是有着非常切身的体会的,比如字幕的可选性和独立性是字幕要素分离成一个非常重要的电影制作元素,VR是镜头语言从单一视角变为无限视角。


人工智能不是一个无中生有的概念,而是来自技术与社会文化的结合,现在重新兴起的人工智能走出了“冬天”的寒冬,重新迎来了春天气息,在这一场新的革命里,一切都逃脱不掉,那么电影又是怎么扯上关系的呢?

 

(一)作为内容的电影——越来越接近信息学

在过去的几十年乃至上百年历史中,财富的增长越来越依赖信息,信息成为了财富的源泉,这是人类短暂的骄傲,但是这个美梦也将很快惊醒,因为已经出现并且日趋成熟的人工智能在信息处理方面比我们有过之而无不及。所以智能化产生了双刃剑,一方面它可以提升我们的工作能力,但是另一方面我们又担心在技术面前被机器驾驭。


信息无处不在,并且越来越渗透到各个领域,而且超越以往的形式。古代的狼烟、军情、地理、天象这些重要信息都是以外观的经验去获取的,但是现代的信息技术想一架挖掘机无所不往,微观能进入人体(以DNA图谱为代表),宏观可探及外太空。


不同信息体系虽然各有差异,但数字化是目前一个共通的地方,一切东西都转化成机器码,通过机器识别、分类形成庞大的元数据库(Meta Data),大数据、互联网、物联网无不依赖于庞大元数据库的支撑。


电影制作元素从胶片时代到数字时代经历了巨大的革命,每一次变革都是让工序更叫琐碎化,其实也是一种信息的手段,即电影视听元素分离得更加透彻。我们以不同年代版本《超人》的特效制作为例,认识一下电影工序是被切碎到何等程度的:

 

1948年斯宾塞·戈登·本尼特导演的版本,除了简单的特殊动画效果支撑之外,没有很明显的特效。

1978年李察·唐纳导演的版本,特效已经走出了很大一个步伐,但是主要还是基于传统特效,但是飞行特效、钢丝特效、模型特效分工更明晰了。

2016年查克·史奈德导演的《超人大战蝙蝠侠》特效非凡,也是一部公认的靠特效吃饭的大片,这时候我们可以看到电影在元素切分上已经非常细致化,而且是数字化的:数字化妆、数据管理、运动跟踪、镜头匹配、纹理设计、数字合成、数字绘景、数字预演、脸部捕捉、CG、程序员

 

从上面对比中我们发现一个比较有意思的事情是,程序员进入了电影工业的主制作流程,并且承担了很重要的工序。那么程序员对于视听语言的信息化到底在什么程度上发挥作用呢?除了特效这样的静态功能,在电影的动态发展和智能开发方面又是怎样的呢?


2015年,BBC研发一款新的视频播放系统,这个系统可以与用户产生非常精细的互动,整体上就是把视频制作的要素进一步分离。我们知道互动叙事(以游戏为代表)的视频系统有选择剧情的方式来自定义不同故事,而BBC这个系统不仅故事可以选择,而且背景音乐、色调、情景、剪辑点都可以根据观众需要来重新选择。


根据观众的喜好选择影片的背景音乐


根据观众的喜好给出一定的评价


男性和女性所获得的情节是不一样的


不同的电影类型爱好者给予不同的情节剪辑点匹配


不同的电影类型爱好者给予不同的音乐风格


(二)作为形式的电影——信息学之内的诗学

当我们继续把电影定位在艺术的时候,我们必然需要去考虑作为艺术的一般规律,也会把它和文学、音乐、雕塑、戏剧等艺术类型进行对比。

诗歌在所有艺术类型当中属于比较特殊的,因为它没有固定范式,没有类型外壳,没有语法限制,没有逻辑套路。相对于以算法为基础的人工智能来说,诗歌给人工智能予以有力否定——人工智能是不可能取代艺术的。但是,当我们回到亚里士多德在《诗学》所谈的关于知识的“自足性”问题是,我们反而从中看到了一个结合人工智能与艺术的思路。


亚里士多德把知识或科学分作三类,即理论或思辨科学、实践科学和制作科学。艺术作品在目前还属于制作科学范畴,因为其目的体现在活动以外的产品上,更谈不上把自己上升为工作对象,说的简单明了一点就是,艺术还只是“思辨科学”的传递媒介而已,它不能像思辨科学那样,既包含了行动的目的,也包含了行动的对象。


于是,当艺术作为媒介的手段处在这样一个科学技术急剧变化的环境中进化时,诗歌到底和人工智能是什么样的关系?或者说对应?


第一个问题是关于艺术媒介与艺术内容的关系问题,也就是艺术媒介所能承载的艺术内容的量度的增加和技术的关系。笔者曾经自创了如下这张图,用来表达科技进步与艺术发展的关系模型,从中引出了四大命题,前三个在其它著述中已经阐述过,今天我们再来看看第四个命题,因为与本文主题直接相关。


模型图中,艺术除了随着科学的变化加速而加速这一直观事实外,还隐藏了另一层涵义,那就是艺术与科学的两种不同本质会趋向于同化:映像接近于克隆。




在上面这个图中,当我们把X轴取值范围扩大到0和3000之间,而把Y轴的极限设定在1000以内时,Y值随着X值进行变化的部分曲线成像图基本接近于距形,这是什么意义呢?


艺术的本质是制作映像,模仿或体验生活,而科学的本质是改变生活和克隆对象。当科学对艺术的影响力还不够全面时,艺术所做的“映像”行为与科学所达到的“克隆”行为存在着差距。媒介发展是为了丰富人的器官感受:绘画的纯视觉满足,音乐纯听觉满足,电影的视听结合满足,3D电影的心理拟真满足,触控技术的身体互动满足,再后来就是一直到克隆。


所以,虚拟现实发展过程就是:现实-虚拟现实-现实虚拟-虚拟,而实现这一过程的关键就是人工智能。


联想之星Comet Labs董事长刘维在一次演讲中正中要害地说出了人工智能与人的共同点:智能=认识客观世界+做出正确响应。



长期以来,我们一直困惑于那个著名的莫拉维克悖论,人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理,但是无意识的技能和直觉却需要极大的运算能力。这个悖论让人来看到了人作为高等动物的优越性,似乎我是我们能够在机器面前高高在上的原因。但是,如果细分析,这个东西并非机器办不到,而只是时间和技术问题。人的无意识在本质上是一种高级和复杂的意识,它的模式识别也就是类似于认知计算。


纽约大学两个人工智能研究专家Oscar Sharp和Ross Goodwin做了一件有趣的事,他们研发一套独特的算法,让人工智能写剧本,大致灵感和步骤如下:




很显然,今年出现的“阿里编编”可能就是收到这个实验的启发,企图让机器人代替真人去写剧本。这个人工智能的剧本看起来还是有点模样,但是深入到台词和细节就比较低幼。


但是,这个不太成功的实验起码已经很好证明科技在往这个方向发展。谷歌联合斯坦福大学和麻省理工学院深入研究自然语言的机器习得算法,他们的另一个实验室人工智能写的诗歌,做法也是一样的,先给系统输入数量丰富的作品,然后给出一个开头句子和一个结尾句子(粗体部分),要求机器填补中间空白,并且需要保持情节、风格、主题的连贯。


there is no one else in the world.

there is no one else in sight.

they were the only ones who mattered.

they were the only ones left.

he had to be with me. she had to be with him.

i had to do this. i wanted to kill him.

i started to cry.

i turned to him.


此外,人工智能绘画和作曲也是已经有着丰富的尝试了,那么,我们现在要问,人工智能在艺术上到底怎么理解?


凡事如果合理,用任何角度来理解都是相通。《诗学》以艺术摹仿说为根基,合乎中国“人法地,地法天,天法道,道法自然”的本土美学。于是,当我们从摹仿说出发,回头来看早期的《诗经》和《荷马史诗》这些经典起源作品,不难发现它们的叙事美学也是从写实开始的,随着文化和社会人伦的进一步发达,诗歌的各种流派逐渐丰富,诗歌的技巧不断创新,浪漫主义、现代主义、后现代主义各种学说异彩纷呈。


人类用了几千年的时间才让诗歌发达,人工智能需要多久呢?一定会更快的。当然,说到这里的时候,马上会有反驳出现:如果让机器写诗,那有什么意思?特别是前段时间人工智能作曲的时间引起很多人的疑问,当人工智能创作的交响曲在舞台演出以致于听众都分不清那一个事人作的曲子,而哪一个又是机器作曲的时候,观众从惊叹转向了否定——机器作曲显然是没有意思的。


人工智能还是要回到人本身,但是有没有人智能的人是有区别的,区别就是——我们创作的手段完全不一样了,这个就回到一个重要的命题:技术的发展是为了让人抛弃技术的束缚。


一个有趣的统计:假设我们2000年每个人身上只有一个电子通讯设备(手机),2010年有两个电子设备(手机、平板),2020年有三个电子设备(手机、平板、头戴),依次类推,特别是物联网的发达,几乎所有东西都将成为设备,我们看似会有越来越多的设备。

但是,在人工智能的发达之后,所有设备都被归零,你的沟通方式又回到简单的单线思维,你不必去回复一个短信,不必去设定一个闹钟,所有一切都只需要一个语音。


艺术创作(电影制作)也将同样经历这样的过程:2000年只需要拍胶片就够了,2010年开始要满足数字技术的技术指标,2020年除了会平面会立体还得会应用到虚拟现实系统,但是等人工智能把所以电影制作技术都习得后,你的电影创作又回到简单的一维路线,你只需要提供一个好的故事,然后让机器帮你实现就行了,这个可能才是《Sunspring》应该有的结局。

 

四、结语


在理解人工智能之前,我们先来理解人和艺术作品的关系。我们经常要去评判一个艺术家作品的优劣得失,而批判到最后会发现,一个好的艺术家其实就是视野开阔和学识广博,并且善于灵活应用。于是,“学识广博”和“灵活应用”便是我们要讨论的深度学习的中心。


说到深度学习,用过苹果Siri的人都会对那个性感的智能语音记忆深刻,也感叹于机器深度学习已经到达了一定境界,但是还有很多挑战正在进行,比如一些更细的事情:让机器给黑白图像的自动着色(Colorful Image Colorization)、给无声电影配音(Visually Indicated Sounds)、自动手写体生成(Generating Sequences With RecurrentNeural Networks)、自动图像字幕生成(Explain Images with Multimodal RecurrentNeural Networks),等等。


这些看似简单的事情对我们来说确是很简单的,那么到哪一天对于机器来说也是会简单的呢?这就需要无限丰富的文化知识。随着人工智能的进一步发展以及云数据的高度一体化,深度学习所需要的对历史和文化的渴求是无限的,真正的内容依然是建立在深厚的文化底蕴基础上的。


这两年中国电影也爆发式增长,一个重要侧面就是题材的多样化。其中我们看到几部大众比较喜欢的电影像《抓妖记》《美人鱼》和最近的《大鱼海棠》都是来自中国传统经典著作。


观众最近对《大鱼海棠》的评价褒贬不一,有的人死抠它的故事太过离奇,偏离原义。但从机器学习角度来看,这其实才是最好的结果,因为文化底蕴是提供一种灵感和要义,故事的话按照我们需要去定义,去寻找片段组合,达到一定的主题和意义就够了,所以在某种程度上看来,《大鱼海棠》是一次人工智能式的胜利,是叙事的讨巧。


我们总在说“中国文化博大精深”,到了这个时代才开始显露出它的真本性,你想想《逍遥游》几句话就可以给《大鱼海棠》这么美的灵感,那么其它可挖掘的将是很惊人的,所以虚拟现实是一片荒野,需要的肥料就是文化。


这些肥料怎么播撒?需要靠的就是媒介。由电影衍生出来的视听语言将不再停留于简单的艺术创作这样的“非自足”制作实践,而应该走向更加宽广的媒介领域,在那里发挥更大的作用。更有甚者,电影语言将超越媒介而进入采样率为100%的克隆阶段,这个就达到了完全“自足”的境地。



(戳二维码,关注我们)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存