查看原文
其他

从《弗兰肯斯坦》到《西部世界》, 人工智能是否已俘获你心?

2017-08-26 胡寅 知社学术圈

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月


人工智能是电影叙事的经典母题之一,甚至在其正式获得学科命名之前,根据雪莱夫人的小说《弗兰肯斯坦》(1910)改编的默片就已风行多年。图灵时代,人们热衷于叙述机器获得人类智慧之后,对人类社会和人性影响,最高峰莫过于《银翼杀手》(1982)。互联网时代,《黑客帝国》(1998)三部曲完美演绎了网络对人的控制。随着人工智能研究进入新阶段,复杂神经网络,大数据和物联网各自发力,反映到艺术界,推动故事形式继续演变,近期力作如《她》(2014)。近三十年,人工智能作为叙事题材,万变不离其宗,几乎到达了盛极而衰的程度。奇妙的是,虽然剧作家们如此热衷于表现机器对人类智慧的模拟,且电影制作又是诸多科技浪潮,尤其是机械工程和计算机技术的尖兵(几乎每个剧组都会定制成本高昂的机械结构件和后期特效),但人工智能作为科技手段,对电影制片技术的贡献,却远远小于其在叙事学中的重要性。我印象中,在无人车进入片场之前,电影制片史上出现过的最智能的机器,大概也就是《大白鲨》(1975)中的那个可以张嘴的鲨鱼模型。而观众们在不同场景中看到的各种超级机器人,在现实中往往只是一个造型奇特的灯而已。


图1:影片《她》海报


巨大的反差,固然是由于传统电影的艺术特性决定的,视听审美和戏剧冲突,完全依赖人类的决策和情感,没有人工智能的用武之地。然而,故事总有说完的时候,考虑到传统电影叙事的生命周期,已经进入了衰退,近年席卷影院的3D大潮,将大众趣味带回了120年前,电影诞生时作为马戏项目的“奇观”时期,视听需求远超叙事需求。从这一点来看,甚至可以说,电影已死。而3D建模技术和虚拟现实的进展,将给传统电影带来复活的机会,那就是与视听/电子/网络游戏(以下简称游戏)的结合,这恰恰也是人工智能统治大众娱乐的时刻。


“人只有在游戏时成为完全的人”(弗里德里希·冯·席勒)。电影与游戏结合的产物,不妨也简称为“影戏”(谨以此向早期致力于复原戏台的国产影戏致敬)。从审美角度来看,不仅是游戏成全了电影,更是游戏借电影上位。就在几周前,我在社交媒体中发起一个题为“视听/电子/网络游戏是不是七大艺术之后的一个艺术门类”的投票调查。投票者学术圈和文艺圈各半,赞成和反对派各执一词,反对者稍多。换句话说,虽然在游戏制作和参与过程中,大量应用了人工智能(主要是决策算法),且一度被戏称为“交互式电影”,但由于硬件的限制,目前其声画效果还不能与电影相提并论,其大众接受度,甚至还不如电视。

 

图2:社交媒体调查结果


梅洛庞蒂说:看见,即是保持距离地拥有。然而,游戏的代入感和互动性,是传统电影不可承受之轻。电影导演们曾尝试放弃最常用的上帝视角,也称全知视角,全片采用主观镜头来追求代入感效果。伴随着这种尝试,观众往往还能看到大量长镜头,偶尔还有一镜到底。如《女巫布莱尔》(1999), 《俄罗斯方舟》(2002),和《硬核亨利》(2016),这些影片在不同时期,都能成为一时热点。而在“影戏”时代,它们也将是虚拟现实(VR)或增强现实(AR)得以应用的最佳剧本。

 

图3:《硬核亨利》海报


虚拟现实,是电影和游戏最有可能产生的交点。但用VR技术构建电影场景的一大瓶颈,在于摄像和放映系统。在拍摄时,不同的场景需要不同的摄影机阵列,意味着摄影师需要像更换镜头一样,频繁更换脚架。单个摄影机的体积将变得更小,以达到更好的移动性。更小的摄像机感光芯片,却要求与电影摄影机同等的单眼画面质量(2K)。这还只不过能达到一个3自由度的场景(摇动/倾斜/滚转),而由电脑生成的VR场景则一般有6个自由度(加上前后/上下/左右等线性自由度)。此外,布光,画面渲染时间和头盔技术也有很大的局限。


图4:虚拟现实摄影系统


在解决了VR技术的基本瓶颈之后,我们可以想象多视觉(Multi-View)3D影像,甚至全息3D视觉,因为大脑是全息的,全息模型中的分散信息和神经网络中信息的表现形式有类似之处。但无论如何,人工智能只有在VR环境中,才真正地进入《西部世界》(1973,2016年翻拍电视剧)。今天的观众/玩家,已经将VR看作一种整合了线性叙事和开放叙事的结构,而这不过是冰山一角。人工智能主要功能,是在长时间的360度的影像中,帮助观众找到互动点,将多个故事线中的一个延续下去,并使之适应人类日常的互动习惯。事实上,近年兴起的娱乐计算学(Entertainment Computing),多少展现了人工智能在未来娱乐形式中的地位。


1. 智能渲染场景模型

一般双视觉(stereos)3D电影的摄影系统由两个镜头组成,而目前的VR摄制系统至少有6个镜头,多视觉(Multi-View)3D影棚中往往有9-25个镜头在同时拍摄,VR产生了信息量数倍于传统摄影的场景模型。模型渲染时间从20小时/帧,缩短至11毫秒/帧。显然,决定那些影像需要被即时渲染的算法,对场景能否达到传统电影的效果有着决定性的作用。

2. 智能事件识别与分析

观众/玩家在场景中的姿态,决定了故事线的走向。人工智能的任务是定位和分割影像中的姿态,并达到良好的识别率。

3. 智能编写剧情线

基于数据和统计形成的剧情树,将为观众/玩家即时提供新桥段,机器学习产生的剧本,将导致人类编剧大量失业。

4. 智能角色反应

虚拟演员将和观众们共同推动戏剧和情感冲突。


《奇点临近》预言,神经网络的计算能力将在2045年超过人脑,并实现自我复制。不管这个预言是否可信,人类的娱乐进入智能时代已是不可阻挡的趋势。在未来的影戏时代,制片厂和电影院的规模将会是现在数十倍,作品的篇幅将数倍于传统电影。深度神经网络,通过这种方式,反过来对人脑神经施加影响,使之沉浸于游戏和电影的快感。这种艺术形式,同时也是工业,相对独立存在的电影和游戏,更容易被政治化和金融化,而这些历程,是在它成为第八艺术之前的必经之路。至于技术,永远都不是主要的障碍。


扩展阅读
 

顾险峰: 人工智能对决人类,奇点已经降临!

谷歌vs脸书: 谁搞定了围棋人工智能?| 深度解析

深度学习机器自学国际象棋72小时,媲美国际大师

Email之父: 他用一个符号改变了世界

本文系网易新闻·网易号“各有态度”特色内容

媒体转载或者合作请看下方↓↓↓

投稿、授权、合作事宜请联系

service@scholarset.com 或微信ID: scholarset

回复“目录”或“分类”,浏览知社更多精华。长按二维码识别,可以关注/进入公众号进行回复。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存