《Cybertext(制动文本)》读书笔记(三):文学作品的复杂性理论
强烈建议读过前两章读书笔记后再阅读本文:
在前面两章读书笔记中,我们讨论了作者 Espen J· Aarseth所提出的制动文本(Cybertext)和遍历文学(Ergodic Literature)的概念:制动文本是一种因源文本、媒介和操作者三者之间复杂的交互作用而自成信息系统的文本,当这种文本的目的在于实现某种美学属性的时候,它就成为了一种遍历文学。
古埃及神庙墙壁上的铭文、图像诗(Calligrammes)、我国的《易经》、基于计算机的文字冒险游戏、自动聊天机器人、故事写作程序、多人在线地牢(MUD)都是制动文本和遍历文学的例子。这些作品由于在传统的媒体分类体系下定位模糊,很难得到公正的分析和评价。
在第上一章中,作者审视了一些看起来能够使用于这些作品的现存的文学分析视角,包括非线性和交互性的概念,以及计算机符号学的理论,最后发现这些现有的文学分析视角都不能提供准确分析这些作品的理论框架——制动文本作为能够自我操纵的文本机器而具有的特性,无法在任何一个现有的已建立的文学分析视角下得到准确的表达。对于“究竟什么样的理论框架能够支持制动文本特性的表达”这个问题,作者在上一章给出了许多否定性的看法。
在这一章中,作者终于以肯定性的方式回答了这个问题。作者提出了一套“文本通信的分类学(A Typology of Textual Communication)”,作为刻画各种各样的制动文本的统一度量衡,试图在界限模糊的文本通信王国,为那些身份模棱两可的居民们清晰地分配领土。
文本元(Texton)和剧本元(Scripton)
首先,什么是文本(Text)?这是一个极其笼统的概念,即使在探讨文本的文学分析学界,也没有一个公认的无可争议的定义。不同的理论往往有各自不同的定义。这里,旨在提供一个内容广泛到足以具有实际意义的讨论范围,作者笼统地将“文本”定义为主要功能是传播语词通信的任何事物。
尽管这个定义非常笼统,但从中我们还是能够提取出文本作品的两个关键特性:
1)一件文本作品无法独立于任何物质媒介而起作用,而它所基于的物质介质也会影响到它的行为;
2 )一件文本作品是不等同于它所传播的语词通信内容的。
第一点是说,任何文本作品都必须依附于某种物质媒介。这个物质媒介可以是纸张、计算机、神庙中的墙壁等等。这个物质媒介能够影响到依附于它的文本作品的行为,就像写在纸上的一部小说和运行在计算机上一个文字冒险游戏能够带给读者不同的体验。
纸质小说《弗兰肯斯坦》(a)和Inkle出品的交互小说《弗兰肯斯坦》(b)
第二点则是说,文本作品本身并不等同于它要传播的语词通信内容。一个运行在计算机上的文字冒险游戏本身是一段计算机程序代码,而它要传播的语词通信内容则是用户在屏幕上看到的那些叙事文字,这两者显然是不同的。即使是印刷在传统纸质书上的小说我们也可以做这样的区分——印刷在纸上的是一页一页占满二维平面的符号,而这些小说要传达的语词通信内容则是“一维”的——读者需要有阅读纸质书的常识,知道语词的序列是按照先从左到右、再从上到下的顺序印刷,才能将一维的语词通信内容从二维的文字印刷中提取出来。
纸质书通常将文字印刷在二维平面上,而读者为了阅读需要将二维排布的文字转换成线性的序列
这里我们也看到,文本作品还需要一套帮助读者将语词通信内容从文本作品本身中提取出来的规则。对于纸质书来说,这套规则是“先从左到右、再从上到下”的阅读顺序,由读者来手动执行;而对于运行在计算机上的文字冒险游戏来说,这套规则对应于游戏程序中每条指令在计算机上的执行方式,由计算机自动执行。
我们用下图来描绘文本本身、语词通信内容和提取规则三者之间的关系。作者将文本本身称为“文本元(Texton)”,而将语词通信内容称为“剧本元(Scripton)”。
作为另一个说明文本元和剧本元之间区别的例子,考虑我们在第一章读书笔记中介绍过的《易经》,其中文本元包括64卦各自对应的字典解释条目,剧本元则包括了通过随机过程产生两卦之后得到的4096种可能的占卜结果。可见文本元的数量规模远远小于剧本元的数量规模。
描述文本通信的七个变量
作者提出了能够用以描述任何文本作品的七个变量,通过考察这七个变量取值的所有可能组合,我们就能得到一个文本通信的分类体系。下面我们就来介绍这七个变量。
1. 动力学(Dynamics)
动力学属性描述在一次阅读过程中,一部文本作品的文本元和剧本元是否可变以及如何可变。
如果一部文本作品的剧本元是不可变的,我们就将这件文本作品称为“静态的(Static)”,比如一部传统的、线性的小说,按照纸质书阅读规则去从头到尾、从左往右、从上到下地阅读,只能得到一种语词序列。但静态的文本作品也可以是非线性的:《易经》是一个例子,其中64卦的字典解释(文本元)是不变的,最后得到4096种可能的占卜结果(剧本元)也是固定的。类似地,大部分超文本小说,由于所有可能的故事线在任何时候都是开放且固定的,在作者的分类标准下也属于静态的文本作品。
超文本小说《Afternoon, a story》(MichaelJoyce, 1990)
如果一件文本作品的剧本元可变,但文本元是固定的,我们就将这件作品称作“文本元内动态的(Intratextonic Dynamics, IDT)”。作者举的这一类作品的例子是1976年发售的由威廉·克罗塞与唐纳德·伍兹开发的文字冒险游戏始祖《巨洞冒险(Colossal Cave Adventure)》。
这个游戏中,尽管用以组装成故事线的叙事模块(文本元)是不变的,玩家一次游玩看到的具体故事线会产生变化。相较于静态的交互式小说,诸如前面提到的超文本小说,故事线的变化更为复杂——并不是所有的故事线在任何时候都是开放的,根据玩家的游戏进程(地图中的行走路线,与敌人、物品等的互动等),有的故事线会开放,有的则会关闭。因此在这个游戏中的剧本元也是可变的。
在《巨洞冒险(Colossal Cave Adventure)》中,玩家要输入文字命令与游戏进行交互
如果一件文本作品在一次阅读过程中连文本元都是可变的,我们就将这件作品称作“文本元动态的(Textonic Dynamics, TDT)”。这一类作品的典型例子是我们在第一章中介绍过的多人在线地牢(Muti-user Dungeon, MUD, 中文俗称网络泥巴)。在MUD中,用以组装故事线的叙事模块甚至都不是完全实现预定义好的,而有很大部分来源于数量众多的在线玩家游玩过程中的输入,因此连文本元都不是一个固定的集合。
2. 可确定性(Determinability)
记得我们前面提到的语词内容提取规则这个概念,它可以说是一个功能模块,读者/用户提供输入,它就能够根据规则将文本元组装成一个特定剧本元片段。可确定性属性用以描述这个功能模块的运作是否有任何随机性的介入。如果一件文本作品在相同输入下永远输出相同的符号序列,我们就将它称为确定的(Determinate),反之则称为不确定的(Indeterminate)。例如,大多数超文本小说是确定的,而《易经》由于其于此内容提取规则涉及随机过程,是不确定的。
Roguelike游戏Faster Than Light中的随机事件
3. 时效性(Transiency)
Transiency这个词在这个语境下很难翻译。其本意是“短暂的,稍纵即逝的”。根据我的理解,作者用这个词想要表达的是时间这个要素是否也是制动文本运作中的输入之一,是否也会影响到符号序列的输出,因此将这个词翻译为“时效性”。一些文本作品,在即使没有任何用户输入的情况下也会随时间流逝输出新的内容,我们称这一类作品为“具有时效性的(Transient)”,反之则是“无时效性的(Intransient)”。
4. 视角(Perspective)
视角属性描述读者/用户在文本作品中的沉浸感体验。当文本作品要求读者/用户在文本构建的虚拟世界中起到机制性的影响,例如《巨洞冒险(ColossalCave Adventure)》中读者需要面对敌人和物品做出策略性的选择,这类文本作品就被称为具有个人视角的(“Personal”),反之则被称为不具有个人视角的(”Impersonal”)。在这类作品中,我们可以很恰当地将读者/用户称为“玩家”。
注意这里的个人视角的概念,与传统文学分析中第一人称的概念没有直接对应。一件作品可以以第一人称视角来叙事,但读者/用户在其中并没有任何机会站在主角的立场作出任何机制性的决策,这个时候它仍然是不具有个人视角的;同样,一件作品也可以以上帝视角来叙事,但读者/用户在其中却能够有机会为角色命运作出策略性选择。
5. 访问(Access)
一件文本作品如果所有的剧本元在任何时候都是完全开放的,我们就将这件作品称为“随机访问的(Random Access)”,反之,我们则将这件文本作品称为“控制访问的(Controlled Access)”。传统纸质书是随机访问的典型例子,因为读者能够在任何时候阅读任意一页的内容;文字冒险游戏则是控制访问的典型例子,因为读者/用户能够读到的语词内容是受游戏进程控制的。
6. 联结性(Linking)
联结性描述文本作品文本模块之间的联系。根据读者/用户从一个文本模块跳转到另一个文本模块的可能性,可以将文本模块组织成一个网络结构,其中能够相互跳转的文本模块互相联结。当一个作品拥有一个明显的这样的联结性结构,并且相互联结的文本模块间的跳转关系是无条件的(任何情况下都可以跳转),这个作品就被称为是“显式联结的(Explicit)”,典型的例子包括大多数超文本小说,其中的超链接结构同时也形成了文本模块的联结结构。
解谜文字冒险游戏《极限脱出:善人死亡》中的故事模块连接结构
有时候,作品中虽然存在相互联结的文本模块,但一些文本模块间的联结关系是有条件的。比如,在一个文字冒险游戏中,要求玩家必须拥有某个物品,才能跳转到特定故事模块。这样的作品被称作是“条件联结的(Conditional)”。
战棋角色扮演游戏《北欧女神:负罪者》中的故事线不是根据简单的文本选择支发生分歧,而是根据玩家在战斗中的行为(使用了多少次女神之羽)
也有可能在作品中就无法找出相互联结的故事模块的这样的结构,这样的作品被称作是“无联结性的(None)”。
7. 用户功能(User Function)
用户功能描述读者/用户的输入在将文本元转化为剧本元过程中所起的作用。如果读者/用户无法通过与文本信息系统的交互对输出的剧本元产生任何影响,则我们称这类文本作品中的用户功能是“诠释性的(Interpretative)”,因为这类作品中读者/用户得到的语词通信内容是给定的,他们唯一能起的作用就是去诠释得到的内容的含义。
如果读者/用户不能改变作品的文本元,但能够决定或至少影响到呈现在他面前的特定剧本元,则我们称这类作品中的用户功能是“探索性的(Explorative)”。因为此时读者/用户可以说是在所有可能呈现在他面前的剧本元形成的空间中进行探索。大多数超文本文学中的用户功能是探索性的。
如果读者/用户不能改变作品的文本元,但能够通过与文本信息系统的相互作用让原本不能出现的剧本元变得可能出现,即“创造”出剧本元,则我们称这个作品的用户功能是“配置性的(Configurative)”。因为用户能够对剧本元的结构进行配置。
如果用户甚至可能改变作品的文本元或者语词内容提取规则,我们就称这个作品的用户功能是“文本元性的(Textonic)”。
我们用下面这个表格来总结作者提出的描述文本作品的七个变量及各自的取值范围。
综合考虑这七个变量的取值,一共有3x2x2x2x2x3x4= 576种可能的组合,意味着理论上说,我们可以将文本作品分为576个类别。也就是说,这七个变量定义了一个文本作品的分类系统。
下面,我们来看看在第一章中谈到的那些制动文本作品,各自在这个分类系统下的分类。
需要指出的是,在所有我们能想到的文本作品的分类系统中,我们不能保证作者提出的这一个分类系统就是最准确、最没有争议、最具代表性的那一个。在前面对于七个变量的介绍中,有的读者可能注意到一些变量或变量取值的定义并不是就那么客观清晰(例如对“个人视角”的定义),也因此在读到作者对具体文本作品的分类判定时,可能会出现我们不同意作者在某个变量取值上的说法的情况。
作者自己也承认,这套分类系统完全可能存在这些问题和局限性。但比起这套分类系统本身更重要的是,基于这套分类系统,作者对当时具有代表性的二十三件文本作品运用了对应分析法(Correspondence Analysis)进行分析,以量化的统计方法得到了很有启发性的结论。下面我们就来讨论作者的分析方法。
对现存文本作品的相关性分析
对二十三件文本作品进行分类,我们可以得到一个表格——其每一行代表二十三件文本作品之一,每一列则代表描述文本通信的七个变量之一,因此表格的一个单元格就代表行数对应的文本作品在列数对应的变量上的取值。
如果每一个作品是一个数据点,每一个变量是一个考察数据的维度,我们这里就有七个维度,每一个数据点有七个维度的坐标。这么高的维度是很难用直观的图表进行可视化的。
因此作者对二十三件文本作品进行分类之后,使用统计学中一个常用的数据分析方法对应分析法(Correspondence Analysis)对得到的分类结果进行了分析。对应分析法的作用是将高维空间中的数据点降维到二维或三维空间,使得数据点能够在二维或者三维坐标系下进行可视化表示,由此直观看出数据点的相关性和差异。
这种降维通常会造成信息损失,但通过精心选择最后降维到的那两个或三个坐标轴,能够保证保留尽可能多的信息。这两个或三个坐标轴不再是原本的七个坐标轴中的某两个或某三个,而是原本的七个坐标轴按某种方式组合得到的结果,因此降维后的坐标轴的含义是很难解释的。
但是,通过降维之后用图表进行可视化,我们能够得到关于数据点各自相似程度的直观表示。下图就是作者降维到二维坐标(丢失51%的信息)之后得到的可视化散点图,图中每个点代表一个文本作品:
可以看到,作品相对均匀地分布在四个象限——如果我们认为作者选择的二十三部作品具有充分的代表性,那么样本点具有均匀的空间密度,体现出作者的这套基于七个变量的分类法是能够公正地将多种多样的作品区分开的。
样本点的整体轮廓来看大致构成一个三角形。西北象限除了Eliza都是文字冒险游戏,东北象限大多数是超文本文学和交互小说,西南和东南象限则没有明显的主流特征。作为样本数据点的二十三部文本作品有十部是基于纸质媒体的,如果我们在上图中将基于纸质媒体的作品和基于电子媒体的作品分别标出来,我们就得到下图:
其中在虚线附近的是基于电子媒体的作品,实线附近的则是基于纸质媒体的作品。可见,实线和虚线各自圈出的区域并没有在空间上形成两个分割的区域,而存在很大一部分交集。作者由此得出结论:至少在我们这里采用的文本作品分类体系下,没有证据表明纸质媒体和电子媒体上的选择会造成作品内在特征的巨大差别。
但是我们同时注意到,全部数据点构成的大三角形的左下角由电子媒体统治,右下角则被纸质媒体统治。通过进一步分析,我们发现左下角的作品大多具有配置性的用户功能、在动力学上属于文本元动态、并具有时效性,而右下角的作品则大多是随机访问和静态的作品。因此,我们可以在统计意义上说,配置性用户功能、文本元动态和时效性的组合多见于电子媒体,随机访问和静态多见于纸质媒体——但这只是统计规律,并不意味着反例是不存在的。
通过分析散点图,我们也能发现七个变量在概率上并不是完全独立的:个人视角和条件联结常常同时出现在一部作品中,而探索性的用户功能和无联结则很少在同一部作品中一起出现(但也有反例,比如图像诗)。这些变量之间的关联一方面允许我们在已知一部作品的一方面属性的情况下预测它其他方面的属性,另一方面也允许我们通过刻意组合很少共同出现的变量取值来寻找创新的方向。
我们在第二章的读书笔记中提到过,制动文本更多地是一种看待作品的视角,而不是提出了一类全新的作品。作者在这个数据分析中考察的作品,也包括了一些更接近传统意义上的文学作品,而似乎不是很值得被看作制动文本的作品。通过观察这里的散点图,我们发现,在水平坐标轴(Axis1)越靠左(取值越小)的作品,似乎越是合适被看作是制动文本,越靠右的作品,则越接近传统意义上的作品。
通过观察这些作品,作者建议将那些“在从文本元到剧本元的转化过程中涉及到计算(Calculation)”的作品,称作是制动文本。这当然不是一个非黑即白的界限,因为“计算”有许多形式和程度。因此一件作品究竟是不是制动文本,也需要参考讨论的语境和比较的对象。
这一章中,作者使用一种先验理论框架与后验统计分析的结合的方法,拿出了一套能够同时容纳传统文学作品和制动文本的文本通信世界版图,并通过观察这个版图得出了不少有趣的结论。
其中在我看来最有趣的一点,就是作者认为“计算”是决定一部作品是否值得称为制动文本的关键性要素。这是一个定性的描述。那么,如果我们要进一步定量化,提问是计算这个范畴下的什么量度决定一部作品有多值得被称为制动文本呢?
在计算机科学的领域,我们有复杂性理论,它让我们得以用精确量化的方式去描述一个算法的“复杂度”。那么,在制动文本的领域,我们是不是也能够提出类似的理论,用精确量化的方式去描述一个文本信息系统的“制动度”呢?
当然,制动文本领域的这个问题一定会比计算机科学领域的复杂度问题更难回答。因为在计算机科学领域我们只需要用量化的方式描述单个图灵机的行为,而在制动文本的领域,我们却要用量化的方式描述由多个机器和多个人所组成的一个系统的行为。计算机科学领域的复杂性理论,看起来就像是(那个还不存在的)制动文本复杂性理论的一个简化无数倍的特例。
厌氧菌的故事工程学实验室