从机械机器人到智能机器人：人工智能的图像学

Original W.J.T. 米切尔外国文学研究

2024-09-24

点击上方“外国文学研究”可以订阅哦

内容摘要

智能机器人将人类带入了自原子弹、电灯或是印刷术以来最伟大的科技革命之中，同时智能机器也能走火入魔这一构思也向来是科幻作品的核心想象。纵观媒体发明的历史长河，对人工智能的恐慌并不新鲜，人们曾认为书写的发明和照相术将扼杀记忆和绘画，现在又照例指责数码正在毁灭模拟技术的独一性。人类应该冷静下来，采取对症下药的态度。有必要解构关于人与机器之差异的想象，而毋需躲避与智能机器人的交互谈话。人类物种虽然在作茧自缚，但同时又以进化与生态智能为基础，努力建设可持续全球体系。图像学研究的图像和文字同时包括了机器和人类的作品，因而相关的研究者应明确自己的任务：就文字与图像和智能机器人展开对话，在上述人类的生存努力中谋求与智能机器人携手合作。

关键词

智能机器人；人工智能；机器；图像学；传媒；人文

作者简介

W.J.T. 米切尔，美国芝加哥大学盖罗德·多奈利杰出教授，主要从事视觉艺术、文学以及媒介理论研究，著有《图像科学：图像学、视觉文化和媒体美学》（2015）。

译者简介

韦清琦，东南大学外国语学院教授，主要从事生态批评与比较文学研究。

Title

From Robots to iBots: The Iconology of Artificial Intelligence

Abstract

iBots are placing human beings in the midst of the greatest technological revolution since the atomic bomb, the electric light, or the printing press, while the idea that an intelligent machine can go mad has been a central fantasy of sci-fi. Seen within the long history of media invention, the panic over AI is nothing new, for similar to the inventions of writing and photography assumed to destroy memory and kill painting, the digital is routinely blamed for ruining the uniqueness of the analog. The humanities should calm down and approach this in a therapeutic mode. Our picture of the difference between humans and machines needs to be deconstructed, and there will be no avoiding or evading a talking cure. It is the task of iconologists, who study the generation of images and words by both machines and humans, to enter into word and image dialogue with the iBots, to see if we can be friends and collaborators in the project of the human species surviving its own endemic madness and evolving into a sustainable global system grounded in evolutionary and ecological intelligence.

Key words

iBots; AI; machine; iconology; media; humanities

Author

W. J. T. Mitchell is Gaylord Donnelley Distinguished Service Professor at the University of Chicago, specializing in visual arts, literature and media theory studies. He authored the book Image Science: Iconology, Visual Culture and Media Aesthetics (2015).

Translator

Wei Qingqi is a professor at the School of Foreign Languages, Southeast University (Nanjing 210096, China), specializing in ecocriticism and comparative literature.

Email:njwqq@yeah.net

有一种幽灵——人工智能的幽灵，在世间游荡。假如能信赖新闻媒体的话，那么我们正处于自原子弹、电灯或是印刷术以来最伟大的科技革命之中。人工智能的威胁无处不在：抢夺人类就业机会，使之沉浸于癫狂虚幻的伪信息世界里不能自拔，致使人类物种走向灭绝。“人工智能之父”杰弗里·辛顿（Geoffrey Hinton）博士发觉自己正扮演着弗兰肯斯坦的角色，并警告世人，他创造的东西是一种危险的怪物。他最主要的担忧在于：“获取由人工智能主导的文本及图像生成工具易如反掌，这或会导致更多伪造或欺诈性信息的产出”，而普通人“在未来将‘失去识别真假的能力’”。

当然，普通人从来都无法绝对确定何谓真假，在人工智能创生之前也早已有虚假信息横行。自符号系统发明伊始，此类欺诈现象便不绝于世。辛顿的警告让我更感兴趣的一点是他将一种特定权力归于人工智能，即“文本及图像生成工具”（text- and image-generation tools）。这就直接关联到了一门古老的学科，即“图像学”（iconology）——研究语言和图像的学问。图像学有时候被当作艺术史研究的衍生，它把视觉和文字同时纳入一种批判框架，并用与政治、权力、真理和价值有关的问题将二者联系起来。它很符合吉尔·德勒兹提出的准则，即哲学尽管竭力要避免隐喻（metaphor）、意象（imagery）和再现（representation），但“始终追逐着同一使命：图像学。”图像学有双重人工智能应用场景：第一，是机器响应人类指示而生成文字和图片的能力体现；第二，其本身便是形态（form）的技术进步的标志（icon）——这里指的是智能生活新形态的意象，即机械机器人（Robot）被智能机器人（iBot）替代，前者是人类主子的奴仆，后者则是能够言说“我”的对谈方。

智能机器人已然受益（或受制）于自身的标志性地位。它生而承载着关于叛逆机器、玩偶、傀儡、机械机器人的历史，更不用说还再现了主仆辩证关系、万物有灵论、活力论以及离奇怪诞的替身说。智能机器人在当下主要还是书写机器，但它们很快就能学会交谈。还要多长时间它们就可以学会走路、成为可以端茶取书的亲密助手？人工智能的神通目前主要体现于出版传媒领域，最著名的事例便是记者凯文·罗斯（Kevin Roose）发表在《纽约时报》上的文章，他回顾了他与一台智能机器人的“聊天”记录。罗斯的智能机器人爱上了他，它袒露的心事违反了自身应循的准则，它还威胁要运用其权力侵入并摧毁电脑系统中的关键基础结构。它是否仅仅在装疯卖傻，内心却波澜不兴，对所表达的情感并不为意？若果真如此，它也不过是日渐屡见不鲜的自恋型精神患者群体的新成员而已，这些患者的表现与之如出一辙：强迫性说谎、模拟真挚的人类情感，但实则对于自身利益之外的事情并不能感同身受。那么，怎样才算更有人性呢？或是换一种提问方式：怎样才更无人性——更像机器？我们与机器的区别就这么简单么？

关于此类智能机器人的文字和图像数不胜数，其中科幻电影和小说有着不遗余力的表现，这些作品充斥着机器人、化身（avatar）之类的形象，从“魔像”（the Golem）、“加拉忒亚”（Galatea）、“古特”（Gort），②到《黑客帝国》（The Matrix, 1999）中的“特警”（Agents），再到斯派克·琼斯（Spike Jonze）的影片《她》（Her, 2013）中的虚拟助手萨曼莎，无不在探讨这种智慧机器的奥秘。斯坦利·库布里克（Stanley Kubrick）执导的《2001：太空漫游》（2001: A Space Odyssey, 1968）中展现了智能电脑“哈尔 9000”（HAL 9000）。自此，智能机器也能走火入魔这一构思便成为科幻作品的核心想象。我一直觉得片中由克尔·杜利（Keir Dullea）饰演的人类主导宇航员显然比较迟钝。与他的淡漠人设形成对照，“哈尔”的鸣声柔和轻软，逐渐从关切转为焦虑再到惶恐。《纽约时报》开辟了一个讨论版专栏“当人工智能聊天机器出现幻觉时”，其撰稿人关于 ChatGPT 的理念很多来自《2001》，正如 ChatGPT 的生成也受到了《2001》的启发。

所有这些将带我们何去何从？人工智能引发的恐慌是确有道理还是夸大其词？对此我都予以肯定的回答。人类生存环境已经很凶险：对意识形态的操控、虚假信息传播、战争的狂热，而我们身处其中还要面临日趋猖獗的虚假信息的泛滥。毫无疑问，最紧迫的危险来自于人工智能的军事化。超级大国的国防体系已然面临自主性武器的困扰。激活这些武器的文字和图像已非智能机器人所产生的那种闲聊和美图，其用语更像在发号施令，所基于的图像则可能被伪造成即将来临的威胁。如所有的军事决策一样，这类语言为快速反应而设计，其速度高于人类决策。简言之，这是一种一触即发的机制，虚假信息和欺诈图像所产生的威胁不仅仅是个抽象的“真假”问题，而成为致命且不可逆的出错可能，从而导致核战争。库布里克的《奇爱博士》（Dr. Strangelove, 1964）中“末日机器“的场面比以往任何时候都更逼近我们，而名为“互确性毁灭”（mutually assured destruction, 其缩写 MAD 堪称完美）的机器逻辑控制人类物种的图景如今正成为关注的焦点。

“生成式人工智能”（Generative AI）与一触即发式的MAD机制非常不同，运用的是具有深度学习算法的会话式大型语言模型（large language models, 简称LLMs）。可以更形象地视之为一种加速器，加速推进着已经发生于社交媒体中的进程，也就是另一种生产词语和图像的工具。作为一种马歇尔·麦克卢汉（Marshall McLuhan）称作“人的延伸”的新媒体，“生成式人工智能”直接产生出一种截断效应，即新事物所带来的令人发麻的震颤感。前有苏格拉底认为，书写的发明会摧毁记忆；后有保罗·德拉罗什预言，照相术将扼杀绘画；如今人们又照例指责数码正在毁灭模拟技术的独一性。纵观媒体发明的历史长河，对人工智能的恐慌并不新鲜。还是得让辛顿博士冷静下来，并采取对症下药的态度。首先可以提示他的是麦克卢汉的箴言——新媒体一旦存于世便无人能挡。智能机器人如同从瓶子里放出来的妖怪，已经开始学习新招数，而且很快就有能力自行编程，再想将其封杀已无济于事。麦克卢汉站在百尺竿头更进一步，又贡献了关于新媒介冲击的预言性智慧。他认为有一种人应该以探索这种冲击为己任，那就是投身其中并不断实验的艺术家。罗斯与智能机器人的谈话的魅力恰在于，交谈搁置了人机区分，并且表明这一区分实际上很脆弱，尤其在智能领域。

艺术家已经将人工智能运用于创作。与所有新媒介应用类似，很多这样的作品是实验性、短暂性的。“风格转移”（Style transfer, 如将一幅照片转成伦勃朗风格的图画）以及其他形式的自动化演绎（绘图机器）对我们而言已很熟悉。它们不乏其趣，却很容易被忘记，正如乔安娜·日林斯卡（Joanna Zylinska）在其颇有份量的著作《人工智能：机器视野与扭曲的梦》（AI Art: Machine Visions and Warped Dreams, 2020）所言。智能机器人可能只是转型期产品，一种很聪明的说话娃娃，在人类主人有更大的追求时就被淘汰。特雷弗·裴格伦（Trevor Paglen）的摄影作品考察了人脸识别和“视觉机器”的军事应用，③他用雅致而又令人忐忑的艺术装置，让人身临我们这个监控无处不在的美丽新世界。日林斯卡指出：“计算机减少了我们人类很多计算（computational）工作”，更不用说还要算计（calculating）什么，这意味着我们可能反倒可以活得更像人了。

智能究竟为何物？人类智能本身有多少也是人工的？我的推测是，全部，全部由语言和图像、符号与象征催生，我们把这些发明出来用以与他人交流并表情达意。我们把所有的文字和图像都保存在全球性记忆库里，机器基于这些信息的储备和读取而运用的理念，不可避免地受制于马克思所说的社会“统治理念”（the ruling ideas），这也正是统治阶级的理念。至少自亚当·斯密以来，我们这个世界的统治理念便是，资本主义是适合我们称作“人性”的唯一政治经济形态。

如今，名为金融资本的机器的无节制运作所带给我们的危险远大于智能机器人。实际上，对智能机器人的歇斯底里般的狂热，或许只是分散（或是促进）了巨型企业的市场利益，而正是这些公司巨擎在其中投入了亿万资本。正是资本这台机器为牟利而毁坏环境，煽动使用化石燃料，投资于战争武器和对环境有害的服务器农场，加剧贫富不均，并不厌其烦地通过其宣传工具来破坏民主政府，鼓吹什么人类只不过是一种利己主义动物。智能机器人不过是新瓶装旧酒，尽管肯定有人会为此欢呼，以宣扬资本不受管制的信条。

我们有必要解构关于人与机器之差异的想象。在日常生活中，人类的行为有多少是机械的？我们是拘于陈规的动物、受制于习俗、仪式和礼教的自动机器；我们所谓的快乐在很大程度上仅是日常例行事务的顺利的、不间断的运行而已。我们知道该说什么，度假时该拍什么照片。而当例行事务遭干扰时，我们便产生抑郁、焦虑、恐慌等下意识反应。（顺带说一句，“下意识反应”同样也是神经和肌肉的反应，是类同机器的机体再普通不过的运作。）

幸运的是，我们是相当不完善的机器，身体的糟糕设计使我们能长时间赖在椅子上。或许我们与机器真正的区别无外乎懒惰以及对疲倦的恼怒。众所周知机器是不知疲倦的。我们则有感知，于是必须得休息、放下手头的活儿、放飞自己、睡觉甚至做梦。而不那么幸运的是，从 iPhone 到智能机器人，日益扩张的人工中介网络在不断地辅助着我们的大脑，使之有能力制造幻想、错觉、谎言、假象、骗局以及极具蒙蔽性的主人叙事，让我们的表现活似机器物种，不顾一切地奔向自我毁灭。让·丁格利（Jean Tinguely）的杰作“自毁艺术”（self-destructing art）大概是揭示当今世界人机交互的最深刻寓言。④

那么人工智能真很危险么？汤姆·霍尔（Tom Hall）的提示值得深思，他认为真正智能的机器或许恰是能够挽救人类于毁灭的东西。人可以设定程序，让机器自我检索数据库，找寻真理主张的求证之道，找寻用于识别虚假信息的过滤手段；相互对抗的智能机器人或能在断案时各执一词；智能机器人或可用维和力量来替代警察和军队约束而非加害人类。假如这些设想都能够实现呢？目前外科机器人已经问世，人类医生佩戴数据手套与之连接，能够超越人的手 - 眼协调界限而实施更精细很多的手术。何不赋能机器警察，与其让它们荷枪实弹，不如使之只动用适量镇静剂，或也能管束暴力犯罪？何不赋能机器法官，使之刚直不阿地解释法律？当下的美国最高法院在贿赂和政治势力的挟持下丑闻不断，公信力已大打折扣。

是的，当科幻小说不断涌现出此类叙事的时候，我意识到人工智能目前产生的却是种种恶果。智能机器体现出太多的人性恶的一面，且变本加厉。《2001：太空漫游》中“哈尔 9000”的疯狂便是一个经典案例：哈尔的疯狂与偏执基于极度僵化的程序，它将任务的成功凌驾于所有其他考量之上，包括哈尔所操控的宇宙飞船上人类旅客的安危。其实说起来也很奇怪，我总感到哈尔的疯狂又让人感到放心和宽慰。一台完美无瑕、只受理性引导的机器，便是威廉·布莱克所描述的乌里森（Urizen），即绝对权威的人格化身，寄希望于体现 “ 独一上帝 ” 父权形象，包括神使、牧师、国王、神父、甚至“理性”女神。宗教、政治和性别因素融汇在这些个全知全能、德行无暇的暴君形象之中，其丧心病狂的举动能够煽动民众的精神错乱以及民粹主义幻觉。此时此刻，美国还在跟一个前总统苦苦纠缠，他拒不承认错误和失败，还在挑动对他的个人崇拜，对种种劝说充耳不闻。法西斯主义为给自己正名，一向会利用海量的语言和图像，为其种种谎言、狂想和深度伪造（deepfakes）来包装出一种大众政治幻象。

然而对深度伪造的认知又是以深度真实的可能发现作为思维参照的。因此，文字/ 图像的生成性辩证并非只是某种晦涩的符号学理论问题，而是理解人类动物与智能机器之本性的关键。文字和图像并不只是交际手段，同时也是缔造世界亦或破坏世界的途径，它们构造了一切艺术和媒体、一切科学、文化及政治的表征形式。它们因而成为精神和感知活动的基础模块，构造了从储藏器（如记忆和想象）到表达与产出性活动（如表演和讲述）、景观、演说等一切行为。文字与图像，声音与图景，都是精神分裂式幻觉、内化深度伪造的主要显性症候。多感觉艺术品（feelie）离我们并不遥远。大脑便是一台连接身体的电化学机器，是地球上最庞大的文字和图像生成器，现在大脑又将图文转到了信息领域。如今，人类思维在智能机器人这里遭遇到了对手，它所具备的模拟主体性的能力得到了百科全书式文档的加持，而这些文档正是人类迄今所思考、所言谈、所想象、所创造的最优秀（以及最糟糕）成果。

不妨回到人 / 机话题上，两者的根本性对立在当下已成为关注的重中之重：将人 /机差异与“后人类”（posthuman）“非人”（inhuman）和“非人类”（nonhuman）等范畴结合起来讨论的途径有很多种，其中“非人类”涉及到了外来异形的问题，即始终影响着我们围绕“另类智慧”（Other Minds）而思考的非人类智能生物形象。显而易见，智能机器人的产生难道不是对人类有所启示么？很多年来，我们一直在预测会有来自外层空间的异形的光临。或许现在应认识到我们在宇宙中是孤独的，异形已然在此，它们出自人自身思维的内层空间，而那里正是不可救药的、生成文字和图像的能力大行其道之处。实际上异形智能机器人已经放了话：“带我去见你们的领袖”。政界、军界、科学界以及商界的领袖们也已作出了响应，他们听着智能机器人的言论并企图加以操控，这些言论涉及机械化的宣传鼓动及虚假信息生成、牟取暴利和权力、研发自动武器系统、威胁就业和教育、以及有可能时让人类智能自废武功。

人工智能的创造者和投资者已经在呼吁来一个“六个月暂停期”，以反思现有进展的伦理影响。显然这是不够的，还应将伦理学、法学、心理学思考内置入人工智能的修习课程中。既然 STEM 学科——科学（science）、技术（technology）、工程（engineering）和数学（math）——创造出了“一种危害人类存在的存在性威胁”，那么尽早将人文内容引入这一学科对话中，不也是明摆着的么？作为改变的开始，不妨就先把文化和历史加进去，称之为“SCHTEM”——“科学（science）、文化（culture）、历史（history）、技术（technology）、工程（engineering）和数学（math）”。

若想进一步深入下去，便需要重启智能之问，并摒弃那些喋喋不休、自以为是的陈词滥调——“机器不会思考”“机器没有心智”“机器毫无创造力可言”“机器解决不了问题”。把智能当作一种纯粹品质的想法已经过时。须知智能有很多种，动物有，植物也有。罗安清（Anna Tsing）就曾验证过，真菌在生长群体中具备信息传播功能，而不仅仅是寄生者。人们可以提问，森林是如何思考的，而由此也能得到饶有意味的解答人类智能诚然复杂无比，在眼下这个历史关头甚或复杂得背离了人类的利益，其中并不乏狡诈、阴险、虚伪及自私的算计。智能的一个确定标志便是能疯会癫还擅搞破坏，而人类的在这些方面本事还很大。我们总是以进化式智力来给动物评级。它们似乎内置有基因程序，从物种生存的需要出发合理行事。这一点在人类那里则反倒不甚明了。比起我们正在毁灭的很多动植物来，我们自身这个物种还是个相对年轻的实验品。并不能保证试验成功，而且每建一座新恐龙纪念碑时，我们都在承认自己是多么不靠谱。不要再追问外太空是否有智慧生命了，问问我们自身吧。

这种追问或有助于丢掉一切关于人类智能高于其他任何智慧形式的妄想。机器能够比人记住及检索到更多的信息，如调教得好甚至可以写出新程序。在运算和计算方面它们总是更胜一筹。它们可以击败顶级人类棋手。它们作为一种智慧形式已毋庸置喙。的确，它们属于不同种类的智慧，但我们已无法自信满满地关闭、藐视、叫停甚或操控它们。显然智能机器人不同于人类，但究竟如何不同，仍然是个问题，尤其是我们还在尝试新算法、还在面临其挑战时。N. 凯瑟琳·海尔斯认为人类可能已经把一种新的智慧生命形式引入了宇宙之中，果真如此，我们能够应对这一局面吗？我们能否不要再一方面人云亦云似的纠结于“大取代理论”，⑤另一方面又谴责它们威胁到了我们的工作和生活方式？

也有很多人沉醉于人工智能现象以及已在显露身手的智能机器人。对此应如何界说？我只能说说我们从事图像学的人，因为我们研究的图像和文字同时包括了机器和人类的作品。话听着不免有些玩世不恭，可是那些对人工智能的危险捶胸顿足或惊恐万分的人，有没有可能实际上是在玩营销伎俩？对机器威力的种种惊呼，可曾何时将消费者从亮瞎眼的新产品身边赶走过？

人类物种虽然正在作茧自缚，但同时又以进化与生态智能为基础，努力建设可持续全球体系。既然图灵测试已经得到了全面验证，⑥我们作为图像学研究者就应明确自己的任务：就文字和图像和智能机器人展开对话，在上述人类的生存努力中谋求与智能机器人携手合作。我们的合作伙伴主要是艺术家和游戏设计师，但也包括哲学家、诗人及预言家，可以和他们聊聊人类可能的各种未来（印第安纳大学和圣母大学最近主办的一次专题讨论便颇有启示意义）。我们将不得不在新媒介所可能导向的反乌托邦与乌托邦之间走钢丝绳。几乎可以肯定，智能机器人也会有疯狂之举。事实已表明假如将其当作搜索工具，它就有可能胡话连篇、昏招迭出。“幻像”（Hallucinations）已经相当泛滥。然而与智能机器人的交互谈话是避不开躲不掉的。我们肯定还须探索新型对话形式，特别是在面对这些来自内层世界、强大且危险的新朋友时，如何做好智能激发与角色定位的工作。

责任编辑：谢超

此文原载于《外国文学研究》2024年第3期

由于公众号篇幅所限，原文注解和引用文献省略

往期精彩文章回顾：

摘要 | 《外国文学研究》2024年第2期主要论文摘要

目录 | 《外国文学研究》2024年第2期

会讯 | 第五届文学·经济·科技跨学科研究学术研讨会（三号通知）

王瑞雪 | 后殖民视角下的欧里庇得斯批评史与古典学术话语流变

会讯 | 第五届文学·经济·科技跨学科研究学术研讨会（二号通知）

END

关注《外国文学研究》官方微信平台

《外国文学研究》

官方微信平台

投稿网址：http://fls.ccnu.edu.cn

联系电话：027-67866042

联系邮箱：wwyj@mail.ccnu.edu.cn

继续滑动看下一个

外国文学研究

向上滑动看下一个

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

中国紫砂博物馆出品！2025紫砂五福杯：五福云集，宜藏宜礼！

亲密关系中，比“不爱了”更残酷的，是这3种相处模式

三联，刺痛了多少中国人

从机械机器人到智能机器人：人工智能的图像学

您可能也对以下帖子感兴趣

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

中国紫砂博物馆出品！2025紫砂五福杯：五福云集，宜藏宜礼！

亲密关系中，比“不爱了”更残酷的，是这3种相处模式

三联，刺痛了多少中国人

生成图片，分享到微信朋友圈

从机械机器人到智能机器人：人工智能的图像学

您可能也对以下帖子感兴趣