Norbert Wiener 行为,目的与目的论 Behavior, Purpose and Teleology (1943)
阿图罗·罗森布鲁斯(前排中央)诺伯特·维纳(前排左二)朱利安·毕格罗(前排左一)
编者按
诺伯特·维纳(Norbert Wiener)毫无疑问是天才,而他并非仅仅是所谓的「科学家」,而是从小就有非常全面,专业且深入的哲学关切与教育:「按照维纳自己的说法,他10岁时完成的第一篇哲学论文《无知理论》就讨论了所有知识的不完整性,这成了他终生坚持的理念。」而他在18岁就获得了哈佛大学有史以来最年轻的博士学位(数理哲学),罗素,怀特海是他的老师,在哥廷根也跟随希尔伯特学习,选修过胡塞尔的课程。
但当你尝试阅读这篇1943年发表在《科学哲学》的刊物上的文章时,你会发现维纳的语言与逻辑的精确与清晰,并且遵循他父亲对他影响的「对一切虚张声势和卖弄知识的痛恨」,读这样清晰的哲学论述是一种享受。
介于本文单刀直入、简洁精巧的行文方式,在此有必要补充本文的写作语境及其的重要意义。
该文脱胎于阿图罗·罗森布鲁斯(Arturo Rosenbluth)在1942年第一次梅西会议上代维纳宣读的报告(本次会议的主题是「大脑抑制会议」Cerebral Inhibition Meeting,尚未涉及控制论领域,参会者以心理学、生理学领域相关学者为主),报告中介绍了信息、反馈的概念,以及「他和维纳和毕格罗共同发现的存在于电子设备、自动机器和人类神经系统行为之间的形似性。」
而这份报告又可以回溯至维纳和朱利安·毕格罗在二战期间为美国军方开发的对空火炮控制系统,维纳在在开发中发现了人类行为对电路与机械系统的影响,因此邀请哈佛医学院的阿图罗·罗森布鲁斯来解决防空火炮系统中「纠缠不清的物理、神经生理学问题」。
通信工程和神经生理学的跨学科研究形成了控制论的基本框架。文中提出的「反馈」概念超越了笛卡尔式的二分法,将所有「行为」一视同仁(不论是身体的还是心理),这成为后来信息通信、人机交互学科中的基本概念。
今天在互联网,电子游戏中使用「反馈」一词,这样耳熟能详的词语与背后的诸如「闭环」的黑话逻辑,人机交互的基本思考,这毫无疑问就来自于维纳,是维纳赋予了反馈(feed-back)以现代的意义,而这无论是在今天的日常语境,计算机交互,或甚是电子游戏的基本设计的概念中,这种思考模式早已深深地融入其中:
(Steve Swink: Game Feel: A Game Designer’s Guide To Virtual Sensation)
这篇文章在《维纳传》中被这样描述:
「在这篇只有6页的论文里,维纳和他的同事提出,自动机器、电子计算机以及有生命的神经系统的复杂工作原理,都可以用通信科学统一的视角进行研究。他们正式宣布,他们的科学框架提供了一种全新的方式,可以审视无所不在的通信和控制过程,包括智能机器、人类和所有生物,所有这些非凡的实体都是通过受负反馈和循环因果逻辑支配的有目的性的行为来实现它们的目标的。
……这是通信革命的第一个宣言,提出了一个真正具有煽动性的东西,即一种理解通信和控制过程新王国的替代系统,这些过程本质上是有目的性的、以目标为导向的、是目的论的。他们使用了「目的论」这个比「目的」更激进的术语。这个词可以追溯到古希腊,出现在维纳小时候在父亲办公桌底下阅读的古典文本中。在亚里士多德的《物理学》中,除了可以解释事物的存在和行为的纯粹物理原因,还存在着事物的目的性,或者叫作「终极因」(希腊语的telos是「终端」「目标」的意思)。和维纳一样,亚里士多德认为,目标是首位的。目的高于一切,它是最高形式的善,「因为成为目的就意味着是事物中最好的,是所有其他事物的目标」。(《维纳传》)
有理由可猜测,海德格尔1949年在《技术的追问》(Die Frage nach der Technik)开篇所提及亚里士多德的「四因说」中的对目的的强调与重提深深受到维纳等人的影响,而也从这个视角下更可理解其将「控制论」视作「哲学的终结」。
四因说指的是谈论某物得以产出的原因:亚里士多德将其分为质料因(causa materialis 材料)/形式因(causa formalis 质料最终的形态)/目的因(causa finalis 目的上的考量)/效果因(causa efficiens)。
海德格尔指出了人们对目的因的忽略:
人们习惯把原因看作起作用的东西,取得效果、成果,所以 效果因 causa efficiens 以决定性的方式规定着所有的因果性。对于效果的追求如此重要,甚至我们不再考虑目的因。
他用银盘用作解释,作为质料的银是如何与形式共同起作用的,不过最主要的还是第三个东西:目的,将其定义为祭器(这个目的起到了很重要的效果,实际上是某种界定者/终结者,但这种终结并不是停止,而不如说,此物由之而来才开始成为它在制造之后将变成的东西)
而「推动和引起……那只是因果性整体中的的一种次要原因。」,而事物的被带出,实际上是四种原因同时「招致」并且引发(Veranlassen)的。
海德格尔的核心关切与维纳等人的思考是契合的,正是在于重新回到四因说并且强调一种新的「因果」理解,只有在这个意义上,我们才可以理解何为产出(bringing-forth)。这篇文章所开启的一种新的理解与后续的控制论整体的历史意义,再怎么强调都不为过。
叶梓涛
大目妖(樊昌林)
Arturo Rosenblueth
Norbert Wiener
Julian Bigelow
阿图罗·罗森布鲁斯Arturo Rosenblueth
1900年10月2日-1970年9月20日
医生、生理学家、控制论学家
1900年出生于墨西哥城,青年时代求学于柏林和巴黎,1927年回到墨西哥城,从事生理学教学和研究。1930年进入哈佛大学生理学系,成为生物学家沃尔特·坎农(Walter Cannon)的学生。1933年起与诺伯特·维纳(Norbert Wiener)相遇,开始一同研究工作,专注于“将数学,尤其是通信理论,应用于生理学的研究方法”(维纳日记)。他们成为了美国20世纪30年代跨学科运动的首批支持者。1943年与维纳和毕格罗合作发表《行为,目的与目的论 》,成为控制论学科的重要文本。1944年,罗森布鲁斯成为墨西哥国立自治大学的生理学教授。1961年成为国家理工学院科学研究及高级研究中心主任。期间多次参加了梅西基金会的控制论会议,之后一直致力于神经科学相关领域的研究。并多次从墨西哥回到哈佛,与维纳进一步合作,推动控制论的发展。1970年9月20日在墨西哥城去世。
诺伯特·维纳 Norbert Wiener
1894年11月26日-1964年3月18日
数学家、哲学家和控制论学家
1894年出生于美国密苏里州哥伦比亚,犹太教拉比摩西·迈蒙尼德(1135-1204)的后裔。早年间接受父亲利奥·维纳(Leo Wiener)严格的家庭教育,被誉为「天才少年」。18岁获得哈佛大学博士学位,专业跨度涵盖了数学、动物学和哲学,随后兴趣转向应用数学。
二战期间,维纳为美国军方开发对空火炮自动控制系统。1943年,与罗森布鲁斯和毕格罗合作发表了《行为,目的与目的论》一文,为控制论的产生奠定了重要基础。1946年-1950年间多次参加梅西基金会会议,控制论也在此期间成型,1946年-1953年期间举办的十次次梅西会议也因此被称为「控制论会议」。维纳与沃伦·麦卡洛克(Warren McCulloch,梅西会议主席)和沃尔特·皮茨(Walter Pitz 数学家,计算机工程师)一同组成了控制论的「黄金三角」。
维纳于1948年出版《控制论:或关于在动物和机器中控制和通信的科学》一书,在科学界和工程界引发极大反响,对之后的神经科学、人工智能、计算机科学都产生重要的影响。并因其在产业方面的功效,在世界范围内引起许包括苏联、印度等多个国家政府的关注。但之后维纳开始意识到机器智能和自动化对人类自身的威胁,开始科普控制论和警告公众可能的危险。
1964年3月18日,在瑞典斯德哥尔摩皇家理工学院参观时,因心脏病发作而与世长辞。维纳一生饱受狂躁抑郁症困扰,由此带来的亲密关系问题在一定程度上导致了控制论研究在50年代之后的中止。
朱利安·毕格罗 Julian Bigelow
1913年3月19日-2003年2月17日
数学家、计算机工程师
1913年出生于美国新泽西州纳特利,毕业于麻省理工大学,主修电气工程和数学,并获得硕士学位。第二次世界大战期间协助诺伯特维纳(Norbert Wiener)研究对空火炮自动控制系统。1943年与维纳和罗森布鲁斯合作发表《行为,目的与目的论 》,成为控制论学科的重要文本。1946年,由维纳引荐开始协助约翰·冯·诺伊曼建造 IAS 计算机(又称为MANIAC),对后来的通用计算机设计影响深远。之后多年间在普林斯顿高级研究所担任访问学者。2003年2月17日在新泽西州普林斯顿去世。
翻译:叶梓涛
校对:大目妖(樊昌林)
原文:Philosophy of Science, 10(1943), S. 18–24.
Behavior, Purpose and Teleology
行为,目的与目的论
这篇论文有两个目标。第一是定义对自然事件的行为学研究(behavioristic study),并对行为进行分类。第二是强调目的(purpose)概念的重要性。
给定任何对象(object),从其周遭环境中相对地抽象出来进行研究,行为学方法包括对于对象的输出以及输出之于输入的关系进行研究。
输出(output)是指对象在周遭环境(surroundings)中所产生的任何改变。反之,输入(input)是指对象外部的,以任何方式改变了这个对象的任何事件。
上述关于行为学研究方法的含义的陈述,省去了对象的具体结构和内在组织。这种省略是必不可少的,因为它是行为学研究方法和另外的功能性研究(functional method)方法之间区分的基础。在功能性分析中,与行为学方法相反,其主要目标是所研究的实体的内在组织(intrinsic organization),以及其结构和属性;而对象和周遭环境之间的关系是相对次要的。
从这个行为学方法的定义随之而来的是对行为的广义定义。行为(behavior)是指一个实体相对于其周遭环境的任何改变(change)。这种改变可能主要是对象的输出,而输入则是极小的、关系不密切或无关的;或者,这种变化可能立即可追踪到某个输入。因此,一个对象的能够从外部所能检测到的任何改变(modification),就可被称作行为。因此,如果没有合适的形容词加以限制,这个术语就会过于广泛而无用——也就是说,行为可以被分类。
对行为中涉及的能量变化的考量为分类提供了基础。
主动行为(Active behavior)是指在给定的特定反应中,对象是输出能量的来源。对象能储存由远程的(remote)或相对直接的输入所提供的能量,但输入并不直接为输出供能(energize)。
相反,在被动行为(passive behavior)中,对象不是能量的来源;输出中的所有能量都可以追溯到直接的输入(例如,投掷一个物体),或者此外,对象可控制在整个反应过程中所保持的外部能量(例如,鸟的翱翔)。
主动行为可以细分为两类:无目的的(purposeless,或随机的 random)和有目的的(purposeful)。术语「有目的的」是指该行动或行为可被解释为导向一个目标的达及(directed to the attainment of a goal)——即,指向一个最终状态(final condition),在此状态下,行为中的对象达到了一个明确的与另一个对象或事件在时间或空间上的相关性(definite correlation)。那么,无目的行为就是那些不被解释为导向一个目标的行为。
上面使用的 「能被解释为」(may be interpreted)说法或许会被认为有太大的模糊性,以至于这种区分是无用的。然而,承认「行为可能有时是有目的的」是不可避免的,也是有用的,如下所述:
目的(purpose)概念的基础是对自发性活动的认知(awareness of voluntary activity)。现在,自发性行动的目的不是一个武断解释的事,而是个生理学事实。当我们进行自发行动时,我们自发选择的是一个特定的目标,而不是一个特定的运动。
因此,如果我们决定拿一个装水的杯子并把它送到我们的嘴里,我们并没有命令某些肌肉以特定程度和特定顺序收缩;我们只是触发一个目的(trip a purpose,校注:目的在时间上断裂地出现,并回过头来调动反应让行为导向该目的),而反应随后自动出现。事实上,到目前为止,实验生理学在很大程度上无法解释自发活动的机制。我们认为,这种(解释的)失败是由于这样一个事实:当实验者刺激大脑皮层的运动区域时,他并没有复制一个自发的反应;他触发了传出、输出的通路(efferent, output pathways),但并没有触发一个目的,即,并不是出于自发而做的。
人们常说,所有机器都是有目的的(purposeful)。这种观点是站不住脚的。
首先可以提到的是机械装置,如轮盘赌,正是为无目的性(purposelessness)而设计的。然后或许可以考虑像时钟这样的设备,其设计确实是出于某个目的(即看时间——译注),但它的执行运作即便是有序的(orderly),但并非有目的的,也就是说,时钟的运动并不是朝着一个特定的最终状态的方向而努力。同样,尽管枪可以用于一个明确的目的,但目标的达及并非枪的运作所内在的;人们可以随机射击,故意没有目的性。另一方面,有些机器是有内在目的性的。带有目标搜索机制的鱼雷就是个例子。伺服机制(servo-mechanisms)这一术语正是为了命名具有内在目的性行为的机器而创造的。
从这些考量中可看出,虽然「有目的行为」的定义相对模糊,因而在操作上基本没有意义,但目的的概念是有用的,因此应被保留。
有目的的主动行为(purposeful active behavior)可以细分为两类:反馈的(feed-back,或目的论的 teleological)和非-反馈的(non-feed-back 或非目的论的)。
工程师在两种不同的意义上使用反馈这一表述。
从广义上讲,它可以命名一个设备或机器的某些输出能量被作为输入返回(returned as input);一个例子是一个有反馈噪音的电子扬声器(electrical amplifier with feedback)。在这些情况中,反馈是正的(positive),即重新进入对象的那部分输出与原始的输入信号的符号相同。正反馈(positive feed-back)增加(adds)输入信号,而不是修正(corrects)它们。
反馈一词也被用在一个更有限的意义上,用来命名:一个对象的行为由该物体在某一特定时间内参考一个相对具体的目标所处的误差范围(margin of error)所控制。这时的反馈是负的(negative),也就是说,来自于目标的信号被用于限制输出不超出目标。这里使用的反馈一词的第二种含义。
所有「有目的的行为」都可以被认为是需要负反馈的。
如果要达到一个目标,那么在某些时候就需要一些来自目标的信号来指导行为。非反馈行为是指在行为的过程中,没有来自目标的信号来更改对象的活动。因此,一台机器可能被设定为会撞击发光物体,尽管该机器可能无法感知光线。同样,一条蛇可能会袭击一只青蛙,或者一只青蛙袭击一只苍蝇,并且在运动开始后,没有任何来自猎物的视觉或其他的报告。事实上,在这些情况下,运动是如此之快,以至于神经脉冲不可能有时间在视网膜上产生效果,并传到中枢神经系统并产生进一步的及时到达肌肉,有效地改变运动的脉冲。
而与所设想的例子相对,一些机器的行为和一些生物体的反应涉及来自目标的持续反馈,并且这些反馈会修改和引导行为中的对象。这种类型的行为比上面提到的更加有效,特别是当目标并非静止时。但如果反馈没有得到足够的减弱(damp,或阻尼),并因此在某些振荡频率下变成正的而不是负的,那么持续性的反馈控制可能就会导致非常笨拙的(clumpsy)行为。
例如,假设一台机器,其设计目的是撞击一个移动的发光目标;机器所遵循的路径是由来自目标的光的方向和强度所控制的。假设机器在跟随目标向某个方向运动时严重过冲了;那就会有一个更强的刺激(stimulus)使机器朝相反的方向转动。如果该运动再次过冲,那么一系列越来越大的振荡将随之而来,机器将丢失目标。
这种无阻尼反馈(undamped feed-back)的结果与小脑性震颤患者(cerebellar patient)执行自发行为时的情况惊人地相似。在休息时,受试者没有表现出明显的运动障碍。然而,如果要求他把一杯水从桌上端进嘴里,当杯子接近他的嘴时,端着杯子的手会执行一系列幅度越来越大的振荡性运动,因此水会洒出,目的就无法实现。这个实验是小脑性震颤患者运动性能紊乱的典型表现。与具有无阻尼反馈的机器的行为类比是如此生动,以至于我们大胆提出,小脑的主要功能是控制那些涉及有目的的肌动活动的反馈神经机制。
有目的的反馈行为可以再次被细分。它可能是外推性的(extrapolative, 预测性的 predictive),也可能是非外推性的(非预测性的)。单细胞生物的反应被称为趋向性(tropisms),就是非预测性行为的例子。阿米巴变形虫只是跟随它所反应的源头;没有证据表明它会外推出移动的源头的路径。另一方面,预测性的动物行为是一种普遍现象。一只猫开始追赶一只逃跑的老鼠时,不会直接跑向老鼠所在的区域,而是朝着一个外推的未来位置移动。预测性和非预测性伺服机制的例子也很容易找到。
预测性的行为可以被细分为不同的等级。猫追老鼠是个一阶预测(first-order prediction)的例子;猫只是预测了老鼠的路径。而向一个移动的目标投掷石头需要二阶预测(second-order prediction);目标和石头的路径应被预见。高阶预测的例子还有用投石器或用弓箭射击。
预测性的行为需要区分至少两个坐标(coordinates),一个时间轴和至少一个空间轴。然而,如果行为中的对象能够对一个以上的空间坐标的变化作出反应,预测将更加有效与灵活。因此,生物体的感觉接收器(神经末梢,receptors)或机器的对应元件可能会限制预测行为。因此,一只猎犬跟随一条嗅迹,这在它的追踪中没有表现出任何预测行为,因为一种化学的、嗅觉的输入只报告了空间的信息:距离,由强度标明。而能够影响听觉的,或甚至更好的视觉接收器的外部变化则允许更准确的空间定位;以及因而当输入影响这些接收器时而有可能出现更有效的预测性的反应。
除了接收器对执行外推行动的能力所施加的限制外,行为中的对象的内部组织也有可能造成限制。一台要对移动的发光物进行预测追踪的机器,不仅应能够感知光线(例如,通过配置一个光电管),而且还应有合适的结构来解释光亮的输入。很可能是内部组织的限制,特别是中枢神经系统的组织,决定了哺乳动物可能达到的预测行为的复杂度。因此,鼠或狗的神经系统很可能不允许整合进行三阶或四阶预测性反应所必需的输入和输出。事实上,在比较人类和其他高级哺乳动物时,可以观察到的行为不连续性(discontinuity)的特征之一可能在于,其他哺乳动物仅限于低阶的预测行为,而人类可能潜在地具有相当高阶的预测。
到目前为止所建议的行为分类在此表列:
很明显,每一个二分法都武断地挑出了一个被认为是有趣的特征,留下一个无定形的剩余部分(amorphous remainder):非类(the non-clas)。同样明显的是,这几种二分法的标准是异质的。因此,很明显的是,还有许多其他独立于上述分类的分类法可用。比如,普遍的行为(behavior in general),或表中的任何一组,可以被分为线性的(linear 即,输出与输入成正比)和非线性的(non-linear)。而将其分为连续的和不连续的,也可能对于许多目的是有用的。行为可能展现出的几个自由度(degrees of freedom)也可作为系统化的一个基础。
采用上述的分类出于几个原因。它导致了预测性行为的分类,这类特别有趣,因为它表明有可能系统化对于生物体的行为越来越复杂的测试。它强调了目的(purpose)和目的论(teleology)的概念,这些概念虽然在目前还受怀疑,但已经被展示出其重要性。最后,它揭示了一种适用于机器和生物体的统一的行为学分析,无论行为的复杂性如何。
有时有人说,机器的设计者只是试图复制生物体的行为表现。这种说法是不具有批判力的。一些机器整体行为与生物体的反应相似,这并不令人惊讶。动物行为包括所有可能的行为模式中的许多种,而迄今为止设计的机器还远远没有穷尽所有这些可能的模式。因此,这两个行为的领域的有相当大的重叠(overlap)。然而,我们很容易找到人造机器的行为超越了人类行为的例子。具有电力输出的机器就是一个例子;因为人与电鱼不同,无法放电。无线电传输也许是一个更好的例子,因为即使严肃考虑所谓心灵感应的实验,也没有任何动物具有产生短波的能力。
对生物体和机器的进一步比较导向以下推论。目前这两组的研究方法是相似的。它们是否应该总是相同的,可能取决于是否有一个或多个质性的不同的、独特的特性存在于一组中,而在另一组中则没有。到目前为止,这种性质上的差异还未出现。
广泛的行为类别在机器和生物体中都是一样的。特定的、狭义的类别可能只存在于其中之一。目前还没有一台机器能够编写梵文-普通话词典。也没有已知的滚动轮子的生物体——想象一下,如果工程师们坚持要复制生物体,并因此在他们的火车上装上腿和脚,而不是轮子,结果会是怎样的。
虽然对机器和生物体的行为学分析大体上一致,但对它们的功能性研究却揭示了深刻的差异。从结构上看,生物体主要是胶质的,主要包括蛋白质分子、大型、复杂和各向异性(anisotropic);机器主要是金属,主要包括简单分子。从能量学的角度来看,机器通常表现出相对较大的电位差(differences of potential),这允许快速调动能量;在生物体内,能量分布比较整体较均匀,流动性不强。在电力机器中主要是电子传导,而在生物体中,电的变化通常是离子的(ionic)。
在机器中,范围和灵活性主要是通过效应(effects)的时间倍增(temporal multiplication)来实现的;每秒一百万次或更多的频率容易获取和利用的。而在生物体内,不是时间倍增,空间倍增才是规则;时间方面的成就很差,最快的神经纤维每秒只能传导大约一千次的脉冲;另一方面,空间倍增则很丰富,其紧凑性令人钦佩。
电视接收器和眼睛的比较很好地说明了这种差异。电视接收器可以被描述为一个单锥体的视网膜;图像是通过扫描(scanning)形成,即通过有序地连续信号检测,速度约为每秒2000万次。扫描是一个很少或从未在生物体内发生的过程,因为它需要快速的频率才能有效地发挥作用。眼睛使用的是一个空间,而非时间倍增器。人眼不是电视接收器的一个锥体,而是有大约650万个视锥细胞(cones)和大约1.15亿个视杆细胞(rods)。
如果一个工程师要设计一个机器人,在行为上与一个动物机体大致相似,他目前不会试图用蛋白质和其他胶体来制造它。他可能会用金属部件、一些电介质和许多真空管。该机器人的运动可以很容易地就比原始生物体的运动更快、更有力。然而,学习和记忆方面将是相当不成熟的。在未来几年,随着胶体和蛋白质知识的增加,未来的工程师可能会尝试设计不仅具有某种行为,而且具有类似于哺乳动物的结构的机器人。一只猫的最终模型当然是另一只猫,无论它是仍由另一只猫所生或是在实验室里合成的。
在对行为进行分类时,目的论(teleology)一词被用来作为带有由反馈控制的目的的同义词。目的论在过去被解释为蕴含着目的(imply purpose),并常被加上某种终极因(final cause)的模糊概念。这种终极因的概念导致了目的论与决定论(determinism)的对立。
对因果关系、决定论和终极因的讨论超出了本文的范围。然而,可以指出的是,这里所定义的目的性(purposefulness)与初始或最终的因果性是完全独立的。目的论之所以不足信,主要是因为它被定义为,在特定效应的时间之后,蕴含着一个原因(cause)。然而,当目的论的这方面被否定时,对目的的重要性的相关认识也不幸被丢弃。由于我们认为目的性是理解某些行为模式所必需的概念,我们主张,如果避开因果性难题,而只关注对目的的考察,这样的一种目的论研究是有用的。
我们对目的论行为的含义进行了限制,其仅适用于由反应的误差控制的有目的的反应,即,由行为中对象在任何时候的状态与被解释为目的的最终状态之间的差异所控制。因此,目的论的行为成为由负反馈控制的行为的同义词,并因此通过一个充分限制的含义而获得了精确性。
根据这个有限的定义,目的论并不与决定论相对立,而是与非目的论相对立。当所考虑的行为属于决定论适用的领域时,目的论和非目的论系统都是决定论的。目的论的概念与因果性的概念只有一个共同点:一条时间轴。但因果性意味着一种单向的、相对来说不可逆的功能性关系,而目的论关注的是行为,而不是功能关系。
日 | 落译介计划 是媒体实验室落日间对一些有助于思考游戏/电子游戏的外文文本翻译和推荐/索引计划。(点击原文或查看网站 xpaidia.com/sunset-project/)。
Gregory Bateson 「自我」的控制论:酗酒的理论 (1971)
感谢支持落日间的朋友们!
欢迎赞赏或在爱发电赞助落日间