查看原文
其他

一个“正常人”长什么样?

Mushon Zer-Aviv 北京德国文化中心歌德学院 2023-11-03

一张正常的面孔应该满足哪些要素?Normalizi.ng项目借助机器学习来分析和理解:我们到底是如何区别“正常”与“不正常”的。| 图片(局部):© Normalizi.ng


到底什么才叫正常?一张正常的面孔应该满足哪些要素?我们的大脑会对迎面而来的每一张脸进行分析与归类,而且不仅只有我们人类如此。有一整个科学技术领域专门分析这些无意识的认知过程,将其分解成为统计学意义上的常态。机器学习(Machine Learning),面部识别甚至还可以用来对人类的行为进行分类,分析甚至预判。

文 / Mushon Zer-Aviv




肖像的表达
十九世纪的巴黎经历了巨变:工业革命吸引众多农业居民来到这里,要在这座大城市碰碰运气,这一现象引发了城市化,且直到今天依然没有间断。无论是巴黎的当地人还是新人,人们每天都被陌生面孔所包围。工业革命催生出的市民阶层与劳动阶层的差异愈加显著,人口的变化也影响了城市的社会结构。城市居民之间愈加陌生,马路上的恐惧感与犯罪率也与日俱增。

告诉我们您是谁,要不就让您的肖像说:自从发明了入案照之后,缉拿罪犯就容易多了。| 图片(局部):© Tableau Synoptic des Traits Physionomiques: pour servir a l’étude du “Porträt Parlé”, by Alphonse Bertillon (1909) / public domain
早先的警察大多了解自己逮捕的人,他们都是谁,住在哪,甚至知道他们的母亲会为自己孩子的罪行说些什么。然而随着外来人口的涌入,这种情况发生了改变。警察局开始借用当时刚刚发明的照相术来记录被捕人员,但也因此堆积了海量的不必要的图片。所以巴黎一位年轻的警察阿方斯·贝蒂荣(Alphonse Bertillon)决定要从这海量图片中理出头绪。首先就是警察照相的标准化:也就是一张正面照,一张侧面照,他还为这些图片建立了相同制式的索引。也就是说:是他发明了现代的入案照——直到今天,这依旧是犯罪行为的典型象征。紧接着他还测量并量化了被捕人的身体,对他们进行了分类,还将额外的身体特征补充进索引卡。此外,贝蒂荣还研发出一个系统,将其称之为“肖像的表达”(portrait parlé)。一旦有人被捕后拒不透露自己的信息,警察还可以通过这个系统进行猜测与鉴别。系统的表格中涉及到很多不同的类别,有的关于鼻子,有的关于嘴,眼睛,耳朵以及其他面部特征,并对此进行了相应分类和编排。
对于贝蒂荣来说,这不过是一个用于简化侦查的索引系统。然而事实上,他发明的人体测量法迅速在欧洲和美国普及开来,成为开创性的、以科学为依据的身份识别手段。然而令贝蒂荣倍感失望的是,几年之后,这一方法便被指纹识别所取代,这一技术不仅更简洁,而且更准确。

到底什么是正常?


指纹研究是弗朗西斯·高尔顿(Francis Galton)的诸多科研成果之一,高尔顿是一位涉猎广泛的英国知识分子以及统计学领域的先驱。他的另一主要发现是关于正态分布的。他发现,在貌似随机的现象中往往遵循着特定的概率模型,模型的在顶峰弯曲,形成钟形——也就是“钟形曲线”。越是接近曲线的制高点,事物就越是相类似,越是在曲线的两侧,事物的差异就越大。
高尔顿将这一抽象的统计学现象通过一个独特的类似弹珠机一样的装置呈现出来。他在装置中倒满了豆子,木板上部的豆子在漏出时会自然散落到中间地带,并在这里与交错的钉子相碰撞,随机向左或向右滑落,最终降落在均匀分布在底端的格扇中。想要提前确切说出哪些豆子会落入哪些隔扇是不可能的,然而所有豆子的总体分布总是呈钟形曲线状。中间的隔扇因而降落了最多的豆子;隔扇越是处于边缘,落到里面的豆子就越少。

高尔顿板的复制品:落至格扇中的小球数量总是近似于正态分布的钟形曲线。| 图片(局部):©  CC BY-SA 4.0 


由此,常态分布得以量化,异常的分布也得以量化——取决于落入隔扇里的豆子的分布。如果异常程度低,意味着隔扇位于正常地带附近,也就是曲线的顶端。如果异常程度高,则意味着这些隔扇位置偏远,偏离正常的可能性也更高。
这一实用的数学表述使得统计学意义上的常态概念不再仅仅是一个科学标准。高尔顿一直致力于借助统计学的滤镜来观察生活的方方面面。此后不久,他的统计学的“常态”概念便超越了自然科学,在诸多领域得以应用。在高尔顿十九世纪末的科研之前,使用“正常”这一说法来形容自然科学之外的事物还很罕见。然而“常态”概念也很快成为了常态。通过埃米尔·杜尔凯姆(Émile Durkheim)以及其他社会学家的研究,高尔顿的发现进入到社会学以及日常文化领域之中。

正常脸?异常脸?
1893年,高尔顿拜访了贝蒂荣的刑侦实验室,并大受鼓舞。对于贝蒂荣的揭开嫌疑人的过往罪行的工具与方法,他并不感兴趣,而是着迷于利用统计学来预测未来可能出现的差异。

在1893年,高尔顿来实验室拜访时,贝蒂荣拍摄并记录的高尔顿(当时73岁)。 | 图片(局部):©  Wikipedia/gemeinfrei


与贝蒂荣一样,高尔顿也致力于对人物肖像照的系统性研究。以前者对于统计学的常态的认识为灵感,高尔顿研发出对大量肖像照片进行整合的方法:也就是将不同的人物置于同样的底板之上,借助低曝光进行拍摄。由此诞生的是单幅的、混合的图片。他将军官和皇家工程兵,罪犯与精神疾病患者的肖像放置在一起,并借此尝试概括出正常人典型的面部特征,找到与这些典型特征相区别的差异所在,并最终提前预测这些异常。

高尔顿研究了罪犯以及精神疾患的肖像,尝试概括出正常人典型的面部特征。 | 图片(局部):© Frontispiece of Inquiries into Human Faculty and its Development, Francis Galton (1883) / public domain


对于高尔顿来说,统计学不仅仅是精神才智的冒险:他认为,借助统计学意义上的常态概念可以塑造一个更好的社会。他还发起了优生运动,这一运动并不将进化论以及自然选择(高尔顿的二表哥查尔斯·达尔文的突破性科学理论)作为自然变异的分析手段,而是一剂打造更好的社会的良方。像高尔顿这样的优生学家便开始利用面相学行医——通过人的躯体特征来判断这个人的性格的伪科学,好比以貌取人。借助贝蒂荣的“数据化”(以数据为形式的测量与记录)以及他的躯体分类,面相学医生可以分析、归类甚至预判一个人日后会为社会带来哪些贡献,以及这个人的基因库会为后代带来哪些影响。信奉优生论的人认为,人的命运与教育(或者上帝)无关,而是由自然决定。因此,只有保留基因的纯净,阻止差异基因的传递与繁衍,人类才能进步。不久之后,优生论在西欧和英国获得了政治推动。然而强制绝育的法律——也就是禁止残障人士生儿育女——首先在美国得以实行。
贝蒂荣本人从未打算以这种方式将他的技术应用于实践。在与科学种族主义理论者,意大利犯罪学家龙勃罗梭(Cesare Lombroso)对决的过程中,贝蒂荣曾言:“不是的,我并不确信,脸部的不对称,眼眶的深度以及下巴的形状和一个罪大恶极的罪犯之间有什么必然联系。”
贝蒂荣解释说,他曾在自己的刑侦实验室里见到过很多张面孔。例如,他继续道,一个人的视觉能力受限也并不意味着他生来就是罪犯,但他有限的视力很可能令他在劳动力市场上处于劣势。
贝蒂荣将人的躯体数据化,目的是与这个人过去的行为建立关联,便于鉴别,而完全没有预判或是猜测此人未来行为的目的。然而,这种对个人的生理特点及行为的数据化分类不仅被用于法医的鉴别工作,还有统计学的预判。受到科学认可的种族歧视理论以及面相学深深影响了二十世纪。在希特勒的《我的奋斗》一书中,他还引用了美国优生论的观点作为德国日后推行的纳粹优生政策的理论支持。纳粹更将这一观点与相关实践推向令人发指的顶峰:对犹太人,吉普赛人,同性恋人群,残障人群,以及其他异于雅利安人种常态的族群进行大规模屠杀以及种族灭绝。随着纳粹在二战的战败,面相学以及所谓科学种族主义思想也在全世界遭到判决,随后几年逐渐沉寂,然而这些思想并没有消亡,还深深埋藏在统计学的常态理念之中。

肖像的再次表达
随着电脑的飞速发展,统计学也取得了飞跃性的进步。在二十一世纪二十年代,面部分析又强势回归。今天的“数据科学家”们继承了十九世纪统计学与数据化先驱的衣钵。有人专注于数据化,通过与过往的记录相结合,重新启用了贝蒂荣刑侦鉴别的方法。也有人类似高尔顿,专注于分析,尝试通过对过去行为的统计模型对未来的行为做出预判。今天,人们往往将鉴别和预判相结合,以便实现科技的最优使用。Facebook就曾迫于官方压力在2021年宣布,不再使用面部识别技术来识别照片上的用户,还提到,会利用自动选择文本(Automatic Alt Text)功能,对图片进行分析并自动生成描述画面的文字。
计算中心搜集到的数据越来越多。数据对我们目前的行为描绘出的肖像也愈发精确,可以借助算法进行预测。与高尔顿整合的诸多肖像类似,正常行为的画像也是借由很多人的诸多有所重叠的模式构成。所有信息都会经过黑盒子算法,在未来常态化行为的钟形曲线上找到路径。通过数据得出的正常化本身就带有预言的意味,这不仅是对未来的预测,也是对未来的述说。如果说,在预测得出的路径上下注是最为稳妥的,那么在与此相偏离的路径上下赌注,则意味着财政、文化、有时还会有政治上的风险。因此可以说,通过数据得出的预测是基于过去的常态化,也会阻止未来发生变化。因而,机器学习算法(Machine learning algorithms)就其本质而言是保守的:它们只能预测出过去的模型在未来会如何重复,但无法预测这些模型的进化。
关于网络的探讨还时时牵动着另一论题:当事人对自己早前的行为是否有权保密。然而今日算法的监督机制对我们过去的个人行为并没有表现出过多的兴致,而是更关注将我们的肖像整合之后所表达的信息:这些图像信息定义了什么叫做常态,同时对所有差异和偏离表示怀疑。

在线正常项目
同机器一样,我们人类也在不停地对每一张陌生的面孔进行分类。我们观察,分类,分析着面前这张脸的每一个特点。可是我们意识到自己日常的这些成见了吗,意识到我们是如何不停地评判什么是正常的,什么不正常的?我们如何对他人划分类别,我们自己又被人如何归类?这些正是Normalizi.ng项目的核心问题。在这个在线研究实验项目中,我们会借助机器学习来分析和理解人类是如何划定“正常”的面孔的。(链接:https://normalizi.ng/)
参加Normalizi.ng项目的人,需要经历三个步骤,它们也是统计分析历来的典型步骤。第一步,拍摄(抓取):被试者需按照要求将脸部放进框内,拍一张自拍。第二步,分类:请观看此前拍摄的几位参加者的照片,可以左右滑动屏幕,在两张图片中选出一张,决定谁的鼻子,嘴巴,双眼,或是谁的脸看上去更加“正常”一些。第三步,分析:算法会对所有被试者的面孔以及他们对于正常的理解进行分析,受到贝蒂荣的启发,项目会将这些常态化数值录入索引系统,实时更新。随后,所有被试者的面孔都会对被添加到以“肖像的表达”(„portrait parlé“)为灵感的常态算法地图上。


“正常”地图 | The Normalizi.ng Map 
借助面部分析的算法,地图上具有相似特点的面孔会被划入同一个二维网格之中。常态化数值越高,肖像照的边框就越粗。随着参加的人增多,算法会时时更新,重新绘制这一地图。然而在每张地图上,男性与女性这两个主要集群都泾渭分明。其他集群则处于边缘:例如肤色较深的集群,这其中往往既有男性也有女性;亚洲集群有时会逐渐过渡到拉丁集群;还有儿童集群,老人集群,留胡子的人的集群……有趣的是,由于疫情而带上口罩的面孔在地图上的分布十分均匀。随着算法对地图的时时更新,算法还会重复,强化面孔的分类。地图也显示了当今世界上的各个国家如何结合不同的性别,肤色,年龄或是发型,汇总并强化了种种制度性歧视,而这些都轻而易举地隐藏在这个看似客观的人工智能黑盒子后面。
大量的陌生面孔是使得巴黎以及其他大都市如此激动人心,遍地机遇的重要原因。巴黎不再是一个同质化的小城市了,互联网也一样。算法就是警察,它只将你看成是一个刻板形象,既不认识你本人,更不会跟你母亲交谈。我们要不要停下片刻,问问我们自己:我们真的需要对人脸的数据体系化吗?还有自动化?还要继续强化?所谓常态,真的是我们需要监管和鉴别的对象吗?

原标题:《正常人长什么样?》

作者:Mushon Zer-Aviv,设计师,研究者,教育家和媒体活跃分子,居于以色列的特拉维夫。他对数据又爱又恨的态度可见于他的设计作品,艺术创作,他的行动,科研,课堂,工作坊,以及他的城市生活中。Mushon Zer-Aviv目前正在撰写一部有关摩擦与流动的书——也就是设计理论的变迁。翻译:歌德学院



更多精彩

>> 智商差异真的是由基因决定的?种族科学的“真相”
>> “白色是天使,黑色是魔鬼”
>> 假新闻,透明度,平台垄断:欧盟要向算法“开战”了?


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存