恐怖谷与深度爵士：计算机艺术能达到人类的高峰吗？

查看原文

其他

恐怖谷与深度爵士：计算机艺术能达到人类的高峰吗？

Original Oliver Roeder 利维坦 2021-06-14

利维坦按：计算机能在围棋上战胜人类，与计算机能创造艺术，两者相比之下哪个会更让你担忧？长久以来，我们一直认为艺术是人类最后一块阵地之一，因为艺术的创作过程与情绪、感受息息相关——即便是阿尔法狗战胜了世界第一，我们也可以视其仅为算法的胜利。

但是艺术不一样，计算机能够创作艺术这件事无疑大大加深了恐慌者的恐慌，我们并非在恐慌计算机比人类写的歌更好听，而是在恐慌计算机不再是我们认识的无情感物。而在这一天最终到来之前，计算机的进步让我们有足够的机会去思索自己是什么。

文/Oliver Roeder

译/以实马利

原文/aeon.co/ideas/there-is-no-such-thing-as-computer-art-it-s-all-just-art

本文基于创作共同协议（BY-NC），由以实马利在利维坦发布

文章仅为作者观点，未必代表利维坦立场

图源：Deeboy/Flick

1964年12月的某一个夜晚，约翰·克特兰（John Coltrane）和他的四重奏乐队在新泽西州恩格伍德镇刚刚完成专辑《至高无上的爱》（A Love Supreme）全部曲目的录制。这张专辑被认为是克特兰的巅峰之作——达到精神觉悟的顶峰，并卖出了100多万张。它所代表的都是人类所独有的：成瘾中的脱身，虔诚的追求，以及对造物主的赞颂。

50年后，也就是2014年的4月份，与恩格伍德镇相距50英里外的普林斯顿市内，20岁的金智成（Ji-Sung Kim）在他简陋的卧室里喝着功能饮料，在12小时内编写了一个算法，教会了他的计算机“如何演奏爵士乐”。金是普林斯顿大学二年级的学生，时间略仓促——他在第二天早上还有个小测。而这件事的结局是，一项名为“深度爵士”（deepjazz.io）的神经网络工程在GitHub（译者注：一个托管代码兼社交论坛功能的网站）上流行开来，掀起了一片黑客界新闻评论家的噪杂质疑声；同时在听云（SoundCloud）上被收听了十几万次，并在日本引起了不小的轰动。

半个世纪的隔阂，在泛着黄铜光泽的萨克斯管对岸，遥遥相望着的是一行行爬虫代码（Python）。而这半个世纪也见证了人工智能音乐和所有流派的视觉艺术的崛起。诚然，在这个大数据与深度学习并存的纪元里，计算机艺术被认为只是特殊的算法。但无论如何——不管为敌或为友——我们必须接受计算机艺术这一事实。

在工业领域，总是充斥着算法带来的紧张矛盾，像是“效率、资本、贸易！”和“机器人偷了我们的工作！”的针锋相对。但是对于算法艺术而言，这种矛盾却更加微妙。根据麦肯锡咨询公司资料显示：在美国经济中，只有4%的工作需要“人类中等水平的创造力”。因此，对于计算机艺术而言，它正明确地想要放大整个职业蛋糕中的一小块，同时这也已经不再是效率或着公平的问题，而是关乎信任。

艺术需要情感和精神上的投资，与此同时以承诺分享一部分人所得到的经验作为回报。当我们在鉴赏计算机艺术时，有一点会令人感到不安：在这条连线的另外一头是谁？是人类吗？接着我们就会担心这根本不是艺术。

（www.mckinsey.com/business-functions/digital-mckinsey/our-insights/four-fundamentals-of-workplace-automation）

算法的可靠性保证了其强大的主流吸引力。截至目前，在网站538（我所工作的地方）的网页上搜索“算法”一词会得到516个结果——我个人要对其中的一些部分负责。在大数据时代，算法的使命变成了治疗疾病、预测最高法院判决、改革体育管理模，甚至是预测日落之美。据说，它们还能防止自杀，改良你所种植的芝麻菜，预测警察的不当行为，以及判断一部电影是否会爆红。

（fivethirtyeight.com/features/computers-are-learning-how-to-treat-cancer-and-diabetes-by-playing-poker-and-atari/）

（fivethirtyeight.com/features/how-to-read-the-mind-of-a-supreme-court-justice/）

（fivethirtyeight.com/features/can-an-astrophysicist-change-the-way-we-watch-sports/

（fivethirtyeight.com/features/how-to-avoid-boring-sunsets/）

人工智能预测日落。图源：sunsetwx

对于更加宏大的计算机算法及人工智能（AI）的潜在应用，通常会提前在更易操控的试验场进行——比如游戏。例如，在IBM的超级计算机沃森（Watson）被送去治疗癌症之前，它曾上过益智问答电视节目《危险边缘》（译者注：与一般问答节目相反，《危险边缘》以答案形式提问、提问形式作答。参赛者需具备历史、文学、政治、科学和通俗文化等知识，还得会解析隐晦含义、反讽与谜语等，而计算机并不擅长进行这类复杂思考）；谷歌的人工智能AlphaGo在一场“旷世挑战”中战胜了人类围棋冠军。但这些比赛不仅仅是微不足道的绊脚石，它们已经被视为是对人类的侮辱。意识到谷歌设计的程序将赢得这一场比赛时，一位评论员称“感觉到生理上的不适”。

计算机艺术工程亦是如此。金和他的朋友周文贤（Evan Chow）——同样参与了深度爵士代码的编写——他们算是计算机“艺术家”冗长族谱中最年轻一代的成员。尽管这两位并不算是穷困潦倒的艺术家。就在今年夏天，金被默克公司（Merck）所招揽，而周在优步工作。当我们三个人坐在普林斯顿大学校园咖啡厅的一个高背椅上时，一首如假包换、忠于上帝，来自人类之手的爵士——由拉赫山·罗兰·柯克（Rahsaan Roland Kirk）狂热演奏的《踏板起来》（Pedal Up，1973）从音响中传出。当金给我同时播放笔记本电脑中生成的深度爵士时，我们便沉浸在一个“邪恶”的“爵士加爵士，等于爵士”的时刻。

“这样的合奏具有相当深远的意义，” 金说道，而我正竭力地想在这不和谐的声音中辨别出哪种声音来自人类的演奏。“你可以用人工智能来创造艺术，而我们通常认为这个行为是人类与生俱来且亘古不变的特质。“金也认为深度爵士乐和计算机艺术往往是一个试验场，但他所看到的不仅是手段，还有目的。

“我不会用‘破坏性’这个词，”他说，“人工智能重塑音乐产业的方式太疯狂了，”想象一个基于深度爵士这种技术的应用程序。 “你只要哼一段旋律，手机就能播放出完全为你定制的、人工智能生成的歌曲。”

像无利可图的创业一样，许多计算机艺术项目的价值离它们的预期阶段还差得远。目前公开的深度爵士演示（demo）非常局限，所有的即兴内容都只来自一首歌：由派特·麦席尼乐队（the Pat Metheny Group，金不太清楚“Metheny”怎么发音。）创作的《后来我已明了》（And Then I Knew，1995）。不过深度爵士的代码是开源的，就比如它曾经被改成《老友记》主题曲的爵士（乱弹）版本。

当然，不仅仅是爵士乐受到过计算机的处理。像吉格和民谣、 “遗传即兴”（genetic jammer）、复调音乐，还有其他的不少东西都曾穿过算法的魔环。视觉艺术几十年来也一直受计算机程序算法的支配。1966年，两名工程师在新泽西州默里山的贝尔实验室（Bell Labs）创造了这样一张照片——可能是第一张计算机裸体画。贝尔实验室的地理位置介于克特兰和金的位置之间。这件作品于1968年在现代艺术博物馆展出。

图源：Leon Harmon & Ken Knowlton

《纽约时报》评论了第一次计算机艺术展览的其中一件作品，这件作品在1965年（就在克特兰录制曲目后的几个月）由两位科学家和一台IBM #7094数字计算机参与完成；曾在纽约画廊展出，现在早已不开放了。《纽约时报》写道：“至今而言手段比目的更令人感兴趣。”但在其中一条评论中，已故的斯图尔特·普雷斯顿（Stuart Preston）却以一种出人意料的热情口吻写道：

“无论未来会发生什么，根据科学家预测，几乎任何一种绘画形式都能由计算机生成，而艺术家的笔触将在作品中不再有用武之地。当那一天到来时，艺术家的角色将由数学模型搭建的点矩阵组成，与人类一同形成一个理想的模式。自那以后，所有的一切都将托付与“机器中的神明”（deus ex machina）。人类将从繁琐的技术和乏味的制图原理束缚中解脱，而艺术家要做的只是简单的‘创作’。”

机器仅仅是一把刷子——握在了人类手上。而有些例子表明，计算机的确可以帮助音乐家们进行简单的“创作”。

艾米丽·豪厄尔（Emily Howell）是一个计算机程序。“她”由大卫·柯普（David Cope）创作于上世纪90年代。柯普现在是加州大学圣克鲁兹分校(University of California at Santa Cruz)的名誉教授，“她”降生于柯普想要独自完成一部歌剧的沮丧困境中。（豪厄尔的作品是由人类音乐家们进行演奏的。）

（artsites.ucsc.edu/faculty/cope/biography.htm）

这首音乐算是勉强过得去，甚至可以称得上不错。对我来说，站在恐怖谷的右岸要安全些（译者注：恐怖谷理论，指当机器人的行为或外表达到一定程度的逼真性时，其细微的差别也会变得格外刺眼，甚至令人毛骨悚然）。但有一个简单的事实令其变得有趣：我知道背后作曲的是一台电脑。而最能引起我兴趣的是它能作为媒介——它是对柯普艺术表达的补充，而不是升华。然而，紧张的局势并没有消失。

我也掉进了其他的兔子洞。举个例说，曼弗雷德·莫尔（Manfred Mohr）是一位早期算法艺术先驱，同时也是一位（人类）爵士音乐家和艺术家。举个例来说，他的绘画创作P706/B（2000）就是基于一个六维超立方体完成的。

（www.emohr.com/ww4_out.html）

图源：Manfred Mohr

有时在“计算机音乐”中也存在这样一种方式——人类为曲子命名，而软件为其伴舞。其中有一个案例引起了市场的巨大反响。博歌乐（Vocaloids）是日本乐器制造商雅马哈（Yamaha）公司开发的“歌唱人格”。博歌乐中颇具人气的一员——初音未来（Hatsune Miku，意为“来自未来的第一个声音”）是2014年火爆的北美巡演的主角，她以全息图像的形式出现在纽约哈默斯坦舞厅（Hammerstein Ballroom），当时的门票以75美元一张的价格，在街上甚至排起了长龙。初音是一个巨星，却不是人类。她还在大卫·莱特曼（David Letterman）主持的《深夜秀》（Late Show）中出现过。

图源：Nihongogo

所以，不仅仅是宿舍黑客和与世隔绝的学者们在计算机艺术领域为了炫耀才华或发表论文而大动干戈。就在上个月，“谷歌大脑”（google brain）团队公开了一个项目“品红色”（Magenta），它将机器学习用于这里所描述的目的，并提出这样一个问题：“我们能用机器学习来创造引人注目的艺术和音乐吗？”（答案很明显已经是‘可以’，但是你懂的）。这个项目紧跟谷歌“深度梦境生成器”（Deep Dream Generator）的脚步，通过神经网络以艺术、梦幻（或噩梦）的方式重新“想象”新的图像。

但真正“忠于上帝”的真相是，这整个概念在某种程度上就是一种假象，是一种毫无差别的区分。“计算机艺术”并不比“绘画艺术”或“钢琴艺术”更具煽动性。算法软件毕竟是由人编写的，使用人类思考所得出的理论、人类制造出的计算机、人类所编写的生产规范、人类收集的材料，在一家由人类组成的公司工作，使用人类所制造出的工具等等。计算机艺术是人类艺术的一个子集，而不是另一个区间。因此人类与计算机之间的紧张关系是能够缓解的。

与此同时，另一位人类评论员在观看围棋比赛中人工智能机器人击败人类冠军后，感觉自己身体状况并没有出现任何不适，并发出了不同的声音：“这是科技所带来的惊人成果，更是对人脑所具有不可思议能力的赞美。”我想，这就是计算机艺术，是一种对人类大脑的歌颂方式——也是对油画颜料和萨克斯的一种圆满。

往期文章：

“利维坦”（微信号liweitan2014），神经基础研究、脑科学、哲学……乱七八糟的什么都有。反清新，反心灵鸡汤，反一般二逼文艺，反基础，反本质。

投稿邮箱：wumiaotrends@163.com

合作联系：微信号 liweitan2018

点击小程序，或“阅读原文”进店

☟

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！