说起博弈论,很多人可能会想到荣获了2002年奥斯卡最佳影片、最佳导演等多项重量级奖项的影片《美丽心灵》(A Beautiful Mind)。
这部影片以现实世界的传奇与天才数学家约翰·纳什(John Nash)为原型,讲述了患有精神分裂症的纳什在年轻时如何提出博弈论中最重要的奠基性概念——均衡(被后人称为“纳什均衡”),后长期与病魔做斗争,最终获得诺贝尔经济学奖的故事。
(▲约翰·冯·诺伊曼(John von Neumann))
纳什虽然对博弈论做出了奠基性的贡献,但并非它的创立者。“博弈论之父”是20世纪最重要的数学家之一的约翰·冯·诺伊曼(John von Neumann),他在各种不同领域都做出了巨大成就,也是“电子计算机之父”,他于1945年提出的电子计算机的体系结构(被后人称为“冯·诺伊曼架构”)仍用于目前我们生活中的每一台电脑中。
“博弈”的字面意思是下棋,把Game Theory翻译成“博弈论”是一种在原义和引申义上都十分贴切的译法。在上世纪20年代,冯·诺依曼从数学角度研究了“二人零和博弈”。所谓二人零和博弈,就是在博弈中,只要一方赢了,另一方的结果就是输,对决双方的利益是相反的,象棋、国际象棋、围棋等都是典型的二人零和博弈。1928年冯·诺依曼发表了论文《棋盘游戏理论》,用到了拓扑学等高等数学的方法证明了在二人零和博弈总存在“最小最大解”(Minimax solution),即总能找到一种最佳策略,使得一个人的最小收益达到最大(也即最大损失达到最小)。
我们用一个切蛋糕的例子来解释一下“最小最大解”,两个孩子分一个蛋糕,其中一个孩子负责把蛋糕切成两块,但另一个孩子可以先选要哪一块蛋糕,切蛋糕的孩子知道另一个孩子会选大的那块(也就是留给自己的肯定是小的那块),所以他会把较小的一块切得尽量大(这就是使自己的最小收益达到最大或者说最大损失达到最小),切蛋糕问题的最佳策略就是把蛋糕切成一样大的两块,两人各分得半个蛋糕。
(▲克劳德·香农(Claude Shannon))
最小最大解是博弈论的第一个重要思想。“数字时代之父”、信息论创始人克劳德·香农(Claude Shannon)进一步发明了Minimax算法并基于这一算法设计了国际象棋机器。
(▲人工智能国际象棋“深蓝”)
(▲人工智能围棋“阿尔法狗”)
香农1950年发表的论文《编程计算机下棋》是人工智能领域的经典文献,其主要思路在后来战胜人类顶尖职业棋手的人工智能国际象棋“深蓝”和人工智能围棋“阿尔法狗”的算法中还能看到。
Minimax思想的最新发展是将人工智能领域目前最火的人工神经网络深度学习技术与博弈论结合起来,形成“生成对抗网络”。通过让两个深度神经网络以相互博弈的方式进行机器学习,这种技术可以自动生成文本、图像、视频、语音等多媒体数据。“生成对抗网络”由一个生成器和一个判别器组成,其中的生成器总是想生成判别器无法区分真伪的数据,而判别器总是想区分出数据到底是真还是假的,两者始终互相对抗博弈,最后就能生成以假乱真的数据来。
上面这些极其逼真但又千变万化的人脸,就是用“生成对抗网络”自动生产的,其实它们并不是世界上真实存在的人脸。生成器通过不断产生假照片输入名人相片数据库,然后由判别器鉴定,生成器再进行改进,直到最后生成的这组照片成功骗过了机器的“眼睛”,判别器无法判断它们的真假,于是就有了上面这一堆实际上不存在、但又似曾相识的“名人”。
利用“生成对抗网络”技术还能将把一张图像的特征转移到另一张图像上,比如可以将一张狗狗的照片瞬间变成梵高星空风格的画作。
利用这一技术,一幅画作现在可以随意变换风格了,比如达芬奇的《蒙娜丽莎》可以随心所欲地变成毕加索的立体主义画风、梵高的表现主义画风,亦或是莫奈的印象主义画风。
画风的学习也是通过博弈来完成。比如要学习梵高的画风,想象有一个画家和一个鉴赏家。画家先画了一幅梵高的模仿作品交给鉴赏家,鉴赏家看了之后的反馈可能是色调不是很接近梵高作品的感觉,画家获得反馈后改进了画作,鉴赏家看了后可能又觉得笔触太细了,画家根据反馈再次改进,这种循环不断进行,每一次循环后画家模仿的水平就变得更高,直到足够次数的改进后,画家模仿出的画与梵高的真迹再也无法区分出来。
不仅仅只会模仿,“生成对抗网络”学成“左右互搏”之术后甚至开始自创武功,上图是一些“生成对抗网络”自己创作的艺术作品。
去年10月,世界著名艺术品拍卖行佳士得在纽约洛克菲勒中心举行了为期三天的艺术品拍卖会,会上有包括20多幅毕加索作品的363件艺术画作竞拍,最后一幅由“生成对抗网络”技术创作的肖像画《埃德蒙·贝拉米画像》(左上图)拍出43.2万美元的高价,折合人民币约300万元,超过了同场所有的毕加索作品,像毕加索的版画《女人头像》(右上图)只拍得十余万美元。
值得注意的是这幅《埃德蒙·贝拉米画像》的右下角落款处写的是一个数学公式,这个数学公式代表的就是“生成对抗网络”中核心的Minimax博弈思想。
这篇文章里我们介绍了博弈论中的第一个重要思想:Minimax。下周一同一时间我们会再介绍博弈论里另一个影响更深远的概念:纳什均衡。我们会看到,在二人零和博弈中,“最小最大解”和“纳什均衡”的实际结果是等价的。但如果要把二人博弈进一步推广到多人博弈,“纳什均衡”展示的则是更普遍的规律,所以它成为了现代经济学等很多领域的基石性概念。
我们还会谈到诺贝尔经济学奖得主和图灵奖(相当于计算机领域的诺贝尔奖)得主们是分别从什么角度来看待博弈论的。博弈论其实已经成为我们研究世界的一种工具。目前世界各大名校的经济系、计算机系、电子工程系、数学系、生物学系,还有心理学系、政治科学系和社会科学系的课程中都含有博弈论的内容。
世界图书出版公司推出的“世界博弈论经典”分为“经济与社会科学系列”和“计算与信息科学系列”两个子系列,这些经典名著的作者中有诺贝尔经济学奖得主让·梯若尔(Jean Tirole)和罗杰·迈尔森(Roger Myerson),以及呼声很高的诺贝尔奖候选人、“博弈论四君子”中的阿里尔·鲁宾斯坦(Ariel Rubinstein)和肯·宾默尔(Ken Binmore)等。
几十本经典名著即将来袭,敬请期待!
其中的第一本,诺贝尔经济学奖得主让·梯若尔(Jean Tirole)和美国科学院院士朱·弗登伯格(Drew Fudenberg)合著的《博弈论》,已在世图淘宝官方旗舰店首发销售。
(▲感兴趣的读者欢迎打开淘宝app扫一扫上面的二维码购书~~)
公号ID:wpcbj1986世 图 好 书把世界介绍给中国
把中国介绍给世界
科技|人文|心理|外语|动漫