转载 | 邓小铁:做科研是因为“不想浪费生命”
The following article is from RLCN Author 王梓薏
关键词:邓小铁
编者按
本文授权转载自 RLCN,根据 RL China 对北京大学前沿计算研究中心邓小铁教授的采访整理,按照实验室介绍、个人经历、学术见解、福利时间分为 4 个部分,共计 13 个问答。部分内容有删减和修改。
人物简介
邓小铁,北京大学前沿计算研究中心教授,欧洲科学院外籍院士,ACM Fellow,IEEE Fellow。1989 年于斯坦福大学获得博士学位,先后担任中国科学院系统科学研究所助理研究员和加拿大约克大学计算机科学与工程系助理教授。作为项目负责人,邓小铁教授曾承担加拿大、香港、英国,及国家基金委等十几项科研项目,并在多种国际期刊担任编委。他曾担任多个国际学术会议主席,并发起网络经济学国际三大洲(亚洲、欧洲、美洲)循环举办的全球性会议互联网及网络经济学术会议 The Conference on Web and Internet Economics (WINE)。他在算法博弈论方面及网络搜索的研究成果,被国际同行广泛引用,发表论文 200 余篇,被引用上万次;多次做国际学术会议特邀报告;曾获得 IEEE 理论计算机学术会议 FOCS 的最佳论文奖;其成果“关于图与组合优化的若⼲经典问题的研究”获 2015 年度⾼等学校科学研究优秀成果奖(自然科学)二等奖(排名第⼆)。应用方面获得多项美国专利及国家专利,曾担任重要互联网公司机制设计顾问。
主要科研方向为算法博弈论、互联网经济、在线算法、并行计算及区块链。近期的研究兴趣包括算法博弈论研究、均衡和机制设计、互联网广告系统、云计算定价及资源分配、社交网络行为分析及推荐系统,以及交通及物流网络算法。
实验室介绍
1
能介绍一下您的实验室吗?
我们的实验室叫做博弈论实验室,主要工作集中在机制设计、区块链、多智能体系等方面,都是从博弈均衡、算法博弈论角度出发的,考虑环境中各方的优化、相互协调以及合作和竞争中均衡的实现。
个人经历
2
您是 77 年恢复高考后的第一届考生,并考入了清华大学,关于这段经历您有什么难忘的回忆?
我们这一代人其实算是经历了国家最巨大的进步吧,在任何一个国家可能都很难看到这样的,几乎是从农业社会到先进技术开始被国外卡压地步(的进步)。对于个人来讲,高考确实是我人生中最重要的一个起点,假如没有这件事情的话,可能一切都会不同。因为很多情况下不同机会对最后结局不会有太大的影响,但是高考确实是人生最容易发生转变的转折点。
图 1 班级颐和园合影(第四排左四)
在清华读书的日子当然挺难忘的,其实我们这一代都挺珍惜这个机会的。那个时期有一个特点,大家都是全心全意努力学习。我们当时有一张照片——我没在里面,但是我们班同学在里面的,大概是关于当年高考的报道里面出现最多的一张照片——我们班在阶梯教室上课。前面最清晰的就是我的同学,我可能在某个角落里面(笑)。
我那时候每天早上起来都在背英语,我好像语言能力比较差,所以在那方面特别努力,学习也挺认真的。(当时的)生活想起来挺难忘的,但又很容易忘记,因为每天都很一致。
图 2 西阶听课
3
如何看待社会对高考的态度?您觉得现在的高考制度合理吗?哪里可以改进?
当时的情况下,我觉得高考——也就是唯分数论的考试制度——这件事情是给了国家进步的一个人力资源基础,让各方面的科技人才在那段时间里都能成长起来,在录取上面还是起到了挺大作用的。此外,(高考的)判别标准简洁。当时刚刚改革开放,每件事情大家都有不同的想法,但是对于高考录取这件事情有一个社会共识,这就挺好的,至少在那个时期。
现在回过头来看,这种单一的模式也许对我们在某些方面(的发展)不是特别合适。我觉得很重要的一点是,我们要保留人才的多样性,让各方面的人才都能成长起来。我们要能够去保证各个大学独特的风格和特长,有一些更加有多样性的专业评判原则,不会说某些方面的人才根本就找不着了。这是我自己的感觉吧。
4
您是怎样决定走上科研道路的呢?
科研对我来讲应该是爱好,所以我觉得(走上科研道路)是比较理所当然的事情。我们成长中可能有不同的阶段,也会遇到不同的情况,所以有些时候也会有各种各样的想法,但是对于我来讲,基本上好像没怎么考虑过其他的选择。
我也曾问过我的一个现在挺有名的学生,为什么会选择走上科研这条路?他的回答给我留下了很深的印象——他说:“我不想浪费生命”。我很喜欢这个回答,所以我就借花献佛吧(笑)。
5
您证明了两人博弈纳什均衡解的算法复杂度是 PPAD 的,您能讲讲那时候的故事吗?比如启发您的契机,以及遇到的困难和解决方法。
这是当时整个计算理论界里一个长久追求的问题。从数学上讲,均衡计算最著名的就是不动点方法,市场均衡当初是 Arrow 从不动点方法得到的一个最广泛的证明结果,Nash 和 Arrow 也都分别因为这两个结果得到了诺贝尔奖。而 PPAD 是建立在纳什均衡的一个叫做 Lemke-howson 的解法的结构上的计算等价类。
以前的分析都是想建立起来 PPAD 跟均衡、PPAD 跟不动点的联系,但建立直接的连接都有些困难。一个原因就是(均衡和不动点)这两个都是连续的问题,比如说 Lemke-howson 是对均衡的求解方案,不动点也可以这样求,但是它的不动点模型还是一个连续的模型。正好2000年左右的时候,有个日本人提出了一个用离散连续函数来定义不动点的方法,我和陈汐同学(现任美国哥伦比亚大学的副教授)就开始对不动点的算法进行了一系列的研究,包括 oracle 模型和逻辑线路模型都做了研究,为 Two-Nash 的 PPAD 复杂性结论建立了离散不动点的基础。
然后 Nash 均衡跟 PPAD 的联系是由另外的希腊人,就是我的导师和我的师弟,建立了一些联系,但是进一步的推动其实是在离散不动点上。我们后来主要的工作就是通过这两个联系推动了这个问题的最终证明。我们后面也借助不动点在比如说 mobius band 这种 non-orientable 的空间里面的概念,推动了另外一些概念——PPA 的研究范式。所以这里的工作其实是一个挺长期的思路,最后把这个东西解开以后进展就非常快。
学术见解
6
多智能体强化学习和传统的博弈论有什么关系?是否可以互相借鉴?
这两者确实有一些对应关系。比如说强化学习直接来讲是优化的一个求解方法。优化也不是一般的优化,而是一种利用 potential function 的优化模式。那么比如围棋,这里面的 q function 就可以使用一个平面图上的 potential function 的构架,这样的话在平面图上的一个空间,如果能够设计的比较好的话,就可以降维到一个 n3 的问题。
博弈本身其实是 2n 的复杂性的问题,从计算角度来讲,我们只知道 2n 的算法,一个挑战就是怎么样能够把指数计算降低到多项式计算。而多智能体强化学习通过 q function 的设计,在比如二维空间三维空间这种我们能用手指头数出来的多项式的空间里,就能帮助我们对于博弈有一个很好的解决方案。
所以等于是强化学习对博弈的均衡计算里,这种特别是有 value function 构造的、有空间特性的一大类通常能见到的博弈问题,能够给出好的求解方法。
7
纳什均衡作为多智能体博弈的解有何优势和缺点?是否有更好的方式来衡量策略的优劣?
纳什均衡是说大家都去优化的时候,每个个体的优化到达的一个 fixed point——大家都不想动的时候,是吧。那么 correlated equilibrium 里面有个好处就是大家之间是 related 的,它想出一种方法、一种设计,使得大家能够 coordinate to each other,然后可以多项式求解。比如前面我们讲围棋,直觉上就可以用一个平面上的势函数帮助我们来求解这个问题,那么 correlated equilibrium 它又找到博弈双方的一种联系,是和 Alpha Go 不一样的一种把相关性建立起来的方法,使得计算能够简化,是一个很好的设计。
但是对不同问题,需要去发现它是个 correlated equilibrium,或者设计上面把它建成 correlated equilibrium,才能使博弈的求解得到简化。
而纳什均衡如果非要我说的话,我觉得是一个错误,因为他只考虑每一个个体的优化。其实博弈有很多合作的情况,比如合作博弈里面,大家之间会我帮你、你帮我;或者是进化博弈里面,大家慢慢形成某种合作的方式,觉得会有优势——像生物学进化、国家形成等这些其实都不能够用简单的纳什均衡来做到。
我把纳什均衡在这里解释为每个个体优化自己的目标,没有跟其他人合作的可能性,那么这种均衡在博弈论的整个框架上也是挺有局限性的。纳什均衡当时出现的时候,据说冯诺依曼认为它就是另外一个不动点定理,他跟 Morgenstern 写的那本书上也特别强调多人的合作博弈,但是那条线没有成长起来,就是计算上太复杂了,人类智慧有限,想不了那么复杂的事情。
所以解决这个问题,实际上重担落在了 AI 和计算机理论上。即使是现在,算法博弈论也还是太局限了,比如说机制设计里面也是讨论个体的行为,当然有些新的领域现在也越来越多的会考虑群体行为层面。那么 AI 提供了一个很大的机会,就是说我们用机械化的方法能够算得更快的时候,怎么样可以不局限于纳什均衡,这也是一个挑战。
8
您觉得数字化货币发展进程中,有哪些风险和机遇,计算机科学在其中又面临着哪些挑战?
对于数字货币我们看到有很多角度去看这个问题。最开始的时候数字货币跟真正的货币是分割的,比如说 Q 币;后来支付宝有它里面的币,微信也有微信支付里面的币;现在我们国家也有了人民币数字货币法币的构建。
这里其实有一个挺大的特点,就是管理科学上面的挑战。以前非数字货币都有一套完整的理论,它好不好挺难评判,但它有一套完整的方法,这些方法有什么缺点、有什么错误、有什么难的地方,大家都有一个比较准确的期望。比如说现在美国拼命印它的货币,那么这对他们经济的影响或帮助基本上都是知道的。但是有了数字货币,特别是有 crypto coins 出来以后,这个挑战就增加了一个维度,比如说美国在拼命印它的货币的时候,比特币就天天升值,就是没有其他理由地升值。那么对于这方面来讲,传统货币的发展基本上稳定了,数字货币怎么发展怎么推动其实有挺大的挑战。
另一个,这个世界在国际上是个竞争的世界,是吧。那么我们在这个数字货币的推动上领先,就会对其他国家有一个影响——他们是不是要跟着我们走,是不是要想:我们这么做的话他们该怎么做。其实这里可以有一个借鉴,就是密码学货币里面当时数字货币的设计有很多,比特币是最成功的,就使得所有后面的 crypto coins 都是跟它的——它对世界没有提供任何其他的正面的效益,但它领导数字货币。那么这种领先性我们是不是要考虑,还是我们等到他们(别的国家)发展起来再去学、再去跟、作为他们的一个部分。比如它全球化了,那么我们排在后面作为一家加入进来,会不会像加入 WTO 那么的难加入,是吧?
所以这里(数字货币)“产生”的挑战和“不领先”的挑战难度至少是一样的,我是这么认为的。“把它做好”这件事情像是一个挑战,但是“不做”可能挑战更大。
数字货币还有一个作用,就是管理。比如突然一下几个资本家花一大笔钱,把全世界的或者全国的出租车行业都买下来了,以前没有过的,他不知道怎么管理。那么现在很多互联网公司内部都用一种币来管理,觉得这样挺方便的。比如说微软,它讲每个单元给你一部分 budget,budget 是以内部的一种虚拟币的形式给出来,然后做管理。所以这方面的研究不单单是一个国家的数字货币的发展,互联网企业的管理、区块链以后成长的管理其实都面临着非常大的问题,在这一点上,数字货币或者虚拟币是一个解决方案(也需要研究)。
9
能从博弈论的角度来谈一谈内卷到底指的是什么?您是怎么看待这个问题的?
内卷也是我刚学的词,印象非常深刻,每次到卷的时候我就讲大家别卷了,再努力学习也不可能大家都是第一是吧(笑)?
这件事情怎么说呢,是一个竞争的结果吧,有好处也有坏处。一个好处就是我们国家的科技生产力强大了,比如说我们的头条挺成功的,到国外甚至人家要把你关了,因为你太成功了。在国际竞争方面,就是我们内部的这种卷产生了对外部的影响力。
但另一方面,我就讲这个事情它最后的影响吧,原本国际数学竞赛经常我们国家拿第一第二是吧,但现在就不一定了,原因是我们很多同学到美国去参加比赛跟我们国内的同学来竞争。另一个例子是我们的乒乓球教练到国外(执教)和我们的国家队比赛(笑)。所以我觉得也不一定要那么卷,能够有竞争也有一些调整吧。
从博弈论的角度,演化博弈论里面有一种研究,就是说群体优化的时候它不是对于个体优化的考虑。我知道有一个工作说,在群体博弈中最后存活下来的不是某方面最好的基因,是那种各种性能都比较中上的这种综合性的基因比较成功(那么单方面上最好的基因就消失了,这很可惜)。所以内卷的话,两边是敌对的时候可能比较好,要是合作竞争的状态的话可能调整一下比较合适。
10
您是如何处理好各种科研、教学和事务性工作的?您的科研动力是什么?
我觉得这是同学的误解(笑),但是我身边的人都非常积极努力,帮我做成了很多事情。比如说我的秘书吴双老师,帮我做了很多事情,然后通过她的组织,同学们一起又做了更多事情。所以我的积极努力也是受同学们和身边人的影响,有这种外因的推动。
图 3 邓老师和同学们一起去长城郊游
然后(内因的话)我们这个领域——计算机科学、人工智能,对科学进步的各种可能性推动非常大。比如博弈论这个角度上,我刚才提到的纳什均衡是人类挺难应对的一个情况,在竞争环境中想做到合作博弈是非常不容易的。那么这里我们说通过计算机的帮助,能不能做到有更好的方法,能够替代纳什均衡个体优化的机制设计。就单对这一个问题,我觉得我们人工智能领域来说是挺大的挑战。
图 4 邓老师在长城处理工作
11
您曾在多地和多国学习和任教,您觉得中外顶尖大学和科研机构有哪些可以互相借鉴的地方?
在清华的时候比较简洁,(我觉得)当时也挺内卷的。每个同学都是每天从早到晚努力学习,各种努力学习。刚入学的时候也有些害怕,见一个人就觉得他比我厉害。我当时总结出来一个经验,就是只要 A 旁边有 B 在某个地方达到 A 的 60% ,A 就开始害怕;而 A 在另外某个方面达到 C 的 60%,C 也会开始害怕,最后变成了相互害怕(笑)。
科学院当时也挺好的,老师带我们到处去开会、交流。我后来数了数,去了 5 个地方,都是讲习班,要么老师去讲习,要么去听老外的讲习,也认识了挺多比较有名的老外。现在想想特别感谢我们的老师。我们那时候科研经费很少,但老师也慷慨地拿出来给我们花,让我们跟他一起出去做这些交流。
在斯坦福的时候就有点反过来了,基本上和老师一个学期见一次面(笑)。老师会给很多问题给你做,总有一个可以做出来,这样也挺好。老师讲课也挺神奇的,每次老师快讲完的时候你就感觉这个问题很有意义,我们很快就可以把它用上去,然后最后5分钟他开始讲证明,“if…”然后“Only if…”,把粉笔丢一丢,一下就过去了(笑)。然后老师会布置很多阅读(作业)——当时是研究生课嘛,读到了很多新的科研题目。最后我觉得美国的教育跟其他地方教育相比,有一点特别不同的地方,就是它因为有很多外国人/不同背景的人去读,就安排大家把几乎所有的专业课都重学一遍,让大家有一个共同的基础,以后的合作都能够在这个基础上建立起来。
我在加拿大教学了一段时间,当时我的朋友讲你不要备课(讲的内容要烂熟于心),如果你都忘了,你教给学生有什么用?他们是这个教法。
后来到英国利物浦。英国是人口规模很小的国家,所以他们有一个特点,就是在国内评估的时候,你跟外国专家合作的论文不管你排序第几位都算你的,但你跟本国同事合作的(贡献)要一人分一半,就是鼓励你国际合作,产生国际影响力。然后每个学校又有不同。英国的大学比较强调在某一个/多个方向在国际上要领先。在国内评估的时候,如果一个方向做得特别好,他们会更加着重发展这个方向,所以最终能够活下来的大学,每个都有一个很强的方向,其实这种思路挺成功的。现在,我们国家也开始有些改变,有些是综合型一流大学,有些是专科型一流大学。专科一流的大学如果可以借鉴英国的经验,其实也是一个挺好的思路。
北大我觉得我们的同事、同学是最好的,大家都很努力,学生也很努力,管理方面也比较人性化。在北大我觉得挺荣耀的一件事是,在一些讨论的时候,我们的老师习惯评价某个人什么地方做得好、哪件事做得好、哪个问题做得好,而不是简单的数 paper 或者看排名。
12
可以介绍一下北大“图灵班”的同学有什么特点,其日常生活是如何安排的吗?
我觉得图灵班挺成熟的,当然也是从卷开始(笑)。像图灵班是优中选优,所以我一开始给他们上课的时候也是准备的要求很高的课程,对同学的要求特别高,但这件事情就是作用力等于反作用力,当时自己也挺累的(笑)。
现在好了,图灵班同学成长起来了,上一级的同学可以给下一级的同学当助教。而且学生教学生其实是最好的方案,我大学的时候就这么觉得。因为老师有时候跟同学距离有点远,不知道学生学过什么,什么都得重新开始,同学不一样,高一年级的同学之前上的课基本上跟下一年的差不多,又有相似的背景,教起来更加得心应手,学生也成长得很快。
我们也组织活动,一起出去郊游,还一起玩儿狼人杀。北大学生的优秀不光是学习,是各方面,参与他们的活动也很开心。但是确实卷这件事情在这里还是无法避免,有些时候也希望老师帮一帮他们,家长也多给他们一些正面的鼓励,这样就会少卷一些。
图 5 邓老师课题组生日会
福利时间
13
您在选择研究生时,会青睐具有怎样特质的学生呢?
我对我们的研究生其实挺希望的一件事就是,你要发现你的优点,然后发挥你的优点。当然一个基本态度是“不要浪费生命”,但是你的优点跟别人的优点不一样,真的不用太卷。对北大的学生来讲,每一个人做什么事情都会挺成功的,别人早进步一点、你晚进步一点不是太重要的东西。我跟我的博士生也说,你的博士学习生涯最重要的东西是你的博士论文,不是某一门考试比别人少一分。
招研究生的特质的话,肯定是要相信自己,自信心是最重要的。然后是选择你最喜欢的专业。去发现自己的才能,你才能在这方面发展起来。
最后,建议方面的一点思路是,关于国内国外这件事,总体来看,我们的国家这么多年发展这么出色,到了外国都觉得我们进步太快,要限制我们的地步。所以同学们不必考虑太多,尽量去选自己最合适的工作,最好的成长起来,什么事情都不会难倒你们。
转载自“RLCN”公众号
— 版权声明 —
本微信公众号所有内容,由北京大学前沿计算研究中心微信自身创作、收集的文字、图片和音视频资料,版权属北京大学前沿计算研究中心微信所有;从公开渠道收集、整理及授权转载的文字、图片和音视频资料,版权属原作者。本公众号内容原作者如不愿意在本号刊登内容,请及时通知本号,予以删除。