查看原文
其他

良师益友 | 北大邓小铁:做科研是因为“不想浪费生命”

王梓薏 RLCN 2022-03-17

良师益友


“良师益友”是 RLChina 公众号的一个栏目,以采访的形式记录学者对科研工作的思考。


导读


本篇推文主要介绍对北京大学前沿计算研究中心邓小铁教授的采访,按照实验室介绍、个人经历、学术见解、福利时间分为 4 个部分,共计 13 个问答。点击下方阅读原文,可跳转至 Bilibili 观看!




人物简介

邓小铁

 北京大学前沿计算研究中心教授,欧洲科学院外籍院士,ACM Fellow,IEEE Fellow。1989 年于斯坦福大学获得博士学位,先后担任中国科学院系统科学研究所助理研究员和加拿大约克大学计算机科学与工程系助理教授。作为项目负责人,邓小铁教授曾承担加拿大、香港、英国,及国家基金委等十几项科研项目,并在多种国际期刊担任编委。他曾担任多个国际学术会议主席,并发起网络经济学国际三大洲(亚洲欧洲美洲)循环举办的全球性会议互联网及网络经济学术会议 The Conference on Web and Internet Economics (WINE)。他在算法博弈论方面及网络搜索的研究成果,被国际同行广泛引用,发表论文 200 余篇,被引用上万次;多次做国际学术会议特邀报告;曾获得 IEEE 理论计算机学术会议 FOCS 的最佳论文奖;其成果“关于图与组合优化的若⼲经典问题的研究”获 2015 年度⾼等学校科学研究优秀成果奖(自然科学)二等奖(排名第⼆)。应用方面获得多项美国专利及国家专利,曾担任重要互联网公司机制设计顾问。

 主要科研方向为算法博弈论、互联网经济、在线算法、并行计算及区块链。近期的研究兴趣包括算法博弈论研究、均衡和机制设计、互联网广告系统、云计算定价及资源分配、社交网络行为分析及推荐系统,以及交通及物流网络算法。


 

https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_1914056380487958530

采访视频


实 验 室  

 介  绍 

1 能介绍一下您的实验室吗?


我们的实验室叫做博弈论实验室,现在主要的工作是机制设计、区块链、多智能体系这些方面,都是从博弈均衡、算法博弈论这种角度出发的,考虑环境中各方的优化、相互协调以及合作和竞争中均衡的实现。


个 人

 经  历 

2 您是 77 年恢复高考后的第一届考生,并考入了清华大学,关于这段经历您有什么难忘的回忆?


我们这一代人其实算是经历了国家最巨大的进步吧,在任何一个国家可能都很难看到这样的,几乎是从农业社会到先进技术开始被国外卡压地步(的进步)。那么对于个人来讲,高考确实是我人生中最重要的一个起点,假如没有这件事情的话,可能一切都会不同。因为很多情况下不同机会对最后结局不会有太大的影响,但是高考确实是人生最容易发生转变的转折点。

图 1 班级颐和园合影(第四排左四)

在清华读书的日子当然挺难忘的,其实我们这一代都挺珍惜这个机会的,那个时期有一个特点,大家都是全心全意努力学习。所以我们当时有一张照片——我没在里面,但是我们班同学在里面的,大概是关于当年高考的报道里面出现最多的一个照片——是我们班在阶梯教室上课,前面最清晰的就是我们同学,然后我可能在某个角落里面(笑)。

我那时候每天早上起来就在背英语,我好像语言能力比较差,所以在那方面特别努力,学习也是挺认真的。所以说整个生活想起来是挺难忘的,但也很容易忘记,因为每天都很一致。

图 2 西阶听课


3 如何看待社会对高考的态度?您觉得现在的高考制度合理吗?哪里可以改进?


我们当时的情况下,我觉得高考——也就是唯分数论的考试制度——这件事情是给了国家进步的一个人力资源基础,让各方面的科技人才在那段时间里都能成长起来,在录取上面还是起到了挺大的作用的。而且(高考)至少判别标准简洁,当时也是刚刚改革开放起来之后,每件事情大家都有不同的想法,但是对于高考录取这件事情有一个社会共识,这就挺好的,至少在那个时期。

那么到现在来讲,回过来看,这种单一的模式也许确实对我们在某些方面不是特别合适,有些我们觉得重要的领域可能慢慢的消失了。所以我觉得很重要一点,我们要保留人才的多样性,让各种方面的人才都能成长起来。我们要能够去保证各个大学独特的风格和特长,有一些更加有多样性的专业评判原则,不会说某些方面的人才根本就找不着了。这是我自己的感觉吧。


4 您是怎样决定走上科研道路的呢?


好像科研对我来讲应该是爱好,所以我觉得(走上科研道路)是比较理所当然的事情。我们成长中可能有不同的阶段,也有不同的情况遇到,所以有些时候也会有各种各样的想法,但是对于我来讲,基本上好像没有怎么考虑过其他的选择。我其实也问过我的一个现在挺有名的学生,就是说在科研,比如他做的计算理论的研究,还是做其他事情之间,为什么会有这样的选择?我当时得到的回答——我觉得他可能这样回答那样回答,但是他的回答给我一个很深的印象——他讲了一句话,我觉得挺好的,他讲的是“他不想浪费生命”。我觉得我很喜欢这句回答,所以我就借花献佛吧(笑)。


5 您证明了两人博弈纳什均衡解的算法复杂度是 PPAD 的,您能讲讲那时候的故事吗?比如启发您的契机,以及遇到的困难和解决方法。


这个当时也是整个计算理论界里一个长久追求的问题。当时就是说从数学上,均衡计算最著名的就是不动点方法,市场均衡当初也是 Arrow 从不动点方法得到的一个最广泛的证明结果,Nash 和 Arrow 也都分别因为这两个结果得到了诺贝尔奖。那么 PPAD 呢,是建立在纳什均衡的一个叫做 Lemke-howson 的解法的结构上的计算等价类。以前的分析都是想建立起来 PPAD 跟均衡、PPAD 跟不动点(的联系),但这两个直接的连接都有点困难。一个原因就是(均衡和不动点)这两个都是连续的问题,比如说 Lemke-howson 是对均衡的求解方案,不动点也可以这样求,但是它的不动点模型还是一个连续的模型。正好 2000 年左右的时候,有个日本人提出了一个用离散连续函数来定义不动点的方法,然后我和陈汐同学就开始对不动点的算法进行了一系列的研究,包括 oracle 模型和逻辑线路模型都做了研究。那么到此就是为 Two-Nash 的 PPAD 建立了离散不动点的基础。然后 Nash 均衡跟 PPAD 的联系是另外有一个希腊人,就是我导师和我的师弟,建了一些联系,但是进一步的推动其实是在离散不动点上。那么我们后来主要的工作就是通过这两个联系推动了这件事情的最终证明。我们后面也借助不动点在比如说 mobius band 这种 non-orientable 的空间里面的概念,推动了另外一些概念——PPA 的研究范式。所以这里的工作其实是一个挺长期的思路,最后把这个东西打开了以后进展就非常快。


学  术

 见  解 

6 多智能体强化学习和传统的博弈论有什么关系,是否可以互相借鉴?


对,这两个东西确实可以给他一个对应。比如说强化学习直接来讲是优化的一个求解方法,优化也不是一般的优化,而是一种利用 potential function 的优化模式。那么比如围棋,这里面的 q function 就可以使用一个平面图上的 potential function 的构架,这样的话在平面图上的一个空间,如果能够设计的比较好的话,就可以降维到一个  的问题。博弈本身其实是  的复杂性的问题,从计算角度来讲,我们只知道  的算法,一个挑战就是怎么样能够把指数计算降低到多项式计算。而多智能体强化学习通过 q function的设计,在比如二维空间三维空间这种我们能用手指头数出来的多项式的空间里,就能帮助我们对于博弈有一个很好的解决方案。所以等于是强化学习对博弈的均衡计算里,这种特别是有 value function 构造的、有空间特性的一大类通常能见到的博弈问题,能够给出好的求解方法。


7 纳什均衡作为多智能体博弈的解有何优势和缺点?是否有更好的方式来衡量策略的优劣?


纳什均衡是说大家都去优化的时候,每个个体的优化到达的一个 fixed point——大家都不想动的时候,是吧。那么 correlated equilibrium 里面有个好处就是大家之间是 related 的,它想出一种方法、一种设计,使得大家能够 coordinate to each other,然后可以多项式求解。比如前面我们讲围棋,直觉上就可以用一个平面上的势函数帮助我们来求解这个问题,那么 correlated equilibrium 它又找到博弈双方的一种联系,是和 Alpha Go 不一样的一种把相关性建立起来的方法,使得计算能够简化,是一个很好的设计。但是对不同问题,需要去发现它是个 correlated equilibrium,或者设计上面把它建成 correlated equilibrium,才能使博弈的求解得到简化。而纳什均衡如果非要我说的话,我觉得是一个错误,因为他只考虑每一个个体的优化。其实博弈有很多合作的情况,比如合作博弈里面,大家之间会我帮你、你帮我;或者是进化博弈里面,大家慢慢形成某种合作的方式,觉得会有优势——像生物学进化、国家形成等这些其实都不能够用简单的纳什均衡来做到。我把纳什均衡在这里解释为每个个体优化自己的目标,没有跟其他人合作的可能性,那么这种均衡在博弈论的整个框架上也是挺有局限性的。纳什均衡当时出现的时候,据说冯诺依曼认为它就是另外一个不动点定理,他跟 Morgenstern 写的那本书上也特别强调多人的合作博弈,但是那条线没有成长起来,就是计算上太复杂了,人类智慧有限,想不了那么复杂的事情。所以解决这个问题,实际上重担落在了 AI 和计算机理论上。即使是现在,算法博弈论也是太局限了,比如说机制设计里面也是讨论个体的行为,当然有些新的领域现在也越来越多的会考虑群体行为层面。那么 AI 提供了一个很大的机会,就是说我们用机械化的方法能够算得更快的时候,怎么样可以不局限于纳什均衡,这也是一个挑战。


8 您觉得数字化货币发展进程中,有哪些风险和机遇,计算机科学在其中又面临着哪些挑战?


对于数字货币我们看到有很多角度去看这个问题。最开始的时候数字货币跟真正的货币是分割的,比如说 Q 币;后来支付宝有它里面的币,微信也有微信支付里面的币;现在我们国家也有了人民币数字货币法币的构建。这里其实有一个挺大的特点,就是管理科学上面的挑战。以前非数字货币都有一套完整的理论,它好不好挺难评判,但它有一套完整的方法,这些方法有什么缺点、有什么错误、有什么难的地方,大家都有一个比较准确的期望。比如说现在美国拼命印它的货币,那么这对他们经济的影响或帮助基本上都是知道的。但是有了数字货币,特别是有 crypto coins 出来以后,这个挑战就增加了一个维度,比如说美国在拼命印它的货币的时候,比特币就天天升值,就是没有其他理由地升值。那么对于这方面来讲,传统货币的发展基本上稳定了,数字货币怎么发展怎么推动其实有挺大的挑战。另一个,这个世界在国际上是个竞争的世界,是吧。那么我们在这个数字货币的推动上领先,就会对其他国家有一个影响——他们是不是要跟着我们走,是不是要想:我们这么做的话他们该怎么做。其实这里可以有一个借鉴,就是密码学货币里面当时数字货币的设计有很多,比特币是最成功的,就使得所有后面的 crypto coins 都是跟它的——它对世界没有提供任何其他的正面的效益,但它领导数字货币。那么这种领先性我们是不是要考虑,还是我们等到他们(别的国家)发展起来再去学、再去跟、作为他们的一个部分。比如它全球化了,那么我们排在后面作为一家加入进来,会不会像加入 WTO 那么的难加入,是吧?所以这里(数字货币)“产生”的挑战和“不领先”的挑战难度至少是一样的,我是这么认为的。“把它做好”这件事情像是一个挑战,但是“不做”可能挑战更大。数字货币还有一个作用,就是管理。比如突然一下几个资本家花一大笔钱,把全世界的或者全国的出租车行业都买下来了,以前没有过的,他不知道怎么管理。那么现在很多互联网公司内部都用一种币来管理,觉得这样挺方便的。比如说微软,它讲每个单元给你一部分 budget,budget 是以内部的一种虚拟币的形式给出来,然后做管理。所以这方面的研究不单单是一个国家的数字货币的发展,互联网企业的管理、区块链以后成长的管理其实都面临着非常大的问题,在这一点上,数字货币或者虚拟币是一个解决方案(也需要研究)。


9 能从博弈论的角度来谈一谈内卷到底指的是什么?您是怎么看待这个问题的?


内卷也是我刚学的词,印象非常深刻,每次到卷的时候我就讲大家别卷了,再努力学习也不会有大家都是第一的这种情况是吧(笑)这件事情怎么说呢,是一个竞争的结果吧,有好处也有坏处。一个好处就是我们国家的科技生产力强大了,比如说我们的头条挺成功的,到国外甚至人家要把你关了,因为你太成功了。那么这样的话国际竞争方面,就是我们内部的这种卷产生了对外部的影响力。但另一方面,我就讲这个事情它最后的影响吧,原本世界数学竞赛经常我们国家拿第一第二是吧,那么现在我们不行了,不行的理由是我们很多同学到美国去参加比赛跟我们国内的同学进行比较。或者我们的乒乓球教练跑到国外去打败我们的国家队是吧?(笑)所以我觉得我们也不一定要那么卷,能够有竞争也有一些调整吧。当然(内卷)对于我们国家的技术优势有很大的帮助,但是我每次看到我们出去竞赛又输给美国的一个中国人(就觉得还是别那么卷)(笑)。从博弈论的角度就是演化博弈论嘛。里面有一种研究,就是说群体优化的时候它不是对于个体优化的考虑。我知道有一个工作说,在群体博弈中最后存活下来的不是某方面最好的基因,是那种各种性能都比较中上的这种综合性的基因比较成功(那么单方面上最好的基因就消失了,这很可惜)。所以内卷的话,两边是敌对的时候可能比较好,要是合作竞争的状态的话可能调整一下比较合适。


10 您是如何处理好各种科研、教学和事务性工作的?您的科研动力是什么?


我觉得这是同学的误解(笑),但是我身边的人都非常积极努力,帮我做成了很多事情。比如说我们这边吴双老师——我的秘书,帮我做了很多事情,然后通过她的组织,我们同学又做了很多。所以我积极的努力也受同学的影响、受身边的影响,是有这种外因的推动。


图 3 邓老师和同学们一起去长城郊游

然后(内因的话)我们这个领域——计算机科学、人工智能,对科学进步的各种可能性推动非常大。比如博弈论这个角度上,我刚才提到的纳什均衡是人类挺难应对的一个情况,在竞争环境中想做到合作博弈是非常不容易的。那么这里我们说通过计算机的帮助,能不能做到有更好的方法,能够替代纳什均衡个体优化的机制设计。就单对这一个问题,我觉得我们人工智能领域来说是挺大的挑战。

图 4 邓老师在长城处理工作


11 您曾在多地和多国学习和任教,您觉得中外顶尖大学和科研机构有哪些可以互相借鉴的地方?


也有点太多(笑)

在清华的时候就比较简洁,你讲内卷,那么当时也是一个挺内卷的感觉。我们每个同学都是每天早上起来努力学习,晚上也是努力学习,各种努力学习。那时候刚进去的时候也都是挺害怕的,见一个人觉得他比我厉害。我当时总结出来一个经验,就是只要你旁边一个人在某个地方达到你的 60% 的时候你就开始害怕。那么就是人人恐慌,因为也有可能你在另外一个方面达到另外那个人的 60%,他也会害怕你,就相互害怕(笑)。

科学院当时也挺好的,我们老师带我们到处去开会、交流。我后来数一数,去了 5 个地方,都是讲习班,要么老师去讲习,要么去听老外的讲习,然后也认识了挺多比较有名的老外。想想特别感谢我们老师,我们那时候科研经费挺少,但是老师也拿出来给我们花,让我们跟他一起出去做这些交流。

在斯坦福的时候就有点反过来了,基本上和老师一个学期见一次面(笑)。老师会给很多问题给你做,总有一个可以做出来,这样子也挺好的。老师讲课也挺神奇的,每次老师讲课快讲完时候你就感觉这个问题很有意义,我们很快就可以把它用上去,然后最后5分钟他开始讲证明,“if…”然后“Only if…”,把粉笔丢一丢,一下就过去了(笑)。然后老师布置阅读很多——当时是研究生课嘛,新的科研题目在那上面读的挺多。最后我觉得美国的教育跟其他地方教育有一点特别不同的地方,就是它因为有很多外国人去,就安排大家把几乎所有的专业课都重学一遍,有一个共同的基础,以后大家合作啊这些都能够建立起来。

然后在加拿大那边教学了一点时间,当时我的朋友讲你不要备课,说如果你都忘了,你教给学生有什么用是吧。他们是这个教法。

后来到英国利物浦。英国因为是人口规模小的国家,所以有一个特点就是在国内评估的时候,你跟外面国家合作的论文排序不管排到哪都算你的,但你跟同事合作的要一人分一半,就是鼓励你的国际合作,产生它的国际影响力。然后每个学校有不同——我们国家就是太同质化,前面你问内卷的时候,其实我应该这么回答。英国的大学就是说每个大学都要评你是不是世界第一或者是国内第一,那么每个大学做的东西就不一样了。最后要评估的时候,学校会全国招人把人换掉,比如这个领域我们发展的不错,就让不是这个领域的人申请其他学校,把英国其他学校人招到我们学校来。所以他每个大学能够活下来都有一个强的方向,其实这种思路挺成功的。现在也看到我们国家开始也有些改变,有些是综合一流大学,有些是专科一流。那么我觉得专科一流不应该鼓励他们发展成全科的一流,你下一次发展成全世界第一或者全世界前三,其实也是挺好的一个思路。

北大我觉得我们的同事、同学是最好的,大家都很努力,学生也很努力,然后整个管理方面也比较人性化。在北大挺觉得荣耀的就一件事是,比如有一些讨论的时候,看见我们老师可以说出来他什么地方做得好、哪件事做得好、哪个领域做得好、哪个问题做得好。在国内有一个缺点,就是我们总看他有多少 paper、在哪个领域有 paper,然后这个领域排到前百分之多少。但百分之多少全世界太多了是吧,那么这个百分之多少有时候其实不代表太多的意义。


12 可以介绍一下北大“图灵班”的同学有什么特点,其日常生活是如何安排的吗?


我觉得图灵班是挺成熟的,当然也是从卷开始(笑)。像图灵班是优中选优,所以我一开始给他们上课的时候也是准备的要求很高的课程。其实想,想卷也不是今天开始的,我们那时候考研究生的时候,他们也讲说你们这一届应该是最好的学生,然后考试题就卷得不得了,一个老师出一道题,每个老师出一道最难的。那么图灵班刚开始也是挺卷的,对同学的要求特别高,但这件事情就是作用力等于反作用力,当时自己也挺累的(笑)。

现在好了,图灵班同学成长起来了,下一班的同学就可以用上一班的同学做助教。而且学生教学生其实是最好的方案,我大学的时候就这么觉得,因为老师有时候跟同学距离有点远,不知道学生学过什么,什么都得重新开始,同学不一样,高一年级的同学之前上的课基本上跟下一年的差不多,就特别有帮助,学生也成长的挺快的。

我们也组织活动,一起出去郊游什么的也都挺多的。北大学生很优秀的不光是学习,是各方面,所以他们组织的活动也挺开心的。但是确实卷这件事情在这里很糟糕,有些时候也是希望老师帮一帮他们,家长也多给他们一些正面的鼓励,这样就会少卷一下。


福  利

 时  间 

13 您在选择研究生时,会青睐具有怎样特质的学生呢?


我对我们的研究生其实挺希望的一件事就是,你要发现你的优点,然后发挥你的优点。当然一个基本态度是“不要浪费生命”,但是你的优点跟别人的优点不一样,就是不要太卷。其实比如北大的学生来讲,每一个人做什么事情都会挺成功的,别人早进步一点、你晚进步一点不是太重要的东西。比如我跟博士生也说,最后你的学术生涯最重要的东西就是你的博士论文,不是这门考试比别人少一分。

招研究生的特质的话,肯定是相信自己,自信心是最重要的。然后是选择你最喜欢的专业。去发现自己的才能,在你自己才能方面发展起来。

最后建议方面有一点思路是,关于国内国外这件事,总体来看我们的国家这么多年发展那么出色,你像外国都觉得我们进步太快,因为这个理由要限制我们。所以我们同学就不要想太多,尽量去做最合适的工作,最好的成长起来,什么事情都不会难倒你们。



视频:黄裔童,李阳

文字:王梓薏

编辑:田政,鲁云龙,王宁宇,吴晓艺张海峰


关于我们

RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。我们将在微信公众号发布论文解读、学术动态、名家观点等,欢迎大家关注我们!



我们还在 Bilibili 平台发布最新的讲座回放等视频资料,欢迎扫码观看!



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存