静园5号院科研讲座 | 阿德莱德大学郭铭余谈如何通过神经网络学习拍卖机制
关键词:拍卖机制
编者按
2019年11月26日,阿德莱德大学郭铭余博士受邀访问北京大学前沿计算研究中心,并在静园五院做了题为“Mechanism Design for Public Projects via Neural Networks”的主题报告,介绍了如何通过神经网络去学习拍卖机制的工作。报告由中心讲席教授邓小铁老师主持,听众主要来自信息科学技术学院的师生。
▲ 郭铭余博士报告现场
郭老师首先提出了近年来自动机制设计的想法:直观上来说,机制设计本质是一个多变量函数。如果把机制设计的空间离散化,通过机器学习的相关技术,就可以学到空间中一个可能最好的机制。这样的想法似乎很好地解决了整个问题,其中的每一步看上去都是可行的。然而,一个非常关键的问题是,这个离散化的空间是否真的存在一个机制,和我们想要的最优机制非常接近?即使我们离散化足够好,这样是不是会带来额外的代价?进而,在机制效果保证和计算代价之间,存在一个平衡。
近年来有一系列工作,用当前很热门的深度学习神经网络,去学习最优拍卖机制。这些问题中,分布信息其实也是已知的,但即使已知分布也会对机制设计造成挑战:多物品拍卖场景下,计算一个最优拍卖机制可能是计算复杂的,以及表示复杂的。其中一部分工作的做法是把分配方案和定价方案用两个神经网络去建模, 把机制设计的约束通过采样来近似表示,然后用深度学习神经网络去训练模型。另一部分的相关论文只考虑了单个买家的场景。他们把机制(或者称为定价)和买家分别建模为神经网络,并使用深度学习的思路去学习。这里买家网络事实上被机制网络直接推出。
接着,郭老师介绍了他们的工作动机:他们考虑了一个更为复杂的机制设计场景,这个场景可能会进行多轮迭代。他们拥有的信息是数据的一些采样信息,以及数据服从的分布。他们考虑了如下 Public Project 问题:在这个问题中,大家要决定是否建造一个设施,这个设施的建立会给每个人带来一定价值。在问题的开始,按照大家的意愿募集建造设施的资金,如果募集的资金达到了一定量,这个设施就会建立,否则就不建这个设施。这个问题的目标函数包括两种:最大化参与的人数以及最大化参加人的社会效益。这里买家假设是服从独立同分布的。郭老师详细介绍了这一问题已有的理论结果,包括 Non-excludable 情形和 Excludable 情形,后者情况下只有参与募集的人可以使用这一设施,而前者情况下所有人都可以用这一设施。
之后,郭老师针对 Public Project 问题的已有理论,分享了他们的神经网络学习方案中的一些心得。比如机制设计中的哪些部分适合用怎样的神经网络结构/层去学习、输出不直接使用分配方案和定价方案等。郭老师提到,其实可以用一个静态神经网络结构去模拟多轮迭代场景,但他们的实验结果发现,如果采用这样的方案,网络结构会变得很复杂,进而导致梯度消失以及数值错误等实际运行中的问题。郭老师介绍了他们如何建模迭代策略选取的神经网络,其中每次的策略选取是用一个单独的程序运行的,而不是嵌入到神经网络中。郭老师展示了他们用不同的启发式方法用神经网络做法学习拍卖机制的效果。
最后,郭老师总结到,机制设计问题作为一个多变量函数优化问题,天然适合用深度学习的方法去学到最优机制,但现有的结论还在一个初步阶段,有很多亟待解决的问题。报告结束后,郭老师和中心的师生进行了深入交流,讨论各种科研思路的可能性。
▲ 邓小铁教授与郭铭余博士合影
文字 | 肖涛
EconCS@PKU
往 期 报 告
— 版权声明 —
本微信公众号所有内容,由北京大学前沿计算研究中心微信自身创作、收集的文字、图片和音视频资料,版权属北京大学前沿计算研究中心微信所有;从公开渠道收集、整理及授权转载的文字、图片和音视频资料,版权属原作者。本公众号内容原作者如不愿意在本号刊登内容,请及时通知本号,予以删除。
点“阅读原文”看报告概要等信息