继围棋之后，扑克又被人工智能攻陷

Original 2017-01-17 DeepTech深科技

这是人工智能发展史上一个里程碑式的成就，由加拿大和捷克的研究者所开发的扑克AI已经在一对一的德州扑克游戏中击败了几个专业玩家。

更值一提的是，这个项目的研究人员介绍说它是通过俗称“找感觉”的近似方法来战胜人类对手的。

密歇根大学专攻于博弈论和人工智能的教授Michael Wellman说：“这确实是人工智能在游戏对战中的巨大进步。首先，它在一个非常流行的游戏中实现了一个跨越，击败了专业的人类玩家；第二，它所激发出来的想法又加深了人们对不完全信息博弈的思考。”

Michael Wellman教授

这场世界级的扑克玩家与卡内基梅隆大学开发的AI程序的对战在匹兹堡赌场进行。领导本次项目的卡内基梅隆大学教授Tuomas Sandholm说，本次测试汇集了人类最顶尖的玩家，在为期20天内的的赛程中有12万人进行了比拼，这为我们提供了更多详尽且有意义的统计数据，目前我们可以确认AI已经掌握了这项游戏。

这个已经击败部分顶级扑克玩家的软件名为DeepStack，它由阿尔伯塔大学计算机科学教授Michael Bowling带领的团队所开发的。该团队的相当一部分成员是来自捷克查尔斯大学和捷克技术大学的研究人员。研究者说，DeepStack已经进行了近45000场对决，保持全胜的纪录。

由于包含了不确定性的因素，所以扑克比许多其它AI游戏都要更为复杂。例如，如果对手虚张声势，AI就无法做出判断；AI也无法看到对手的手牌，这意味着与跳棋、象棋、围棋相比，扑克当中的不完全信息会对AI造成很大的困扰，而这也就是难点所在。这也就能解释来自英国的DeepMind团队为什么可以轻易击败全世界所有的围棋高手了。

双人对决形式的无限制德州扑克的下注金额是完全自由的，你所持有的筹码都可以下注。而这对计算机来说就需要很长的时间来进行判断，而最后得出的结果也不一定十分完美，毕竟它拥有10160 种出牌的可能性。

而DeepStack的训练方式就是与自己进行对战。每场比赛后，它会复习和改进自身的战术，来安排出更好的策略。考虑到扑克的复杂性，DeepStack团队也将之前的对战复盘供AI结合深度学习算法来进行不断改进。

Wellman也补充到：“对于这样一个复杂的游戏真正有意义的是能够有效地计算出在每种情况下采取的行动，而不是让其在一个按部就班的程序中持续运转。”

研究人员将DeepStack的技术与人类玩家的本能做了比较。当对手在虚张声势或胜券在握时，AI的出牌依据是对手的博弈模型而不是他们的肢体语言，这也是计算机与人类最大的不同之处。

当然，也可以通过查看多次游戏中相较于下注而取得的收益来衡量扑克玩家的表现。据统计，DeepStack的胜率大约是专业球员的9倍。

编辑：谢伟伦

欢迎关注DT君的科幻电影公众号：

招聘

编辑、视觉设计、视频策划及后期

地点：北京

联系：hr@mittrchina.com

MIT Technology Review 中国唯一版权合作方，任何机构及个人未经许可，不得擅自转载及翻译。

分享至朋友圈才是义举

反向激励，在加速这个社会的黑化

Wealth | 中国成本轮金价涨势的前沿和中心

“Green & IntelligentManufacturing” Chinese Bridge Online Program

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！