人机大赛再次燃爆:AI德扑大师来华对阵华人顶尖牌手
本文转载自创新工场微信公众号
2017年4月6日至10日,由创新工场CEO暨创新工场人工智能工程院院长李开复博士发起, 邀请母校美国卡内基梅隆大学(Carnegie Mellon University)知名的Libratus扑克机器人主创团队访问中国,于海南进行一场“冷扑大师v.s.中国龙之队—人工智能和顶尖牌手巅峰表演赛”,对阵由中国扑克高手杜悦带领的“中国龙之队”,这也是亚洲首度举办的人工智能与真人对打的扑克赛事。李开复博士表示:此次创新工场引进并发起这场人机扑克赛事,就是希望在国内引发更多关于人工智能未来创新及产业发展的讨论,激励更多有识之士和年轻创业者投身这一领域,共同推进人工智能产业在中国的发展。
相较于国际象棋或是围棋等所谓的“完美信息”游戏,扑克玩家彼此看不到对方的底牌,是一种包含着很多隐性信息的“非完美信息”游戏,也因此成为各式人机对战形式中,人工智能所面对最具挑战性的研究课题。2017年1月,由卡内基梅隆大学Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus扑克机器人在美国匹兹堡对战四名人类顶尖职业扑克玩家并大获全胜,成为继AlphaGo对战李世石后人工智能领域的又一里程碑级事件。李开复博士指出,这一波人工智能的浪潮将比我们所能想象的更加猛烈和真实,从他关注一月美国Libratus赛事就发现,在开战前不曾演练历史牌谱的前提下,人工智能所展現的学习、推理、模仿、决策等能力已趋于更加丰富和完善。可以预见,未来人工智能将在商业谈判、网络安全、医疗咨询等很多领域将发挥革命性的变化,人工智能将推动的种种巨大改变,十年内必然发生。
为确保此次表演赛的精彩呈现,Libratus主创团队的Tuomas Sandholm教授和 Noam Brown十天后将亲自访华现场督战。中国“龙之队”则由六位华人顶尖扑克选手组建成军,队长杜悦现任常春藤资本基金合伙人,此前曾在人人集团担任集团副总裁,拥有清华大学计算机系本科和硕士以及美国斯坦福大学MBA学位。杜悦曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军,据曾与其交手过的牌友称,杜悦对游戏理解独到,智商、体能、心理之强大非常人能及。龙之队其他成员包含许朝军、张淮、童舟、朱亚希、王天建,均为扑克顶尖资深玩家(详见:中国龙之队介绍)。
此次表演赛由创新工场与海南生态软件园联合主办,传奇扑克承办, 春光里协办,杜悦作为赛制策略顾问。天神娱乐董事长朱晔、丰厚资本暨春光里创始合伙人杨守彬等大咖助阵;亚美娱乐,迪锐克斯科技,春晓资本,品途商业评论赞助支持。4月6日至10日赛事于海南省澄迈县的海南生态软件园举办,期间六位牌手将进行每天上下午两场共10小时的人机对战,每人同时打两手牌,对牌手们的心志、专注力和体能都是不小的挑战。与此同时,人工智能“冷扑大师”程序将由美国匹兹堡超级计算机中心(Pittsburgh Supercomputing Center)远程调度运算资源,和真人牌手进行实时12手牌同步对战,与华人高手决战巅峰,五天表演赛全程估计将达到36000手牌。此次“冷扑大师 v.s. 中国龙之队”人工智能和顶尖牌手巅峰表演赛将在腾讯、新浪微博、网易、爱奇艺、乐视、优酷等视频平台和多家直播及游戏垂直平台播出,亚洲首度人工智能与真人对打的扑克赛事点燃中国,令人期待。
Libratus人机扑克介绍
人机扑克是什么:
Libratus 是一个玩无限德州扑克的人工智能程序。Libratus的策略并非基于专业玩家的经验,所以它的玩牌方式可能有明显的不同。基于在匹兹堡超级计算机中心大约 1500 万核心小时的计算,它使用算法分析德州扑克规则,解决AlphaGo也无法处理的不完美信息,从而建立自己的策略,而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步。
研究背景:
❶. 扑克智能程序前身:2016年卡耐基梅隆大学(Carnegie Mellon University,以下简称CMU)一位Tuomas Sandholm教授曾领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中惨败。这也是Libratus的前身。2017年Libratus由Sandholm 教授联同另一位Noam Brown博士开发完成,Libratus的水平提升基于数个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。
❷. 操作难题:不完整信息博弈早已被证明是难以攻克的计算机难题。对此,CMU 的人工智能研究者们专注于信息集,通过同时思考未知和已知变量各种可能状态的方式来进行预测,这需要强大的计算能力。
❸. 计算技术:Bridges Super Computer超级计算机。每个牌局结束后的夜晚,匹兹堡市超级计算中心Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略,Bridges提供三种类型的计算选项,称为节点:常规、大型和超大型。Bridges不是当今世界最大、最快、最强劲的超级计算机,但它可能是面向公众开放的,最大、最快、最强劲的超级计算机,在Bridges的帮助下,原本在个人电脑上耗时数月的计算,仅仅几个小时就搞定。
❹. 技术应用:没有用到专业的牌局进行神经网络的训练,不同于AlphaGo用了大量的棋局做训练,这个模型用的是随机生成的牌局(随机产生公共牌、底池筹码、玩家拿牌概率)和尝试性的动作带来的结果(在随机生成的输入情况下模拟玩家跟牌后的结果)作为训练数据。Libratus 还利用了博弈论,与AlphaGo不同,Libratus系统不通过分析大量可能的下一步完成任务,这个 CMU 构建的新系统通过平衡风险与收益来决定自己的下一步,在纳什均衡定义中的完美游戏状态。
对外赛事:
❶. 2015年,CMU曾组织了首场“大脑对抗人工智能”赛事。在当时的赛事中,代表CMU出战的是另外一款人工智能系统,同样是由Tuomas Sandholm教授开发的“Claudico”。有四名职业扑克玩家参加了比赛,当时扑克职业玩家与Claudico仅进行了8万手牌的比赛。然而,Claudico并未获得最终胜利。
❷. 2016年11月初的四周里,由阿尔伯塔大学开发的DeepStack 击败了 11 位德州扑克职业选手中的 10 位,统计上,赢的优势很大,与每位对手玩了 3000 手。
❸. 美国时间2017年1月30日,在宾夕法尼亚州匹兹堡的Rivers赌场,CMU开发的 Libratus 人工智能系统击败人类顶级职业扑克玩家。据官网介绍,此次比赛共持续 20 天,由四名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,最终AI赢得了176万美元 。
未来发展:
❶. Libratus在德州扑克人机大战中获得最终的胜利,是人工智能领域的巨大成就。玩德州扑克需要推理能力和心理战术,而这对于机器来说很难模仿。在围棋界纵横无敌的DeepMind AlphaGo本质上处理的还是完美信息博弈,无法处理德州扑克的不完美信息问题,更遑论使出诈唬(Bluffing)。Libratus在面临不完全或误导信息时,有进行推论的能力。现实世界中,不完美信息才是常态,各种看不见的隐藏信息产生了大量的不确定性,而德州扑克代表的就是这种类型的博弈。
❷. 未来Libratus这样的AI,可以用于商业谈判、网络安全、医疗方案制定等领域。人工智能发展的终极目标,是通用人工智能(AGI)。通用人工智能可以解决任何一个问题,而不是像Libratus或者AlphaGo这样只能专注于扑克或者围棋。想要实现AGI就得让人工智能学会解决不确定性问题,这也是此次人机大战的重大意义之一。
中国龙之队介绍
中国“龙之队”(Team Dragons)由顶尖扑克高手杜悦创建并担任队长。中国“龙之队”旨在以团队互助的方式,征战世界顶级德州扑克赛场,每年的“龙之队”都将由代表华人顶尖水平的扑克选手们组成,力争为华人在德州扑克这一项在全球广为流行且具有特殊魅力的智力运动项目上争光添彩。
队长 杜悦Alan Du
2016年在世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军,斩获金手链和80万美元的赛事奖金
杜氏学堂-德扑高级研修班,创始人及讲师
· 腾讯天天德州首席顾问
· 现任常春藤资本合伙人,负责TMT行业中早期股权投资
· 2011年至2014年,人人网副总裁,负责集团投资并购和战略发展规划
· 清华大学本科和硕士学位;美国斯坦福大学MBA学位
· 重庆南开中学毕业,免试保送清华大学就读计算机系
战队成员
许朝军
· 北京国际扑克学校创始人及校长,拥有众多德扑学员及仰慕者
· 具备丰富的德扑实战经验和理论体系,人称“京城名鲨”
· 点点网、啪啪创始人兼CEO
· 2010年1月至2011年1月,盛大在线首席运营官、盛大边锋总裁
· 2005年至2009年12月,千橡互动副总裁、校内网负责人
· 2000年至2005年,搜狐技术总监,技术委员会成员
· 1996年至2000年,16岁开始就读于清华大学计算机科学与技术系
张淮
· 超过10年德扑深度研究者
· 具备扎实丰富的德扑基础理论以及博弈论理论实践经验
· 超过10年IT公司CTO、CIO
· 10年Oracle高级工程师
· 清华大学计算机系本科,UIUC计算机硕士
童舟
· 2014年至今任北京千山剧影视传媒有限公司董事长兼总经理,代表作《温暖的日子》、《东道》、《医本正经》、《我就是有点头疼》等
· 2010年至2013年任北京星辉煌影视投资有限公司制片及策划,代表作《风云传奇》、《魔法乐天树》等
· 2007年至2010年就读于University of Essex
· 主要赛事经历:
- 2015年北京杯赛中赛主赛弟9名
- 2015年WPT China豪客赛第7名
- 2016年WPT China豪客赛第4名
- 2016年ACOP 8万豪客赛第11名
- 2017年第26届红龙杯8万豪客赛第17名
朱亚希
· 2012年毕业于浙江大学,就职于咨询公司;
· 2014年开始征战各大国际扑克赛事
· 2015年成为Pokerstars中国大陆第一位签约选手
· 2016年联合创始扑克爱好者社团-德研社
· 2017年加入中国龙之队;被业界封为“德扑女神”
· 现场锦标赛奖金记录57万美元
· 主要赛事经历:
- 2014年EPT赛季事布拉格站2K欧元无限注德州赛冠军,奖金147,980美元
- 2016ACOP25万豪客赛第六名,奖金133,447美元
- 2016澳门百万赛中国冠军赛冠军,奖金39,224美元
- 2013WPT中国主赛事第四名,奖金80,000美元
王天建
· 中扑网(dzpk.com)创始人,德堡扑克战队创始人,2013年亚洲杯中国冠军队队长,被业界封为“捕鲨王”
· 2006年创办中扑网,中国德州扑克开拓者之一,对德扑的宣传、普及以及技术引进方面做出杰出贡献,被杯称为“中国德州扑克教父”
· 在澳门国际赛事中获得两次MPC赛事冠军和一次APPT赛事冠军
· 2013年10月带领战队参加国际扑克联盟(IFP)复式德州亚洲国家杯,最终获得亚洲国家杯冠军
· 超过10年汽车工程PM经验以及超过10年互联网公司CEO经历
· 长江商学院EMBA22期硕士毕业,曾留学英国获汽车工程硕士学位
人机巅峰表演赛,敬请期待!
扩展阅读: