查看原文
其他

CMU的AI赢了扑克,但这远远称不上机器智能的胜利(附技术论文)

2017-01-31 新智元

1 新智元编译  

来源:卫报 

编译: 刘小芹  文强  胡祥杰

AI复始,万象更新 !

新智元祝广大订户鸡年大吉!


新智元日前宣布,获6家顶级机构总额达数千万元的PreA轮融资,蓝驰创投领投,红杉资本中国基金、高瓴智成、蓝湖资本 、蓝象资本、今日头条跟投。本轮融资将用于新智元团队规模扩充并增加新产品服务线,目标打造 To B 的人工智能全产业链服务平台。

新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 

简历投递:jobs@aiera.com.cn

HR 微信:13552313024

新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。

加盟新智元,与人工智能业界领袖携手改变世界。


新智元导读CMU的AI“Libratus”以绝对的优势在单挑无限德州扑克中赢得了人家职业玩家,这无疑是AI发展史上的一座里程碑,就像日前谷歌CEO Brin 在达沃斯论坛上表示的那样,AI发展如此之快,超出我们的想象。不过,这次CMU的AI更多是依靠暴力计算而非深度学习取胜,与AlphaGo战胜李世石的意义十分不同。我们离真正的机器智能还有很长的距离。下面就从获胜的 Libratus 使用技术的最新论文开始看起。




摘要


与信息完全对称的博弈不一样,信息不完全对称的博弈不能分解为独立解决的子游戏。因此,使用更加计算密集的 equilibrium-finding技术,进而生成和解决较小版本的,也就是简要版本的游戏,这是非常必要的。


终局游戏的解决方案(Endgame solving),指的是计算(理论上)更好的策略,但是只是面向终局游戏,而不是整个游戏中所需要的计算能力。Endgame solving 有很多优势,比如能够1)在一个更精细的信息抽象中解决终局游戏,而不是整个游戏计算上可行的游戏; 2)结合到对手所采用的终止游戏中的动作抽象用来解决整个游戏。


我们介绍一种在博弈理论和实践中胜过先前方法的终局游戏解决技术。我们还展示了如何采纳它,并通过过去的解决方案,来响应原始动作抽象之外的对手行为,这明显要优于当前最先进的方法。


最后,我们展示了在游戏进行的过程中,终局游戏的方案可以不断重复,导致明显降低了可利用性(exploitability)。所有的技术都根据可利用性进行评估。


据我们所知,这是第一次在大型不完全信息游戏中评估了游戏解决技术的可利用性。




10天前,在达沃斯论坛2017年年会,Sergey Brin 与一名采访者坐下来谈论人工智能(AI)和未来(视频:)。Sergey Brin 是谷歌的联合创始人之一。他谈话间的语气深思熟虑,但很柔和,主要因为他是一个聪明而且周到的人。在被问及人工智能的未来时,他明智地回答说“不可能准确地预测”,随即讲了他自己的一个故事。


十年前,Brin 还在主管谷歌的X实验室,那里的项目成功的几率是百分之一。有一个专注于 AI 的小项目叫 Google Brain。“坦白说,”Brin 说,“我那时根本没有注意到它。”Brain 项目由一名名叫 Jeff Dean 的计算机科学家领导,Brin 回忆说:“他会定期地来找我,说,‘看!计算机做了一张猫的图片!’我说,‘好好,这不错,Jeff,回去做你的活儿,什么都好。’然后快进几年,现在Brain 几乎触及了我们的所有主要项目——从搜索到照片到广告……触及了谷歌的所有业务。深度网络的这场革命非常深刻,而且让我感到惊讶——哪怕我就处在这场革命中间。”


快进一周,从达沃斯的那次采访,让我们把镜头切换到匹兹堡,四位顶尖的职业扑克玩家正在用他们的智慧与一个由两位CMU研究人员开发的 AI 程序作战。比赛的内容是一种特殊的高赌注扑克牌,称为一对一无限注德州扑克。该 AI 程序名为 Libratus,在拉丁语中的意思是“平衡”。然而,它一点也不平衡。在20天的比赛中,Libratus 已经赢了$800000,让人类对手开始感到沮丧。参加比赛的职业玩家之一 Dong Kim 说:“直到今天我才意识到它(AI程序)有多厉害。我觉得我在和一个会欺骗人的对手打,它好像能看到我的牌。我不是指责它作弊,它只是太厉害了。”


人工智能已经走过了另一座里程碑,匹兹堡大赛表明,一台机器可以在面对真正的人类扑克专家选手时,也能玩出一场表现相当的比赛。这件事情意义重大,因为扑克所需要的推理和智能机器是没有的。扑克中没有单一的一个最佳选择,机器必须不断改变其战术,确保对手难以发现它什么时候是在虚张声势。MIT TR 编辑、机器人专家 Will Knight 说,“扑克从根本上不同于跳棋、国际象棋或围棋,因为对手的牌在对局过程中一直是看不到的。在‘不完整信息博弈’中,考虑到你的对手可能采取的每一种可能的方法,并找出理想的战略是非常复杂的。而无限注德州扑克尤其具有挑战性,因为对手可以赌任何金额。”


匹兹堡比赛肯定会在通往某种AI的道路上的一系列重要阶段中占据一席之地。早些时候,包括1997年 IBM 的深蓝战胜国际象棋大师加里·卡斯帕罗夫,同样是 IBM 的 Waston 2011年在问答游戏 Jeopardy!中获胜,还有2016年3月 DeepMind 的 AlphaGo 击败世界围棋冠军,每一个都可以被视为一项惊人的成就,但在现实中,这些都只是一段很长的旅程中的最初几步而已——虽然现在关于“超级智能”的炒作随处可见。


那么,我们如何对 Brin 在达沃斯遇到的问题做出明智的评估呢?研究界喜欢用的一种方式是将 AI 区分为两种——强 AI 和弱AI。强AI意味着具有人类能力的感知、自然语言、推理和运动控制能力的机器。弱AI就是我们现在的AI——让亚马逊或Netflix猜测你可能想要购买或观看内容的东西,让谷歌用来“自动完成”搜索查询的东西:换句话说,机器学习和大数据。所以在某种意义上,你可以说AI的未来已来。另一方面,实现强 AI 似乎还有很长的路要走。AI 领域的真正大师之一,Geoffery Hinton 认为在他的有生之年不会看到强AI的实现。虽然 Brin 现在只有43岁,他或许也不会看到强 AI 的实现。




【寻找AI独角兽】新智元联手10大资本

启动2017创业大赛


AI 创业大赛由新智元与10 家主流 AI 创投机构:蓝驰创投、红杉资本中国基金、高瓴智成人工智能基金、蓝湖资本、蓝象资本、IDG资本、高榕资本、中信建投证券、明势资本、松禾远望基金携手发起,由新智元主办,北京市中关村科技园区管理委员会、中关村科技园区海淀园管理委员会支持,是一场聚合了 AI 技术领袖和投资领袖的盛会。新智元向满怀雄心的未来AI独角兽提供强大的创投资源对接机会,顶级风投 TS 等你来拿。http://form.mikecrm.com/gthejw


点击文章下方阅读原文,在线填写报名申请报名表。该报名表为参与评选必填资料。


如有更多介绍资料(例如BP等),可发送至 xzy100@aiera.com.cn,邮件标题请注明公司名称。如有任何咨询问题,也欢迎向该邮箱发信联系。


大赛咨询,请添加新智元微信号:



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存