其他
AI雀神征服一大波麻将好手!人类玩家表示:太“南”了…
药明康德AI/报道
Suphx vs.人类玩家,大展拳脚
图片来源:MSRA官网
微软克服麻将AI的“痛点”
图片来源:MSRA官网
采用自适应策略。与只有52张牌的德州扑克相比,麻将有136张牌其排列组合的可能性更多;同时,在一局麻将中玩家出牌不具有顺序性,任意玩家的“吃碰杠”都可能使出牌顺序突然改变,导致游戏树不规则、且处于动态变化的状态。于是研究团队针对这种复杂而又巨大的变化空间,对Suphx采用自适应学习策略,这样人工智能系统可以动态调节自己的状态从而适应牌局中的千变万化,这样能比传统算法策略更有效地预测牌局发展方向。 先行教练技术。为了解决不完全信息的挑战,Suphx使用了基于深度强化学习的“先行教练”技术。其基本思想是:在AI采取自适应策略进行学习的阶段,利用牌局隐藏信息指导模型的训练方向,使AI的学习路径更接近最优路径,掌握的牌局信息更完善。这样的方法能使Suphx更深入地研究和理解可见信息、挖掘隐藏信息从而为决策提供有效的依据。 全面预测技术。为针对麻将复杂的牌面表达和计分机制,研究团队还利用全面预测技术搭建起每轮比赛和 8 轮过后的终盘结果之间的桥梁。这个预测模型经过算法训练设计而成,可以理解每轮比赛对终盘的不同贡献,从而将终盘的奖励信号合理地分配回每一轮比赛之中,以便对自我博弈的过程进行更加直接而有效的指导,并使 Suphx 可以学会一些具有大局观的高级技巧。
打破技术边界,展望未来
图片来源:Pixabay
本文由药明康德AI整理编译
参考资料(可上下滑动查看)
[1] Meet Microsoft Suphx: The World’s StrongestMahjong AI Retrieved Sep 3, 2019 fromhttps://syncedreview.com/2019/08/30/meet-microsoft-suphx-the-worlds-strongest-mahjong-ai/[2] More than a game: MasteringMahjong with AI and machine learning Retrieved Sep 3, 2019 fromhttps://news.microsoft.com/apac/features/mastering-mahjong-with-ai-and-machine-learning/[3] https://www.msra.cn/zh-cn/news/features/mahjong-ai-suphx[4]After 5,000 games, Microsoft’sSuphx AI can defeat top Mahjong players Retrieved Sep 4, 2019 fromhttps://venturebeat.com/2019/08/30/after-5000-games-microsofts-suphx-ai-can-defeat-top-mahjong-players/版权说明:欢迎个人转发至朋友圈,谢绝媒体或机构未经授权以任何形式转载至其他平台。转载授权请在「药明康德AI」微信公众号后台回复“转载”,获取转载须知。
点击图片阅读:AI看心电图,比医生更好监测患者,比患者更清楚未知并发症
点击图片阅读:更快更准的未来治疗,AI在这5个方面交出满意答卷
点击图片阅读:AI扑克大师碾压人类top玩家获胜,再登Science封面!