查看原文
其他

看棋评学国象:英国科学家尝试另类AI棋类算法

国际象棋人工智能


让AI学会下棋、成为“棋类大师”,一直是人工智能领域广为研究的课题。


近日,来自伦敦大学学院的Kamlish等人公布了他们另辟蹊径的研究试验——SentiMate,一种采用自然语言处理方法,通过训练网络评论文字来学习国际象棋的算法。它通过分析棋类专家解说员的反应,对国际象棋招法质量进行评价。



在SentiMate之前,人工智能主要通过不断地对弈进行训练学习。2016年击败围棋世界冠军李世石的AlphaGo使用神经网络,与人类棋手的棋谱进行训练,学习如何下围棋。到了2018年,AlphaZero依靠深度神经网络、通用强化学习算法和蒙特卡洛树搜索,通过自我对弈进行强化学习。


AlphaZero参考阅读

AlphaZero完胜国象和将棋

★AlphaZero重创Stockfish8

★AlphaZero史上最强棋类AI


与Alpha系列采用神经网络、自我训练的方法不同,SentiMate尝试了一条自然语言学习路径。该团队首先收集来自网络的2700条国际象棋对局评论文本,然后建立了一个分类器,该分类器能够在大量评论数据集中,提取描述国际象棋招法质量的评论。他们还在国际象棋评论数据的基础上,训练了一个情绪分析模型,分析人们通过语言所传递出的正向情绪来评估招法质量,从而指导机器人在棋局中的下一步行动。研究人员称,这两个模型都达到了90%以上的分类精度。在此基础上,他们提出了一个国际象棋引擎sentimate,它基于预先训练的情绪评估功能来评估棋弈招法。



让研究人员感到惊讶的是,SentiMate已有能力理解国际象棋的一些基本原则并能制定几个关键策略。《麻省理工科技评论》据此评价称,虽然SentiMate从未战胜过传统训练路径下的国际象棋机器人,很难被称作AlphaZero那样的“国际象棋大师”,但这个新路径展示了利用更少的对局数据、更低的计算需求,通过语言分析的方法来研究国际象棋游戏的前景。


“自然语言处理的下一步是将机器学习到的信息转变为切实的行动,来解决真实世界的任务”,研究人员对《麻省理工科技评论》表示,SentiMate所采用的学习技术还可以用来分析体育赛事,预测金融活动。“毕竟还有大量的书籍、博客和论文都在等待学习”。


(编注:改正了文中多处翻译错误)


相关阅读

计算机国际象棋漫谈

一次关于人工智能的对话

深蓝与 AlphaGo 有何区别

机器自学72小时堪比国际大师

AI研究 国象领先中象一车

小卡:克服恐惧拥抱人工智能

20年前卡斯真的输给深蓝了?



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存