【面试现场】如何设计可自学习的五子棋AI?
最近要开始忙着复习考试了,没啥时间写长文,我尽量给大家找些高质量的文章
小史是一个应届生,虽然学的是电子专业,但是自己业余时间看了很多互联网与编程方面的书,一心想进BAT互联网公司。
今天他去了一家国内人工智能巨头公司面试了。
简单的自我介绍后,面试官开始发问了。
【面试现场】
题目:如何设计可自学习的五子棋AI?
【请教大神】
小史回到学校,把面试的情况和计算机学院的吕老师说了一下。
【AlphaGO】
吕老师:一开始的AlphaGO是什么都不知道的,它是随机落子。但是它并不是random一个点,而是根据现场的情况和自身的算法,来落子,只是算法中的参数是随机的,所以落下的子也是随机的。
吕老师:这就要靠人去设计了,当然我们现在有一些比较成熟的神经网络模型,选好之后,所谓的训练啊,学习啊,其实都是在调节里面的参数。
【五子棋AI设计】
吕老师:首先我们来看你的算法,你会发现它的规则都是定死的,如果出现一种没有考虑到的情况,那么算法就不能进行堵截。
吕老师:哈哈,如果这样做的话,这种情况是无穷无尽的。而且五子棋的玩法比较简单,你还能设计出这样的规则,像围棋这种复杂的棋类,你可能没办法去设计这些规则了。
小编注:关于这种算法的具体实现,由于篇幅较大就不在文章中具体展开了。想了解具体实现的朋友可以观看我在慕课网录制的免费视频教程:JS实现人机大战之五子棋(AI篇),文末点击阅读原文可进入。
【AI】
吕老师:小史,你看4个子的权重,你给10000,或者给50000,甚至给1个亿,对于其他值来说都是绝对高的值,所以最后效果应该是一样的。
吕老师:我们刚刚设计的这个五子棋算法,其实还是很简单,所以搜索空间并不大,如果是围棋这种复杂棋类,搜索空间将巨大无比,那就要采用非常先进的AI算法了,里面可能有成千上万个参数,训练起来计算量也是非常大,会有很多降维算法在里面,这些等你真正遇到,我再给你讲吧。
推荐阅读:
你真的了解 i++, ++i 和 i+++++i 以及 i+++i++ 吗?