这只拒绝内卷的 AI 狼火了！高智商却自暴自弃，不想抓羊只想躺

程序员的那些事 2021-09-08

↓推荐关注↓

新智元报道

来源：B站等编辑：Yaxin

【导读】近日，一个狼吃羊的AI火了！在一个狼吃羊的AI智障游戏中，狼发现自己吃不到羊，直接选择了「自杀」。然而，狼选择撞石的原因竟是「自杀分数高」！

智障AI狼最近火了！

在一个狼吃羊的AI游戏中，狼发现自己吃不到羊，而选择了「自杀」。

那么，狼为啥会选择直接撞死呢？

傻狼选择「自杀」，只因人间不值得！

近日，微博上一位网友@二雨TR最近发文称，听我老师给我讲他搞游戏ai的事情笑死我了。

在他发布的这三张聊天记录截屏中，具体介绍了这个狼抓羊的游戏机制。

从截图中可以看出，狼选择撞石的原因竟是，「自杀分数高！」

在这个项目中，研究人员给设定了狼吃羊游戏的基本原则是，狼在20秒内得分越高越好，而羊在20秒内存活时间越长得分越高。

开局两只狼，还有六只羊，地图上红色带×的字符就是狼和羊随机出现的可能位置。

狼和羊前面有6根射线，是用来感知范围。当这6根线和障碍物以及地图边界碰撞，就会返回一个坐标。

那根坐标白线便是狼和离它最近羊的连接，这样狼就可以每次优先吃掉最近的那只羊。

在研究人员开始训练的最初阶段，先固定了羊的位置，让狼去学习抓羊。

在狼学会抓羊后，羊也以随机的位置出现在游戏中。

狼抓到羊，奖励10分

狼撞到障碍物，扣1分

为了节省狼抓羊的时间，每秒钟狼都会受到0.1的惩罚

其中，羊撞到石头不会死，只要存活时间长，羊就能得到高分。

如果这两只狼想要在20秒以内得到高分，需要狼吃到羊的数量越多越好，吃羊所用时间越短越好。

在研究人员进行了20W次的训练，竟发现狼抓羊的效果越来越差。

大多数情况下狼基本吃不到羊，而且在抓羊的过程中浪费的时间也被扣分，干脆就选择撞死了！

该项目的一位研究人员@Sdust星尘研表示，「之所以会自杀, 是因为狼在前几万次的训练中发现一头撞死只扣-1.1分(-1 + -0.1)。

往羊那边走两步撞死扣-1.1到-2.4分。

偶尔一次能吃到，虽然正分，但是不值得」。

狼是打工人，羊是永远达不到的升职加薪

这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。

网友们从狼抓羊的身上看到了自己。

那只狼不就是现在的我么！

狼就是打工人…每秒扣的是青春和时间，羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」，撞石头就是躺平摸鱼…

还有网友表示，「AI训练告诉你，为什么现在的年轻人都不愿意努力了」。

奖励机制不合理

有网友对这一项目的奖励机制设置是否合理提出了质疑。

还有网友认为，单步惩罚太大，而撞障碍物的惩罚太小，应该把奖励函数设置为，撞到障碍物的惩罚无穷大，那么狼就知道了撞石的代价，就不会轻易选择自杀了。

所以，狼选择自杀的部分原因也是奖励机制设置不合理而导致的。

星尘研在B站中的视频表示，狼自杀的错误是很多因素共同影响产生的，最主要的原因是迭代次数太少，20W次完全不够学。后面提高到100W次起步，效果直线上升。

自暴自弃的狼终于抓到了羊

训练次数从最初5W次一轮，迭代了13代。到后来改成200W一轮，迭代了5代，狼抓羊的训练效果明显提升。

在训练了300万次后，狼终于可以成功地吃到羊。

但是，游戏还是存在一定的缺陷，两只狼还是会偶尔撞石而死。

狼终于学会了抓羊~~

参考资料：

https://m.weibo.cn/6611961566/4613651452134398 https://m.weibo.cn/6611961566/4613930355525879

https://www.bilibili.com/video/BV16X4y1V7Yu?p=1

- EOF -

推荐阅读点击标题可跳转

1、用技术致敬每一位妈妈，B站up主用AI还原李焕英老照片动态影像

2、打马赛克就安全了吗？AI 消除马赛克，在 GitHub 三天收获 7k Star

3、2020 年腾讯新增 20 亿行代码，鹅厂第一编程语言还是它

关注「程序员的那些事」加星标，不错过圈内事

点赞和在看就是最大的支持❤️

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

bxrf的瓜

失信被执行人的孩子上学受影响吗？最高法明确：受限！

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

这只拒绝内卷的 AI 狼火了！高智商却自暴自弃，不想抓羊只想躺

↓推荐关注↓

新智元报道

【导读】近日，一个狼吃羊的AI火了！在一个狼吃羊的AI智障游戏中，狼发现自己吃不到羊，直接选择了「自杀」。然而，狼选择撞石的原因竟是「自杀分数高」！

傻狼选择「自杀」，只因人间不值得！

狼是打工人，羊是永远达不到的升职加薪

奖励机制不合理

自暴自弃的狼终于抓到了羊

您可能也对以下帖子感兴趣

bxrf的瓜

失信被执行人的孩子上学受影响吗？最高法明确：受限！

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

生成图片，分享到微信朋友圈

这只拒绝内卷的 AI 狼火了！高智商却自暴自弃，不想抓羊只想躺

↓推荐关注↓

新智元报道

【导读】近日，一个狼吃羊的AI火了！在一个狼吃羊的AI智障游戏中，狼发现自己吃不到羊，直接选择了「自杀」。然而，狼选择撞石的原因竟是「自杀分数高」！

傻狼选择「自杀」，只因人间不值得！

狼是打工人，羊是永远达不到的升职加薪

奖励机制不合理

自暴自弃的狼终于抓到了羊

您可能也对以下帖子感兴趣

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！