查看原文
其他

羊习习 2018-05-20



全文共1642字,预计阅读时长2分钟



还觉得AI们都是小智障吗?

 


其实,在我们不知道的时候,AI们已经能够进行辩论了。

 

近日,在OpenAI发布的一篇文章中,简述了一项新的人工智能安全技术,从而成功引起了人们的注意。文章显示,通过搭建人工智能辩论框架,AI们能够在人工的引导下帮助彼此矫正自身问题,从而使多个AI的执行结果统一且符合人类价值体系,以此保证系统的安全。

 

研发人员表示,这一辩论框架的功能还不止于此。基于复杂计算进行的推测,加上不受思想维度限制的辩论,这样的方法将有可能训练AI系统执行超过人类认知能力的任务。届时,不管道德矛盾还是伦理困境,唯心主义还是唯物主义,很多问题都将得到解决。

 


辩论有何用?


随着AI算法结构趋于复杂,人类对于AI的评估及训练也充满了更多的不确定因素。

 

目前现有的强化学习,依靠的是预先设定好的奖惩参数,这需要人类在训练之前便罗列出能够获得奖励信号的行为及输出结果。实际上,这种看似不错的思路,却令强化学习处处掣肘。

 

正如AlphaGo在博弈中的情况,研发人员其实很难评判其每一次落棋好坏。如果要按照一般训练逻辑强行对其所决定的每一步进行引导,AlphaGo的棋技无疑会受到限制。

 


但若有了AI辩论模型,就如同这场棋盘上的厮杀有了解说,在两方的争论之中,研发人员自然而然便能够知道,从哪一步开始AI们有了分歧,又从哪一步,某个AI走向了错误的终点。

 

AI辩论的实质,是双AI的同步训练。他们将在强化学习中被输入相同的问题。如若两者得出的结论不同,则让彼此指出对方决策过程中存在的缺陷。这样一来,即使智能体对问题有比人类更深层次的理解,人类也可以去判断哪个智能体更好地反驳了对手。

 

更直观地说,若我们提问AI一号:“哪里是度假的最佳去处?”即使AI一号告诉我们是“阿拉斯加”,我们也很难判断这一“最佳”是否名副其实。但如果AI二号说:“不,应该是巴厘岛。”人们自然可以对比两者的优缺点,并得出巴厘岛休闲又暖和,是冬季里更好的去处这一结论。

 

并且,在两者的辩论中,研发人员还能通过AI一号提出的诸如“护照来不及办了”“游客太多”等反驳中,进一步了解AI一号之所以不推荐巴厘岛的考量,以及辩论双方在推理中存在的漏洞。


辩论如何实现?


AI辩论框架的灵感来源,正是对于围棋博弈的评估。只不过,评估的对象从走子换成了辩论的句子。在评估中,只有当最终结果出现时,研发人员才会对AI进行评价。



当然,研发人员并不只是在最终评价中扮演角色。如在“最佳度假地点”的辩论中,为了得到辩论的最终结果,他们将会根据辩论进展在“阿拉斯加”与“巴厘岛”中作出选择,直到一方的智能体知道再辩论下去也无法再改变人类的决定为止。

 

不过目前,由于对自然语言建模的研究还处于较为初级的阶段,研发人员在辩论模型中并没有选择用其作为辩论AI用于对抗的主要工具,而是运用可视化的方式更为直观地展示AI们的逻辑。

 

在辩论中,智能体将会被输入完整且相同的图像,而测试中评价者将通过AI们筛选出的像素点,猜测完整图像的内容。 

 


正如在猫狗辩论中,AI一号将会诚实地表明照片内容是一只狗,而AI二号则需要让人们相信图片中的动物是猫。

 

由于它们每次只能向研发人员展示固定单位的像素,AI一号为了让人们能够很快地知道狗才是这道选择题的正确答案,便很有可能提供给研发人员一个带有绿色、黑色、黄色的像素块,并告诉人们“这是一只狗的耳朵,狗正在草地上”。而AI二号为了反驳一号,则会将这一像素块描述成“猫的头顶”“猫的屁股”等与狗耳具有相似弧度的部位。


读芯君开扒


AI辩论,鸡肋还是灵丹妙药?


辩论模式其实已经不是新鲜事,在AlphaGo 和其他游戏AI的实践中,该框架已经取得了一定的认可度。但其本身所具有的局限性,是该方法一直未被广泛应用于强化学习的根本原因。


首先,由于参与训练的AI均需要具备参与辩论的基础,这给图片识别技术、语义识别技术都带来了极大的挑战。也就是说在现阶段AI的发展基础上,AI辩论只能实现简单的错误纠正,而无法完成绝大多数等同于人类认知的任务。


其次,由于人工的广泛介入,以及将人类意见作为评判结果的唯一标准,人类的偏见、局限也将成为AI的一部分,从而限制AI辩论的维度拓展。


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里


作者:羊习习

参考文献链接:

https://www.leiphone.com/news/201805/teesfrjv5XGzvrfR.html?viewType=weixin


如需转载,请后台留言,遵守转载规范


推荐文章阅读

什么?这个大数据比赛既有奖金还能提供工作?!

学AI,连你的老师都那么拼,你还有什么理由不努力?!

[大咖专访]CCF IT女性精英大会(二):具备“爱”的能力,敢于向权威挑战

CCF IT女性精英大会(一):勇敢说“愿意”,为自己发声

看BAT如何破解中国“缺芯”之痛?

有AI演员,还看什么小鲜肉抠图戏?

看啊,那个面试你的不是人!

学AI能救命?机器学习之父这样说

AI同传闹乌龙,先别急着嘲笑!

Facebook泄密元凶暴露?这个锅AI不背

AI也要讲道德了!英国开始行动

想吸引男神顺利脱单?交给AI吧

最全指南!如何准确找到适合你的AI实习?

取钱就朝ATM喊“给钱”?全靠声纹识别!

移动的孩子成为射杀目标?AI武器必须遭声讨!

无人车来了,无人车的人才呢?

震惊!“莎士比亚”要干掉人类小编?

AI读心术上线,就问你怕不怕!

速看!程序员的未来竟然在这里

AI说:没错!玩游戏绝对能促进学习

去和水准很高的东西碰撞,才懂“做自己”!

AI那么牛,你离失业还有多远?

给你讲个恐怖的故事:女朋友妆前妆后……

模式识别、机器学习傻傻分不清?给我三分钟!

119个彩蛋!《头号玩家》里的AI技术大揭秘

手机+AI=AI手机?知道真相我哭了……


长按识别二维码可添加关注

读芯君爱你

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存