查看原文
其他

Deep mind:给人工智能一个工作存储器,将会发生什么?

2017-02-05 全球人工智能 全球人工智能

       谷歌DeepMind的研究人员设计了一种新型计算机,能够拓宽当今世界上最好的人工智能系统的能力。研究人员为这种新型计算机增加了一项重要的特色——一种独特的工作存储器。

       研究人员表示,这种新型计算机包括了一个连接到特殊存储器上的大型神经网络,这种计算机能够找出存储在这种独特的工作存储器中的内容,然后执行相对复杂的任务。比如,在伦敦的意大利式面条的地铁网络中,找到从一地到另一地的最优路径,也能探索并学习其它类型的网络的最显著的特征。


图一 伦敦地铁网络图和其它网络结构

       谷歌DeepMind研究人员称他们的系统为可微分的神经计算机。从某种意义上来说,它是可微的——它利用了数学中称为反向传播的过程,来学习与大型神经网络相连的存储器中存储的内容(反向传播是神经网络中一种强大的算法)。随着神经网络的不断训练,它能够自动将一些学习到的信息存储到存储器矩阵之中。

    


图二 可微神经计算机结构示意图

      相关的研究成果已经发表在《自然》杂志上。论文的作者指出,这种计算机像传统计算机一样,能够使用它的内存表示和操作复杂的数据结构,最重要的是,这种计算机能够像神经网络一样,能够从数据中学习并知道接下来该做什么

        CMU的副教授Ruslan Salakhutdinov(人工智能和机器学习领域著名学者)说这项研究成果意义重大。该研究成果推动了人工智能的发展,人工智能正在向像人一样工作的方式转变。虽然这项成果只是迈出了一小步,并且现在还受到诸多限制,但是以这种方式构建的系统可能有一天会承担非常重要的工作。例如,用更先进的人工智能系统来抓取维基百科上的内容,并理解一些重要的概念(如名字、地点、日期等等),然后存在到它的工作存储器中;也能够允许机器人使用在某地学到的信息去执行完全陌生的任务。

       最新的机器学习系统在执行某些特定任务表现突出,像识别图片上的人脸或语音识别;并且这些系统可以通过实践,来执行更加复杂的任务,比如将电脑游戏玩到专家水平。但是,这些系统都需要大量特定的数据来训练,这一点并不像人,它们不能够将学到的东西存储以供稍后使用,这也是当前机器学习在许多领域所面临的问题,包括语言。

       虽然可微分计算机可能解决这一问题,但是,Ruslan Salakhutdinov指出,制造这样的可微分计算机是非常困难的。这种计算机为了利用它们的内存,它们不得不执行复杂的计算去查询每个存储位置的状态。要让这些计算机工作,是极其困难的。

       有趣的是,这项工作使人工智能中两个长期存在冲突的领域走的更近了。早期的人工智能工作涉及到机器编程来表示信息,目前最流行的方式就是训练大型神经网络然后执行任务。长期以来,一些人工智能传统主义者和认知科学家都质疑神经网络是否可以做人类所能做的事,而不需要获得用符号去更加深层次地表示信息的能力。

       纽约大学研究计算机如何模仿人类智力的认知科学家Brenden Lake表示,神经网络能从实例中学习算法的能力给了我深刻的印象,这能够扩展深度学习的用处。像排序、寻找最短路径的算法,是计算机领域内的经典案例,这些算法传统上都需要程序员来设计并实现。

       但是brenden Lake指出,系统在工作方式上仍然不是很人性化。 “人们可以从有限的经验中获取新的任务,特别是如果他们熟悉域名,”他说。 “相比之下,差分神经计算机在每个任务的几十或几十万个例子上进行训练。 我认为人类快速学习新任务的能力将是下一个主要的AI挑战之一。

      Brenden Lake指出新系统能够像人一样工作还有很长的路要走,人类能够从很有限的经验中学习并处理新任务,尤其在他们所熟悉的领域。相比之下,可微分神经计算机却需要几万或几十万的实例来学习。他认为人工智能如何快速的学会处理新任务是人工智能研究者面临的一项重大挑战。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存