【智能】为什么智能聊天机器人需要深度学习的巨大推动

2017-07-27 人工智能学家 天大神经工程

概要：聊天机器人不仅仅拥有根据上下文来回答复杂问题的能力，而且它们还能够获取一些对话框以外的信息，这对于构建真正强大的聊天机器人是必不可少的。

大多数的科技巨头在应用程序和科研方面都下了血本，希望能在人工智能发展的潮流中保持领先状态。走在潮流最前沿的领域是对话式交互（个人助理或聊天机器人）和计算机视觉以及自动导航——由于硬件和大数据的进步，以及有着革命性发展的机器学习技术（仅仅在几年内就在一定范围内取得了巨大进步）。人工智能的进步使得以前那些被认为是超出了机器可处理范围的问题在现在也能被迎刃而解了，并且这种技术产品已经成为了我们日常生活中触手可及的商品。

随着人工智能越来越受到人们的喜爱，新一代的聊天机器人最近已经涌入市场，并且它们承诺，我们的线上互动将不再发生在网站上或着是应用软件中，而是发生在一个真切的对话情景中。为了帮助这一承诺变成现实，新一代的聊天机器人将更好的用户界面、无处不在的智能手机和最新的机器学习技术结合起来了。

这个新颖的人工智能应用程序背后的主要驱动力之一是深度学习，它属于机器学习领域，尽管深度学习已经存在了大约50年，但最近在该领域，在计算机视觉和自然语言处理（NLP）方面才有了革命性的发展。尽管机器学习领域已经有了令人难以置信的表现，但只有深度学习才能解决智能聊天机器人现在所面临的挑战。他们将会通过了解情境，采用逻辑推理，辨识出语言之间的微妙差异，然后消除可能导致的截然不同的含义，最重要的是他们可以理解消费者的偏好和意图，同时这只是该系统能够执行的许多具有挑战性的任务中的一小部分，其最终目的是为了维持与人类之间的交流。

聊天机器人不仅仅拥有根据上下文来回答复杂问题的能力，而且它们还能够获取一些对话框以外的信息，这对于构建真正强大的聊天机器人是必不可少的。聊天机器人需要根据先前对话中所分享的信息，或者是机器人和消费者在其他对话中的一些内容，它们才能够有效的回答问题。此外，销售目标和消费趋向会影响到机器人的反应与判断。

如果一个现代的对话引擎希望他们自己不仅仅能回答简单的一级问题，那么它将必须结合深度学习领域最突出的新兴技术，包括统计学、语言学、其他机器学习技术和更结构化的经典技术（如语义解析和程序归纳）。

建立智能对话系统的第一关就是数据。特别是深度学习在没有大量的高质量数据让它发挥真正的潜力之前是无法产生重大作用的。但是，虽然我们生活在一个无休止的不断生成数据流的时代，但是大部分原始数据并不能立即用于机器学习算法。

非监督式学习是机器学习的子领域，它致力于在无人辅助的状态下从原始数据中提取信息，这可能是一个有希望的取代方案。在它的大量用途中，它可以用于构建嵌入式模型。简单来说，这些技术支持以更简洁的形式表示数据，从而让数据中的模式更容易被发现。

虽然非监督式学习在机器学习中已经普遍存在，但深度学习提供了一些额外的创新的方法来构建这样的嵌入模型，并且这些模型提供了最先进的表现。这些技术的优化可以减轻对大量高质量的昂贵的标记数据的需求，这是人工智能聊天机器人有更好表现的基础。

然而，深度学习中的标准步骤包括收集一个大型的、高度详细的数据集，这将在之后用于训练一个多半是静态架构的网络。一旦被训练，网络图将直接从输入到一组已经被知晓的固定输出中。尽管有着非常强大的系统作为基础，但是这种方法仍不够灵活，无法处理实际对话中所需要的信息。这成了我们实现真正的拟人化智能聊天的另一个重大障碍：维持和推断世界内部模式的能力。

我们人类会不断（通常是潜意识地）检查我们从周围环境中获取的每一条新信息，与我们心中所认识的模型进行对应——这个内心的模型与现实有着怎样的联系，或者我们如何合乎逻辑的进行一些涉及实体的推论等。比如，我们在开车的时候，看到一个滚到街上的球，我们马上就知道我们应放慢速度，保持警惕状态，然后下意识的就会去寻找是否有一个粗心的孩子正在追赶他的球，这样的话这个孩子就会马上暴露在我们的视野中。这种直觉是基于对每个个体之间联系的深入理解，并有着顺着知识导图进行逻辑连接的能力，最终我们才会获得需要多个推理步骤才能得出的结论。

自动化和极其广泛的推理水平仍然困扰着人工智能研究人员，这也许是包括聊天机器人在内的真正智能和自主的AI代理的最新前沿之一。要实现这个目标，推理能力是核心。最后，让智能机器人拥有将所有东西整合在一起的能力则是另一个有待被解决的问题。与搜索引擎不同，为了使用户满足被呈现出来的由相关性排序而成的的匹配列表，会话引擎必须更具体。仅仅去使用NLP将不足以识别一组相关信息。它应该拥有解析输入的数据的能力，并将其分解，然后向用户呈现出清晰简洁并且符合他们要求的反应。

我们仍然处于以人工智能为驱动的对话革命的早期阶段，客观地说，在我们今天看来难以逾越的一些问题在未来几年内可能会得到解决。我们正快速向世界证明，您将能够与您的人工智能助手进行长期而复杂的互动，它们不仅可以了解您想要说的内容，而且可以了解您的偏好，并给您量身定制相应的体验活动。

要做到这一点，我们必须把包括深度学习，统计学等在内的多个学科融合在一起，将消费者的偏好、环境和语言技术构建成一个智能灵活的软件。

长按图片，识别二维码，关注“天津大学神经工程与康复实验室”！

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！

有些秘密注定只被少数人知道.....2024我们不再错过

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……