Siri 发布已八年,Chatbot 为何依旧很坑【文末附数据集下载】
By 超神经
场景描述:聊天机器人虽然众多,但在目前来看,它们的功能都还不够理想。如何打造出一款好的聊天机器人,是期待技术上的颠覆,还是在设计上考虑的更加全面。不妨听听资深人士怎么说?
关键词:聊天机器人 NLP 对话系统
早在 2011 年,苹果公司就发布了智能语音助手 Siri,对这款产品报以重大期望的苹果公司,不得不面对 Siri 目前尴尬的使用处境。Siri 要么听不懂用户在说什么,要么回复给用户一堆不明所以的内容。现在 Siri 的存在,更多还是调戏/被调戏用户。
在市面上,聊天机器人( Chatbot )不在少数,但能够深入人心的产品却少之又少。有很多一时新鲜的 Chatbot 产品,慢慢地便暴露出「智障」和「鸡肋」的地方。
比如在 Facebook Messenger 应用上 ,语音助手 M 在运营了三年后下线,而一直在升级的微软小冰,最常用的功能停留在不痛不痒的「尬聊」上。
Facebook M 于 2018 年 1 月被关闭
出现这个现象的原因,一方面是人们对 Chatbot 的期望落差,另一方面,即便是现在最先进的技术,要完全理解人类的对话体系,还是一件困难的事情。而在设计理念上不同的侧重,造成了最后的南辕北辙。
那么如何才能做出一款令人满意的 Chatbot 呢?一位资深人士总结了一套「USED」框架。
被使用的 Chatbot 才是最好的
Shin Wee CHUANG
Shin 毕业于 MIT,先后任职于微软和渣打银行( SCB ),是金融科技领域的资深人士。
他曾被 CBN Weekly 授予「中国50强企业创新者」奖,以表彰他在中国 SCB 数字营销方面的众多数字和营销创举。目前他经营着他所创立的科技公司 Pand.ai,致力于打造企业级的智能 Chatbot。
Shin Wee 在一篇文章「 A good chatbot is a USED chatbot」,讲述了如何打造智能的 Chatbot,以下为文章的编译。
自从一年前为金融机构建立智能 Chatbot ,和联合创始人建立 Pand.ai 以来,我们经常被问的一个问题是:你们研发的 Chatbot 有多好?
试图解答这个问题,就要解释我们如何利用深度学习自然语言处理( Deep NLP )来提取用户输入的语义,让 Chatbot 更好地「理解」问题,并提供更准确的回答。
在这里,我将讨论那些令客户满意的 Chatbot 构建的思维过程。我们现在正将这些观点整合到一个产品框架中,形成我们的核心设计原则,希望对想要构建或使用 AI Chatbot 的人提供一些帮助。
这个框架包含 4 个字母:USED ,这里的 USED 代表着:
U :It Understand me 能够读懂人
要想构建好的聊天,首先要让机器人理解对话,否则,它无法按预期做出响应。
大多数 Chatbot 依赖于「模式匹配」的技术,这对于「理解」常见的句子是有效的,例如「你好吗?」,「你叫什么名字?」之类,但在处理复杂语句或者非常见句子时,就显得吃力,这也是一些「智障式」客服存在的一个原因。
要想打造一款好的聊天机器人,NLP (自然语言处理)引擎是必备的。目前已经有一些此类引擎,它们通过云服务方式来分析处理,并能轻松用在多种聊天工具上。
此外,还有一些公司为特定的垂直行业或市场,提供了更专业的 NLP 引擎,能够分辨出语言中的细微差别,比如包含的术语或俚语等等。
如果你没有太多背景,或者不想花时间自己构建,最好的方法就是选择一个合适且强大的 NLP 引擎。让 Chatbot 在读懂人的层面没有障碍。
S:It Serves me 具有服务性
一个好的 Chatbot ,需要在特定的场景下,执行某种功能。所以最关键的是要让机器人能熟悉这个领域内的详情。
比如要为销售团队部署一个 Chatbot,帮助他们更好地工作,必须准备好所有相关的产品和内容,按照结构化格式打造一个理想的对话。
除了基本的问答,还需要考虑在 Chatbot 中添加一个测验组件,让它能帮助销售人员更新对产品的理解。
E:It Engages me 能够打动人
在聊天机器人推广的初始阶段,让用户能够和机器人进行互动,是一项有挑战性的工作。毕竟,想要让用户改变习惯的方式,接受新事物并不容易。
因此,可以制定有效的推送策略,以帮助用户习惯使用新的工具。
当然,推送并不意味着你必须要发送无聊的产品描述,而是要用心去做。 例如,一个简单的父亲节问候消息,传递给小组中的父亲们,将会是很暖心的一种方式。
D:It Delights me 会带来乐趣
目前大多数聊天机器人,正在朝着俏皮和可爱的路子发展。毕竟,能带来快乐的产品,往往更吸引人。然而,随着越来越多的聊天机器人出现,只会抖抖机灵的话,就奢望用户一直开心的套路,或许不再现实。
要找到聊天机器人能带来乐趣的方式。但同时要也要注意场合,免得在严肃的场合出现尴尬。
值得庆幸的是,语言不是聊天机器人唯一的武器。比如,某个对话中埋一个复活节彩蛋,所能带来的惊喜,可能会胜过任何带着模仿痕迹的俏皮话。
黄金法则的核心
这个「 USED 」框架,可以作为企业级聊天机器人构建指南,但其实,它的核心也就是充分考虑其实用性。
有许多 KPI 能衡量聊天机器人的好坏,例如响应时间和准确性,但最重要的一点在于,它是否有助于实现业务目标。
不论是想用聊天机器人提高客户服务量和销售效率,还是产生潜在客户,只要是能够实现业务目标的方法,都可以被用起来。比如下面的这些KPI:
谈话次数(不是消息数量);
每月活跃用户的百分比( MAU,也可能是 DAU「日活跃」 和 WAU「周活跃」 );
每个活跃用户的会话数
Chatbot 的发展不只是依赖技术
开发一个 Chatbot ,即使是一个 AI 驱动的聊天机器人并不算难,但想构建一个好的、智能的,并能被大量使用的 Chatbot ,需要考虑的,就不仅仅是技术。
Chatbot 的发展经历了一股热潮后,慢慢趋于理性。NLP 的发展,始终没有在计算机视觉,或者语音识别上那么快速。但要想做出好的 Chatbot ,也许最需要考虑的,还是能让它变得有用的设计理念。
因为按照当前的技术发展来看,在短期的将来,Chatbot 产品的壁垒是数据和设计,而不是技术。
而也许在打造 Chatbot 之时,可以优先考虑服务,然后才是对话系统——就好像人,是先有脑袋里的想法,再用对话来表达。
有这样一个观点:一个产品是由很多技术组合而成,对每一类技术都有正确的认识,才能做出好的产品。「毕竟我们离真正的人工智能还有距离,能用得上的才有价值。」
超神经数据集
超神经HyperAI 搜集并整理全球数百个公开数据集,并提供国内镜像下载,对科研机构和开发者们提供免费服务。
智能问答相关的数据集推荐:
Yahoo! Answers 问答数据集:数据集是来自雅虎 Yahoo! Answers Comprehensive Questions and Answers1.0 数据集的 10 个主要分类数据。每个类别分别包含 140,000 个训练样本和 5,000 个测试样本。由康奈尔大学发布,文件大小 304.72 MB;
SQuAD 斯坦福问答数据集:是一个阅读理解数据集,由群众工作者在维基百科文章中提出的问题组成,其中每个问题的答案是来自相应阅读段落的一段文本或跨度,共有 500 多篇文章中有 10 万多个问答配对。于 2018 年由斯坦福大学发布,文件大小 34.09 MB。
更多智能对话数据集( 如 CMU 真实问答对数据集;微软 Maluuba NewsQA 机器阅读理解数据集),请访问 https://hyper.ai 下载。
历史文章(点击图片阅读)
521,向前辈吴恩达和姚期智学习如何撩妹
深度学习涉足美妆领域,网红博主要失业?
中美战火熊熊:一边贸易战,一边拼技术
AI 百科
教程
数据集
商店
更多
http://hyper.ai