查看原文
其他

智能客服小讲堂丨解密为什么机器人客服能做到秒回?


同学们好,智能客服小讲堂又上线啦~

 

上一期智能客服小讲堂讲解了智能客服的知识处理能力——知识图谱技术(点击蓝字直达)。本期小讲堂将会带来新的技术解读,让大家秒懂客服机器人是如何和用户实现自如对话的。

 

任务型对话系统:

迅速解决用户问题的关键



客服领域的智能机器人,宗旨就是要自然流畅、力争快速准确地帮助用户解决问题,那么这一过程是如何实现的呢?在回答这个问题之前,我们讲两个概念,任务型对话和任务型对话系统。
 
在客服机器人的服务过程中,用户大多都是带着目的来咨询的,比如想让机器人办理一张银行卡、询问当前时间、完成一次订餐等。在开始对话之前,用户已经有了明确的目的,对话的最终目标是完成任务,这样进行的人机对话过程就属于典型的任务型对话。
 
任务型对话分为“单轮对话”和“多轮对话”。单轮对话类似传统问答系统,是智能对话系统的初级应用,一般表现为一问一答形式,主要应用在会话目的明确、单一简单的场景中,比如电商平台的商品介绍、订单信息查询、退换货流程介绍。而随着用户需求更为多元,在更复杂的业务场景中,用户不能将任务所需的关键信息一次性表述完,需要人机分多个轮次进行的会话,这个过程叫做多轮对话。

多轮会话涉及会话上下文的维护,支持澄清反问、指代、实体替换,与单轮对话相比用于相对复杂的业务场景,例如租车、查天气、外卖订单等。

随着用户业务需求变得愈加复杂,当前的客服机器人需要有更智能的对话系统来处理人机对话,我们称之为任务型对话系统。任务型对话系统一般是由自然语言理解(NLU)、对话状态跟踪(DST)、对话策略(DP)、自然语言生成(NLG)几个模块构成,DST和DP也可以统称为对话管理模块(DM)。


接下来就带大家一起了解下自然语言理解(NLU)、对话管理(DM)和自然语言生成(NLG)这三个模块是如何互相配合,实现机器与人类自如交流的。
 

自然语言理解(NLU):

打破人机交流壁垒



想要实现人机交流同人和人交流一样自然,首先要打破人机交流的壁垒,即让机器学习并理解人类的语言,因此在任务式对话系统中,用户输入的语言要先行进入自然语言理解(NLU)模块进行处理,针对用户语言中的“意图”、“实体”、“情感”和“态度”进行识别,以便后续系统对用户问题进行目标评估和答案输出。

意图识别


当用户带着明确目的找客服机器人对话时,对于客服机器人而言首要任务就是分辨出用户到底想要干什么。意图识别就是从用户的自然语言文本甚至语音信号中解析出用户意图的过程,是NLU的第一步,也可以看作是NLP中的一个简单的文本分类任务。
 
用户一般会通过一句话表明自己的目的或者诉求,比如:“看一下上个月花了多少钱”、“帮我查询一下上个月的账单”、“收到上个月的账单和消费记录对不上,麻烦帮我查一下”。
 
不同人的表达不同,仅仅账单查询就有上万种表述方式,在具体业务场景中机器人除了账单查询外,还要能听懂用户的其他需求,比如“信用卡办理”,“理财推荐”等。

面对这种多样化的需求,在业务梳理阶段需要划分清楚意图;在模型优化阶段,为了让机器人更准确地理解用户的多样化表述,需要给机器人提供尽可能多的、表达丰富的数据,让机器人学习到不同意图的特征。

意图识别作为百度智能客服系统重要的组成模块,识别效果的准确与否直接决定着用户的使用体验。意图是需要根据业务和使用场景事前定义好的,根据覆盖领域、业务规模、细分程度的不同,一般会有从几十个到上百个意图。

实体识别


不同于单轮的知识问答机器人,只需要从知识库中挑选最合适的答案返回给用户,任务型对话机器人需要和用户进行多轮交互。

以“订餐”场景为例,仅仅知道了用户意图这个模糊的目的是不够的,机器人还需要得到更精确的信息,才能帮助用户完成订餐任务,比如“时间”、“地点”、“就餐人数”等。在定义意图的时候,还需要为该意图预定义一系列的实体,通过多轮对话收集该意图下的实体值,使这个模糊目标更细化具体,从而完成任务,帮助用户达到目的。
 
简单的理解,实体是指人名、地名、数字、日期、号码等一类概念的实例。在具体的业务场景中,需要结合场景业务流程,配置自定义的实体,譬如办卡场景中的“卡名称”,订餐场景中“菜名”等。
 

例如,“我想预定西二旗附近的海底捞”是在“订餐”这个意图下,假设我们预设了“时间”、“地点”、“就餐人数”,“西二旗”这个实体就定位到了“地点”这个实体,机器人就可以在后续的服务过程中以“西二旗”为筛选条件来提供用户需要的信息。而缺失的两个实体“时间”和“就餐人数”,就需要机器在后续的问答中明确收集后再补充进去。


情感识别和态度识别


为了让机器更人性化,提供有温度的服务,还需要赋予机器更多的感知力,比如感知用户的情感和态度。因此“情感”和“态度”识别也是NLU模块的组成部分,简单理解就是机器可以根据用户的句式句法来判断对方在说话时的情感和态度。

情感识别是针对对话文本,识别出会话者所表现出的情绪,一般包含积极、消极和中立三种情绪;态度识别是针对对话文本,识别出会话者所表现的态度,一般包含肯定、否定和中立三种态度。在对话流程中,可以基于会话者的情感和态度返回指定话术或者进行流程跳转。


对话管理(DM):

对话系统的中枢



在进行完自然语言理解模块(NLU)的识别后,系统会将结果作为输入,转入对话系统的中枢--对话管理模块(DM)。对话管理模块根据用户输入的内容,进行会话节点选择、会话状态迁移和维护等动作,模块内部可以划分为对话状态跟踪(DST)和对话策略(DP)两个部分。
 
如下图所示,DST要对每一轮次的对话和上下文进行会话状态评估,即从当前所处业务的树形结构中,依据内置策略和优先级进行筛选,从而选定或更新会话节点,之后DP则需要根据DST跟踪到的节点生成下一个可用的操作,如业务系统调用、节点跳转等动作。


例如下图有关租车需求的对话管理模块。当会话状态遇到“检查车型实体”节点,系统即需要对当前会话内容进行检测,遇不同节点条件,进行预设的执行动作则对应不同。


自然语言生成(NLG):

像真人对话一样自然



根据上一模块所选择的会话节点,会话系统通过自然语言生成模块(NLG)生成回复信息,完成和用户的一轮交互。

在百度智能客服对话系统中,支持回复信息的类型包括文本、图片、录音、模板,回复信息的来源包括用户配置、业务系统调用获取。每个会话树节点都可以配置回复信息,最终的回复信息基于会话迁移过程中触发的节点依次将各个节点的回复信息进行拼接,更好支持真实客户业务系统个性化的回复,让机器人的回复像真人对话一样自然。


在实际的客服机器人和用户的对话场景中,任务式对话系统是由上述三个模块不断往复进行,以实现和用户的多轮对话,直到用户的需求得到最终解决。例如,在一个租车业务场景和天气查询业务场景下的多轮对话:


①用户通过表述租车意图,触发租车业务场景,机器人根据租车场景需要收集的实体配置进行相应的会话状态迁移,并生成回复信息;
②在租车场景中用户突然表述了天气查询的意图,会话状态切换到天气查询的场景中,这里系统支持两个场景收集到的实体共享或独立;
③在完成天气查询场景后,用户可主动表述上一个租车业务场景意图或系统主动引导,会话状态迁移回租车场景,进而完成相应的会话流程;
④当用户表述相应的会话实体替换的语义时,例中由“SUV”换为“小型车”,系统会触发实体替换逻辑,并执行对应回复。

在这个会话过程中,智能客服机器人可以准确理解用户的意图,通过对会话状态的管理,可以自如地切换到新的会话场景或切换回原有的会话场景中,快速直接地完成回复,满足用户的多样需求。
 
在用户需求愈加多元,业务场景愈加复杂的客服领域,百度领先的自然语言理解技术赋能了智能客服强大的对话能力。依托二十年以来在中文搜索领域的积累,百度自然语言处理技术接连获得多个世界级技术评测冠军:2017年获中国电子学会科技进步一等奖;2018年获NIPS (AI for Prosthetics Challenge) 全球冠军;2019年,在第十三届国际语义评测比赛中排名第一。
 
在实际业务场景中,百度智能云智能客服对话系统依托百度NLP技术实现用户意图、情感和态度的精准识别;由任务式会话引擎驱动可实现实体替换、澄清、指代和会话引导,让对话更加自然,帮助用户高效解决问题;利用抽象出的“所见即所得”的对话树配置方式实现新场景的快速搭建和落地,在项目中得到了用户的广泛好评。百度智能云的客服机器人实现了名副其实的智能,正在为更多行业的智能化升级提供实际路径和巨大价值。

百闻不如一试,想了解智能客服究竟有多神奇,不妨点击文末左下角【阅读原文】,亲身体验吧!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存