查看原文
其他

揭秘 | 技术方案解答智能客服如何双商俱高

智能客服团队 京东技术 2019-05-31

来这里找志同道合的小伙伴!

 京东技术金项奖 

京东技术金项奖是由京东集团技术委员会设立的表彰优秀研发团队及个人的奖项。评选维度围绕京东技术核心理念,创新、协作、品质和高效展开,对研发体系优秀项目、团队和个人进行选拔激励。2018年是开展金项奖的第7年,也是京东向技术转型至关重要的一年,作为集团技术奖项,将大力表彰2018年度在技术创新、业务贡献有突出成就的技术团队,以及在创新力、专业度和影响力上显露光芒的研发人员。

本文是技术创新奖——智能客服2.0项目的技术解读。


AI技术发展和海量大数据沉淀驱使客服向智能化方向前进,智能客服用于用户接待已是大势所趋。在早期应用中,智能客服已经帮助人工客服分担了一部分接待压力,但如何持续提升智能客服的意图理解力、共情能力(即情商)和解决能力,并且做到能够与人工客服保持体验一致的服务水平,同时利用技术手段使客服服务全链条进行智能化升级,是智能客服团队2018的头等大事。

智能客服VS人工客服能力对比


为了解决以上问题,在机器人能力层面,智能客服团队基于Neuhub平台的情感分析API赋予了智能客服情绪识别、察言观色的能力,并首创ABSQ(Action/Business/Scene/Question)方法构建业务知识图谱,让机器人能够从多维度判断用户意图;在客服服务全链路智能化上,今年上线了语音导航并利用机器学习技术实现客服资源智能调度分配,下面将逐一给大家分享具体的技术方案。


意图识别能力突破


智能客服与人工客服的体验差距在多轮对话中的语义理解上表现明显,伴随用户和智能客服进行多轮对话后,问题变得深入和具体,导致智能客服无法精细化理解用户诉求,在同一业务的不同细分情况下往往会给出同样的答案。


为了更好地理解用户意图,将分类体系由原始单一维度划分改为由ABSQ(Action/Business/Scene/Question)多维度共同判断用户意图,从而能够精细化定位用户意图,对各种不同情况给出针对性的答案。虽然判断的维度变多,但是从任意单维度看分类数量大大减少,分类的可区分性大大增强,从而保证模型准确率。


在这一过程中,采用聚类的方式先产生大致的分类体系,再经人工最终确认,在保证准确性的前提下减少人工参与度。除业务维度外,还增加了问句的句法判断,根据不同的问句类型进一步精细化应答。

ABSQ分类方法示意图


算法层面,基于HierachicalAttention Networks(HAN)改进的SentenceAttention Hybrid Networks模型,该模型更强调问题所在语境,每个问题都会结合上下文进行理解。模型底层理解单句问题,结合Attention机制,模型顶层理解整个会话的意图。通过模型网络结构的调优,既能捕捉到单句中的核心词汇,又能够更好的汇总每句话的语义得到会话级别的意图,与业界公开的最优模型相比,在算法准确率有一定提升的情况下,算法性能有大幅提升,有力的支撑了产品的快速迭代。

Sentence Attention Hybrid Networks模型算法结构


通过以上一系列的优化措施,意图识别准确率在不同场景下均有5%到10%的提升。未来还会进一步提升机器人的自学习能力来减少人工参与度。一方面使用大量未标注数据进行预训练,进而通过少量标注数据就能达到更优的模型效果,大幅减少人工标注量,尤其是在新业务扩展时的工作量。另一方面,也会尝试强化学习的方式直接学习人工客服的决策流程,进一步提升应答效果,减少人工标注。


情商加持,共情能力提升


针对人机服务对比差异中机器人的情商短版,智能客服团队基于Neuhub的情感分析模型赋予了智能客服共情能力,让智能客服能够识别生气、焦虑、担忧、失落、迷茫、高兴、平静等七种情绪。


技术方案主要基于卷积神经网络,用以提取用户情绪的深层次表达。最终方案不仅识别精度高,而且泛化能力强,使得相似语义不论如何转化表达,都能准确地获得情感分析结果。

情感分析技术实现框架


与行业内多数客服机器人还停留在无法进行情感分析或者只能进行情感两极分析的阶段不同,情感智能客服机器人不仅能自动识别用户在交谈过程的生气、焦虑等七种情绪,还能识别出用户情感的浓度,如一点点生气、非常生气等。


为了解决标注数据不足的困难,采用迁移学习技术,将粗细力度的两种标注数据联合训练,通过shared layer,模型借助辅助任务(粗粒度)的大量标注数据来提升主任务(细粒度)的预测结果。


反向翻译(back-translation)是机器翻译中的常见数据增强方法,将该方法应用于情感分析,通过对训练数据应用汉译英、英译汉,扩充训练数据样本量,一定程度解决数据样本不充分和分布不均衡的问题。


基于以上两种方法,使得模型只需使用少量训练数据,就能达到精准识别的效果。相比未应用情感分析前,智能客服升级后用户满意度提升57%。


某一特定场景下业务标注样本稀缺、标注样本质量不高是机器学习面临的一大挑战。未来也会尝试使用非监督训练方法,利用大量未标注数据来提升模型准确度,此外也会尝试多通道融合技术,将文本、语音、图像信息综合起来做出准确判断。


语音导航+语音质检智能客服又一重大里程碑


过去,京东用户拨打电话联系客服时,是传统的按键形式,用户常常需要听完后进行拨号选择,在喧闹环境下还往往需要反复听,耽误用户的时间又可能转接错误,体验亟待提升。而针对电话端人工客服的质检,耗时也比较长。因此,智能客服团队便基于ASR和NLP等技术进行改造。


在ASR和NLP方面都采用了最新的技术手段,在准确率和用户体验等方面都具有一定优势,能基于大量客服专有数据训练模型,实现用户电话咨询的流程由传统按键方式升级为智能语音导航,通过语音导航细化客户咨询的问题场景,并结合客服的CRM系统,直接弹屏给对应的电话客服,使客服快速获取用户咨询背景,减少重复询问,提升用户体验。


此外,整体方案采用标准的MRCP协议连接电话系统与后端服务,能适配不同厂商的电话系统,也有易于扩展开发各类功能模块,如ASR、TTS等。利用Nginx作为前端负载均衡,通过docker方式部署服务,能根据业务容量等需求灵活伸缩扩容。遵循标准协议,能适应各种不同的语音业务需求,包括客服导航、外呼等。最终将电话系统、MRCP及ASR等成熟技术有效结合,实现了客服导航自动化,有效提高用户体验。

客服语音质检架构图


语音导航是京东客服第一个完全通过语音实现人机交互的智能系统,上线后用户操作时间节省了一半,语音质检也实现线上全覆盖,相比之前结果处理速度加快一倍,对提升用户体验,提高工作效率大有裨益。


智能调度:调兵遣将的大脑中枢


除了提升智能客服和人工客服的服务质量,如何将这些客服资源合理分配也是一件难事。以往客服调度依赖人工经验,但这样很难考虑不同客服的具体技能水平,容易出现资源闲置。


为了解决这个问题,智能客服团队利用机器学习,首次在客服领域将用户咨询意图、情感和交叉画像(客服服务、顾客咨询)综合进行考虑,在用户发起咨询请求时进行自动智能匹配,为用户找到最合适的客服,从而提升用户体验和客服效率。


本方案首先通过协同半监督回归算法进行客服技能评分预测,并利用低秩矩阵补全进行客服技能水平定量评估,从而进行全局客服分流和调度。


  • 协同半监督回归客服技能评分预测

    通过订单数据、商品数据、客服统计数据等可以对客服会话质量进行预测,但是会话质量的人工标注样本往往非常少。通过协同半监督回归算法来有效利用大量的未标注数据,分别训练两个回归器,并对每个回归器,将高置信的数据作为训练样本交给另一个回归器进行训练,这样不断协同迭代,提高预测准确率。

协同半监督回归模型示意图


  • 低秩矩阵补全客服技能水平定量评估

    如果客服在一些意图场景下没有过会话,则无法直接通过回归预测客服-意图场景评分,但是客服、意图场景之间可能存在相关性和冗余。通过低秩矩阵补全算法对客服-意图场景的评分矩阵进行补全,同时利用双重归一化和补全矩阵验证进行优化,预测客服所对应的所有场景的技能评分,从而进行更全面更合理的客服调度。

特征工程与建模思路


通过合理调度分配,客服接待能力提升15%,实现“物尽其用,人尽其才”。在未来,智能客服将通过深度学习、强化学习等技术实现更精准、更细粒度、可自适应的智能客服分流和调度方案,进一步提升用户体验和资源利用。

 

今年在智能客服的技术探索取得了一定成效,未来将会持续提升,为给用户提供极致体验而努力。相信伴随AI技术进一步发展以及京东大数据不断沉淀,会跟京东诸多同道一起,以技术创造美好生活!


RECOMMEND

推荐阅读

如何实现百万TPS?详解JMQ4的存储设计

每月一书(3)| 决战618-万亿级流量系统技术宝典

Spark 在京东物流财务计费应用中的一些常见参数优化

京东CTO张晨:软硬一体的技术体系打造京东无界零售“盟国”生态

京东技术

---关注技术的公众号

长按识别二维码关注

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存