查看原文
其他

飔拓科技:多轮对话管理实现真正的语音智能

2017-05-08 专业信息服务的 中国软件网

每一个企业级的人 都置顶了 中国软件网

中国软件网 为你带来最新鲜的行业干货

本文作者│欧小刚

微信号│oyg0001

联系邮箱│oxg@soft6.com




人工智能时代离我们越来越近了,近得可以清晰的听见她的脚步声。在人工智能时代,人与机器的交互方式会发生怎样的改变呢?为此中国软件网采访了飔拓科技的COO魏兴宝先生,了解他对智能人机交互,尤其是智能人机语音交互的看法,以及飔拓科技在智能语音交互方面的做法。


智能语音对话变革人机交互方式

在魏先生看来,人机交互有三个发展阶段:第一个阶段是通过鼠标的人机交互,对应的是PC;第二个阶段是通过多点触控的方式在触摸屏上操作,对应的是手机、平板等移动设备;第三个阶段是通过语音、体感、手势等综合的方式进行人机交互,对应的下一代人机交互设备,包括虚拟现实、增强现实、智能可穿戴设备等。在新一代的人机交互方式中,重要的技术有自然语音理解、视觉认知和环境认知。

目前自然语音交互方面相对比较成熟,也是飔拓科技的优势领域。人机对话最大的问题在于实现多轮对话,目前市场上人机语音对话产品比较多,但一般都只能实现单轮对话。如果要问Pepper机器人或者Siri等智能语音助手几个问题,它只能一次回答一个问题,不能发现问题之间的相互关联。比如我第一个问题问今天几号,智能系统会给出答案;第二个问题问今天天气怎么样,也能给出一个答案;但我要是问上一个问题是什么,智能系统一般就回答不了。应该说,如果不能实现多轮对话,就不能算是成熟的智能语音系统。


飔拓科技的在智能语音方面的三大法宝

正是看到这样的问题,飔拓科技致力于发展能实现多轮对话管理的智能语音系统。实现这个目标,飔拓有三个法宝:

  • 第一,发展具有特定语境的智能语音系统。与人之间的交谈类似,平时的话题非常广泛,对于智力水平有限的机器系统,很难对所有话题都有掌握,也就不能在与人的对话中给出很好的交互。在具有百科全书式知识体系的智能系统出现以前,比较好的解决方案就是对人机对话的话题和语境作出一定的限定。可以在系统中内置该语境中经常会问到的问题和相应的答案,构建针对该语境的完善知识库。在实际应用方面,飔拓开发出针对多个特定应用场景的智能语音系统,比如儿童陪护机器人、智能驾驶的人机对话系统、智能家居中的语音对话系统等。

  • 第二,构建多轮对话管理系统。要实现人机自然的多轮对话,就要内置一套多轮对话管理系统,在系统中能对人与机器的交互进行记录,并作为后续对话的语境基础。回到上面所举的例子,当问了机器人今天几号之后,它能即使把问题和自己的回答记录在系统中,在回答第二个问题时,第一个问题及其回答就是语境基础之一。如果第二个问题与第一个问题有相关性,那么其答案就会根据第一个问题作出相应的修正。这还只是两个问题,当问题的个数增多时,其关系的复杂度也会增加很多。飔拓科技智能语音系统中,内置有多轮对话管理功能,让其在自然语音交互方面技高一筹。

  • 第三,精准的语义理解和语境理解。要实现流畅的多轮对话,不仅要对每句话的意思能精准识别,还要对整个交流形成的语境有很好的理解。与人之间的交流类似,多次对话之后,就会形成一种“氛围”,也就是语境。语境不同,同样一句话的含义也不同。只有结合语境,才能理解对方的真实意图。飔拓科技的智能语音系统,借助于成熟的语境理解,实现有效的人机语音交互。


智能语音系统应用场景

技术本身是没有价值的,技术的应用才能产生价值,智能语音系统也同样适用这样的道理。好的技术,必须找到很好的应用场景,在应用中解决用户的问题,才能实现其价值。飔拓科技依据其先进的技术,开发出多款智能产品,应用于多样化的场景中,其中一个典型例子就是智能车载系统。目前飔拓的智能语音系统是接入后视镜,可以支持打电话、导航、听歌等功能,比如你告诉他去附近的电影院,就会自动给你设置一个最优路径。后视镜中的音乐可以直接搜素,如果感觉一首歌歌不好听可以换下一首,另外喜欢听的歌也可以收藏。

接入智能车载系统,驾驶员可以通过自然语音交互的方式来进行一些操作,而不用再用手来进行操作。当司机在驾驶的同时打电话、发信息,或者进行其他操作,这样势必会分心,这时候如果出现紧急情况司机很可能来不及反应。我们知道,交通事故往往是一瞬间发生的。如果司机可以通过语音交互来完成其他操作,就可以安心驾驶,大大降低了发生交通事故的可能性,实现安全驾驶。与其他车载智能语音系统不同,飔拓的智能系统接入后视镜,这样可以大大降低汽车改装成本,有助于智能车载系统的推广普及。

https://v.qq.com/txp/iframe/player.html?vid=l1317rjvynp&width=500&height=375&auto=0
智能语音系统的另一大应用领域,就是嵌入机器人中,实现人与机器人的自然语音对话,可以实现机器人在各个领域的应用:智能陪护机器人,陪伴小孩玩耍并具有一定的教育功能,陪伴老年人,增加其生活中的乐趣;智能家庭服务机器人,通过与机器人的对话,来完成对家庭中智能设备的控制,比如开灯、打开电视和音响设备、控制室温和光照、进行视频通话等;餐饮服务机器人,通过语音点餐和获取其他服务;银行服务机器人,通过与机器人的语音交互完成简单的业务办理……

https://v.qq.com/txp/iframe/player.html?vid=e1317l2lxw5&width=500&height=375&auto=0

更多阅读:


本文由中国软件网(www.soft6.com)原创发布,未经许可,禁止转载。


报名请点击“阅读原文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存