喜大普奔 | AI最全信息打包放送
小编导读:
这两年随着大数据挖掘、人工智能和深度学习技术的发展,消停了快十年的聊天机器人又一次躁动起来,不仅新的AI公司不断涌现,各老牌互联网企业也相继推出自家聊天产品,整个聊天机器人市场火爆异常。
聊天机器人的起源
1950年“人工智能之父”图灵为了验证机器是否能够思考,提出了图灵测试(Turing Test),随后众多学者进行了不懈的探索,不少聊天机器人系统相继诞生。
随后众多学者进行了不懈的探索,不少聊天机器人系统相继诞生。早期聊天机器人大多基于简单的关键词匹配,进行问答式交流,或者进行简单的语句分析和语句合成功能。
后来,在勒布纳奖的推动下,聊天机器人的研究迎来了一个高潮,最典型的是理查德•华勒斯(RichardS. Wallace)博士在1995年开发了ALICE系统,其在2000年、2001年和2004年三次问鼎勒布纳奖。
聊天机器人的应用场景
随着聊天机器人学习和分析能力的提高,聊天机器人的应用范围越来越广泛,从在线问答到客服系统,娱乐到工作、生活全面渗透,应用场景不断刷新记录。
聊天机器人关键技术
要实现对自然语言的理解并正确做出反应,需要机器具有自然语言处理和知识学习功能,智能机器人的发展是一系列技术共同推动的结果。
聊天机器人领域的专利情况
在刚刚过去的2016年上半年,人工智能市场风起云涌,国内外巨头纷纷将人工智能产品上升为企业押宝未来市场的战略级产品,争先恐后的布局AI市场。
1
3月份微软在Build大会上发布聊天机器人开发框架(Bot Framework)
2
Facebook在4月份披露了Messenger 平台的聊天机器人计划
3
5月在 I/O 大会上Google发布自家的Allo Messenger等产品
4
苹果6月在 WWDC 大会上开放iMessage给第三方开发者,同时发布了Siri SDK等等
产品发布、合并与收购等等一系列的市场躁动反映出,市场对AI的未来预期非常看好,市场的风起云涌那都是看得见的博弈,而真正看不见的战场在于技术的研发和专利的布局。
聊天机器人涉及语音识别、文字识别、语音合成、深度学习、大数据挖掘等众多技术,其中每个技术领域都有很多的专利,本文不准备深入检索各领域的专利数量(事实上专利数据很大),只进行简单检索了解该领域的专利概况。
早期的聊天机器人由于采用关键词的模糊匹配或精确匹配,与人交流略显笨拙,随着神经网络、语义理解及深度学习等技术的不断突破,新一代聊天机器人能够感知用户情感,具有上下文的语境感知能力和对知识的不断学习和积累能力,一定程度上提高了用户的交流体验。
百
度
百度公司语音识别、合成领域的专利有167件,其申请的一篇语音合成的专利CN105845125A,公开了文本信息转化为语音的方法,还有语音输入的控制专利CN105760084A,语音识别的PCT申请WO2015149543A1等。
亚
马逊
亚马逊语音文字识别、合成领域专利有66件,其中一篇专利US20160071519A1公开了语音识别系统中的语音模型检索技术;另一篇US9436678B2,Architecture for multi-domain natural language processing,公开了一种用于处理有关多个用户话语的主题或领域的技术等等。
这些企业在积极推出新智能机器人的同时,在相关技术领域,如语音识别、自然语言处理、语音合成等领域积极布局专利,都希望在当然炙手可热且前景诱人的人工智能领域抢占先机。
典型产品及体验
典型产品
市场上较为成熟的产品有:
Apple公司的个人语音助理Siri
IBM的知识问答Watson
微软娱乐聊天软件“小冰”
Facebook的Messenger M
google的个人助理Google Allo
百度的度秘
这些产品各有特点,具有一定程度的学习和语义理解能力。
微软“小冰”采用建立知识库的方法让“小冰”能够理解不同领域的知识,如文学、卡通等知识。当然,和人类学习一样,在没有监督或指导的环境里,机器对“好”的知识和“坏”的知识是同等对待的。
微软的另一款聊天机器人系统Tay系统就是最好的例子,Tay模仿19岁女孩在Twitter上与人互动,结果很快就学成了一个飙脏话且有种族歧视倾向的“坏”女孩,以至于微软不得不及时下线,进行改造。
各聊天机器人呈现方式基本相同,但两者在实现机制、用户体验以及未来的发展路径上会呈现出不同的发展态势。基于消息应用的聊天机器人天然缺乏数据,需要海量数据的补给。
而基于电商平台里的聊天机器人有着更多的先天优势,海量数据沉淀有可能让机器人比你更懂你,如亚马逊的 Echo 可以用几句语音完成一键下单,而小蜜能提前预知你可能遇到的问题,在没有你发起咨询时就把答案推到了你面前。
当然,如果腾讯基于自己的社交平台来做聊天机器人,或许效果也会取得像电商平台机器人一样的效果,因为处于社交垄断的腾讯拥有大量的真实用户数据,能够准确分析用户的行为习惯和需求。不过,优劣势都是相对的,最终谁能够胜出,取得用户认可,还需要看最终的用户体验和技术积淀。
在机器人的开发方面,模块化的开发将成为一种新趋势,亚马逊正已经开始在该领了尝试做第一个吃螃蟹的人。
其目标是未来任何人都可以开发聊天机器人,只要调用API或者AWS管理控制台将一些智能功能添加到他们自己的应用中即可。
亚马逊有意提供人工智能的全面管理服务,涵盖深度学习算法、训练模型等,让开发人员从基础设施建设中解放出来。目前其发布了三款产品:图像识别服务Rekognition,可以识别物体和场景;文本语音转换服务,涵盖大量的机器学习算法;还有对话管理服务Lex,实现multi-step对话功能的应用。
产品体验
各家的智能语音系统虽然定位略微不同,但智能和简单是共同的追求目标。苹果手机内嵌的Siri和嵌入微信、微博中的微软“小冰”是用户最方便体验的两款产品。首先,我们体验一下传说中情商较高、温柔知性的中国大众情人“小冰”,小冰幽默且具备高超的倾听技巧,模仿18岁的女孩,声音自然。
根据实际体验,小冰相对来说还是比较“智能”的,其对语音和文字的识别能力已经非常了得,只是对于上下文语境的把控还欠火候。小冰是一个虚拟的化身,体现了计算机科学家早已预测的一些进展。具体而言,一种被称为“深度学习”的人工智能技术正在引领技术的快速进步,使得各种新产品和新服务成为可能。
下面是微软另一款语音助理软件Cortana,微软对Cortana的期待不止是语音助手那么简单,而是个基于云计算、搜索引擎和非结构化数据分析的个人语音助理,Cortana是微软在机器学习和人工智能领域方面的尝试。
Cortana的交互界面简约大方,由于Cortana定位于个人助理,相比于微软小冰的闲聊、慰藉功能,Cortana则更具助理的特质,包括个人的出行日程、会议、天气提醒等,Cortana会根据你的日常使用习惯推送相关信息,如新闻资讯等。实际体验如下:
(1)告诉Cortana“明天八点半提醒我去上班”,Cortana正确的识别了语义。
(2)告诉Cortana“给我查找特朗普的新闻”,Cotana会返回基于Bing搜索的内容,不过相关性还算可以接受。
(3)另外,Cortana还内置了微软翻译功能,可以直接语音交互来翻译,如“给我翻译一下我喜欢中国古典文学”。
实际体验Cortana和Siri可以明显感受到微软的语音助理可用性比苹果高出不少。例如,同样对Siri说“给我翻译一下我喜欢中国古典文学”,Siri的反馈是“这可能超出了我目前的能力范围”。
其次Cortana支持语言混搭,如中文里混杂英文,但是Siri一旦设定了语言,所有语音都作为目标语言识别。
亚马逊也发布了一款语音产品echo,可以叫你起床,其内建了七个麦克风和喇叭。能帮用户播放来自 spofity 的音乐、买达美乐披萨、叫 Uber 快车,还能用 yelp 找附近餐厅,虽然像个小喇叭,但几乎能帮你完成所有事情。
从苹果投入语音助手领域,Google便紧随其后,在 2012 年的 Google I/O 大会上推出全新的搜索应用 Google Now。Google Now继承了 Google 先天的搜索功能,产品性能更人性化:可智能化的读取用户的搜索关键词,为用户提供相关的语音服务,响应速度也足够快,不仅能回答用户提出的问题,还能针对用户需求主动为用户发出提醒。目前,Google Now已升级为 Google Assistant,并同时推出了内嵌Google Assistant的智能音箱——Google Home。
Google在其官网称,Google Assistant是你的私人助理,时刻准备为你服务,你可以向Google Assistant提问任何问题和做任何事情。目前Google Assistant已经嵌入在Google Home、Google Allo,以及Google自家的手机Pixel内,Pixel也是目前植入Google Assistant的唯一一款手机。
Facebook 的messager M 也是一款语音助理软件,其定位和微软小娜、Apple Siri一样都是个人助理,该应用目前中国区还不可用。
聊天机器人展望
从被动学习到主动学习
目前,聊天机器人的知识库以人为预设为主,倘若机器人能够在与人交流过程中不断学习并积累知识、修正知识,则将更接近人的学习过程:即机器人在创建的时候,仅预设基本的学习模式和能力,后期根据需要学习需要的知识。
更为理想的情况是,机器人后期的学习也不需要人的干预,根据自身的需要机器人可以有目的的学习,或者将现有的、结构化的知识“装入”自己的大脑,实现快速的学习。
从娱乐到生活
机器人一旦能够称之为“智能”机器人时,聊天机器人就不再仅仅充当娱乐消遣的工具,而是真正成为一名“助理”的角色,帮助我们从繁琐的日常事务中解脱出来、解答问题、帮助决策以及陪伴生活等。
从智商到情商
从图灵测试开始,对聊天机器人的追求都是更倾向于对“智力”的追求:理解、分析以及表达能力,因为能够分析和处理语音与文字是沟通的第一步。当智力问题不再是问题,那么如何愉快、得体的沟通,即“情商”,会成为用户所关注的重点,聊天机器人需要有一定的情绪感知能力,捕捉心里状态并给予适当的反应。
作者简介:付钦伟,专利代理人、专利咨询师,研究生选专业“误入歧途”,进入高大上的知识产权领域,目前从事专利咨询分析工作,励志为中国知识产权事业抛头颅、洒热血。
推荐阅读
用知识产权的眼光
看世界
欢迎原创投稿,稿件一经采用,支付稿费
投稿邮箱:iptree@iptalent.com