查看原文
其他

智能语音创投趋缓 核心技术仍需升级

郭露 核芯产业观察 2021-01-17

在人类的感官通道中,视觉占据最主要的位置,听觉次之,但在信息传递中,听觉语言的综合利用率要远高于视觉符号。因此,更接近于人类本能的交互方式--语音交互受到广泛关注。目前,随着智能语音技术的发展和应用场景的不断丰富,人机交互方式已经开始从键盘、鼠标以及触摸式的图形交互,向语音模式转变,并且随着搭载量和使用率的提升,未来有望成为人机交互最主要的入口。

底层技术持续增强

智能语音包含语音识别、语义理解、自然语言生成以及语音合成等环节。其中,语音识别是率先商业化、应用最成熟的人工智能技术之一。根据信通院数据,全球智能语音识别错误率连续降低,从2008年的23.6%降低到2017年的5.5%。

与此同时,国内厂商也在不断刷新准确率的上限。2018年6月,阿里巴巴推出语音识别模型DFSMN,准确率高达96.04%;科大讯飞也在同期宣布讯飞语音识别率提升至98%;2017年11月,百度大脑推出新款语音识别模型--“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型”,打破了传统远场语音识别技术的流程,将语音识别准确率提高30%以上。

此外,大数据、深度学习、云计算等技术的迅速发展,也为智能语音提供了底层技术支持。

应用场景丰富多元

在国家大力发展人工智能产业的战略引导下,以及企业技术能力提升和市场需求不断扩张的驱动下,智能语音技术在智能家居、车载环境、在线教育、医疗、呼叫中心等各个场景均有落地化应用。据中国电子信息产业发展研究院预测,未来三年智能语音市场将保持25%以上的增速,到2021年预计达到194.8亿元。

例如,在智能家居方面,语音声控的应用增强了终端设备控制家居的简便性、易用性、互动性和娱乐性。目前,众多参与者以智能音箱作为智能家居语音交互的切入口。例如接入阿里智能家居平台的天猫精灵、提供智能家居控制入口的小度音箱、连接小米智能家居生态的小爱智能音箱等等。

再如,在智能车载方面,从安全因素考虑,车载智能语音应用将是未来市场的刚需场景,如媒体娱乐、行车导航、信息查询、即时通讯等等。2016年11月,科大讯飞发布智能车载系统飞鱼助理,并于2017年11月发布2.0版本,该系统通过对语音引擎、生态引擎、云+端服务进行深度整合,并赋予智能人机交互方式,来为用户提供人脸识别、AI虚拟助手、声源定位、非全时免唤醒+上下文理解、自定义唤醒词、XTTS等功能。

另外,在随身设备方面,随着设备功能的多元化,人们迫切需求摆脱传统输入设备的束缚,以智能手机为例,有关数据显示,到2023年智能手机配备语音交互功能的比例将达到90%以上。并且据IDC预测,到2020年随身设备的智能语音渗透率将达到68%。可见,智能语音拥有丰富的应用场景,渗透率也会不断提高。

图:2020年智能语音渗透率预测 
数据来源:IDC

创业及资本渐趋理性

智能语音市场参与者主要为科技巨头及传统智能语音企业,行业集中度较高。科技巨头在语音行业的布局多为对外开放语音生态系统,对内则在自身产品中实现AI First。例如,百度Dueros开放平台、阿里AliGenie开发者平台、腾讯的智能语音平台腾讯云小微等等。传统智能语音企业已在语音行业深耕多年,1999年成立的科大讯飞市场占有率已然位列第一,除了面向教育、司法、医疗、城市等领域推出智能语音解决方案以外,还向硬件方面拓展,推出了翻译机、学习机、录音笔等相关产品。

此外,科技巨头和传统智能语音企业出于构建生态、积累数据等方面的考虑,大都提供开放平台,而初创企业则可以借此发挥后发优势。虽然头部企业已经处于绝对优势,但随着应用场景的丰富,行业机会仍不断涌现,智能语音初创企业也吸引了资本市场的关注。据<华秋创服>不完全统计,2000-2019年,共有55家智能语音方案企业获得融资,共计157笔,平均成立1.7年后获得第一笔融资获投企业主要分布在北京、广东、上海等地从时间分布来看,2015年开始进入融资高峰期,2019年有所下降,一定程度上反映了智能语音企业的创业热潮正逐渐趋于理性,市场也越来越重视企业的核心技术和落地能力。

图:2000-2019年智能语音方案企业获投笔数 

数据来源:华秋创服

图:2000-2019年获投智能语音方案企业地区分布

 数据来源:华秋创服

市场前景广阔 技术仍待突破

IDC数据显示,智能语音在我国人工智能市场中的份额占有22%的比重场景应用的普遍化,促使整个行业开始从发展初期向成熟期迈进。虽然科大讯飞、百度等占据了市场近七成的份额,但是,随着应用场景的拓宽,整个市场规模仍会不断扩大。

不可否认的是,虽然智能语音技术飞速发展,但在实际应用环境中,语音信号往往伴随着环境噪声和混响,使得语音识别的性能急剧下降。例如,讯飞中英文语音识别准确率分别达到98%和95%,但在有方言、噪音、口音和远场情况下,提高语音识别准确率仍有较大的提升空间再如机器翻译,虽然实时高效,但距离会议同传以及高水平翻译所讲究的“信、达、雅”仍存在较大差距可见,虽然语音识别等某一技术环节已经取得较大发展,但面对应用场景的复杂性,智能语音技术仍有待突破。


声明本文为电子发烧友整理,如有侵权,请联系删除。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com

更多原创文章阅读
◆语音识别“拐点”已至,现在切入才是好时机?
◆5G CPE 真香!众厂商抢先收割 10 亿红利
◆继NB-IoT之后,Cat.1爆红背后的产业链机会
◆回望2019全球半导体并购案,AI与物联网成最大趋势
◆2023年BLE将占据蓝牙90%份额  我国芯片厂商开始布局
◆中国 5G 规模将领先世界!2019 年 5G 行业十大事件回顾
◆对话雪湖科技王韵—— FPGA 已经到了火山口
◆首颗FD-SOI工艺FPGA芯片诞生!莱迪思开启逆袭之路?!
◆CEATEC2019直击:日本半导体公司的物联网前沿科技
◆智慧灯杆全解读,从灯杆屏到物联网平台!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存