AI 全面落地,详解声智科技全链条操作系统 SoundAI Azero | WARE 2019
比起谈酷炫的概念,声智科技更希望脚踏实地地把这些概念一一落地。
- shenzhenware -
小米 AI 智能音箱、小度智能音箱、华为 AI 音箱、王者荣耀智能机器人、荣耀 YOYO 智能音箱、天猫精灵魔盒……
不管你是不是一个智能音箱用户,上述的产品中,你或多或少都听说过。而在这些音箱们「小嘴叭叭」与用户交流的背后,多多少少都离不开一家名为「声智科技」的公司的支持。
△ 声智科技赋能产品的冰山一角,摄于深圳湾 WARE 2019 峰会现场
声智科技是一家融合声学和人工智能技术的平台服务商,成立 3 年,声智科技已经占领中国语音市场超过 70% 的市场份额,是全球最大的智能音箱技术供应商之一。
在过去两年多的「百箱大战」的战场上,各家音箱产品身上,或多或少都有声智科技这家公司的身影。官方数据显示,目前,声智科技赋能的产品累计出货量超过 2000 万台,其服务客户包含了小米、百度、阿里、华为、腾讯、360、中国移动等多家行业巨头。
用周治国自己的话来说,声智科技是一家「躲在巨头背后的服务提供商」。
7 月 19 日,在由深圳湾举办的「WARE 2019·新硬件 AI 技术与应用峰会」上,声智科技销售总监周治国与我们分享了在 AI+IoT+5G 的融合新趋势,声智科技对于智能语音设备下半场的思考,首次在深圳公开分享全链条远场智能交互系统「SoundAI Azero」,并带来了 SoundAI Azero 赋能的多款硬件产品。
△ 声智科技销售总监周治国
/ / / / / / / / / /
智能语音市场上的「冰」与「火」
过去几年中,智能音箱市场有多么火热,我们可以从数据中明显感受到——根据 Strategy Analytics 披露的数据,2018 年全年智能音箱的出货量达到 8620 万,其中,2018 Q4 单一季度的出货量便达到了 3850 万台,超过 2017 年全年的出货量。
而当时间进入 2019 年之后,我们再度聚焦智能音箱市场,不难发现,这一市场依然火爆,但市场格局早已不是两年前的「百箱争鸣」,现如今的智能音箱市场,玩家仅剩为数不多的几家巨头,留给产品团队和传统设备厂商的机会并不多。
在复盘这一市场时,周治国指出,与传统智能硬件相比,语音产品技术链条长,需要整合的技术和内容较传统硬件要复杂得多,受限于团队的资金和技术能力,要把语音 AI 的用户体验成熟度做到产品级并实现量产,期间的挑战并不小。
一方面,智能音箱涉及到唤醒算法、降噪算法、声学结构、内容整合等多项技术,技术链条长,只有巨头厂家才有能力调动资源;另一方面,智能音箱后期需要接入大量的技能、服务、视音频内容等,这所需时间周期长、成本高。
而随着 AI+IoT+5G 的到来,智能语音硬件还远远不止智能音箱单一品类,需要应对的产品形态更加多样和碎片,这将大大延长技术链条在设备的移植周期和成本。此外,智能语音产品还存在声学调试困难、开发周期长等问题,这些问题对于产品团队和传统设备厂商来说,都是不小的挑战。
基于上述思考,声智科技发布了全链条远场智能交互系统「SoundAI Azero」。该系统以远场语音交互和远场双工通话为技术内核,兼容主流芯片架构、硬件设计和声学结构,具有一站式 Turnkey 解决方案、全面的语音交互能力、高整合内容资源、协议兼容性强、两周实现快速开发等特点,可广泛应用于多种场景的硬件设备。
AI+IoT+5G 背景下,行业需要能够快速落地的一站式解决方案
SoundAI Azero 与 Alexa 类似,同样提供了从声学结构设计、远场语音交互、技能服务开发的一站式全链条解决方案,但其目的又不只是做好「中文版的 Alexa」,而是基于声智科技在中文语音市场丰富的服务经验,在各个细节做精、做细,帮助设备厂商又快又好地实现产品开发和量产。
如周治国所说:
语音交互方面,SoundAI Azero 集成了远场唤醒、波束形成、声源测向、噪声抑制、混响消除、回声消除、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话、自然语言处理、声波配网等多项技术,远场交互能力强,并支持硬件检测。
同时,SoundAI Azero 还支持自定义唤醒词。周治国表示,未来,设备商可以在 1~2 天内实现快速自定义唤醒词,且这一唤醒词的体验效果可以达到目前小米「小爱同学」体验效果的 85%,以实现产品快速上市。而在产品上市之后,厂商还可以通过在线数据收集的方式来实现自定义唤醒词的迭代升级,让产品体验慢慢向「小爱同学」们靠近。
内容和服务方面,SoundAI Azero 接入了市面上主流的音乐、有声读物、视频平台,以及信息查询、生活服务、出行路况等服务,并通过免费技能的方式开放给合作伙伴,确保设备从一开始就具备了语音交互基础的内容和服务。同时,SoundAI Azero 还提供灵活的技能开发及接入方式,支持 Android、 Linux、QNX 等七种系统以及多种播放器,常用技能开发部署时间一周以内,可极大缩短开发周期。
为了帮助合作伙伴完成快速开发,在云端,SoundAI Azero 还支持「内容+IoT+APP」三云合一;设备端,SoundAI Azero 对 Turnkey 代码进行了开源。基于此,设备上最快可以实现两周完成快速开发工作。
在应用场景方面,SoundAI Azero 除了我们熟悉的智能音箱外,也将支持智能家居、智能会议、智能教育、智能医疗、智能汽车、金融科技、能源电力、智能法院、智能交通和机器人等多种应用场景下多个终端产品。
对话声智科技:做好细节,把炫酷的概念真正落到具体的应用中
深圳湾:智能音箱新一轮的较量是产品体验和技术实⼒的较量,未来, 声智科技有哪些可以领先行业一到两年的技术研发投入?
周治国:我们(声智科技)本来是躲在巨头背后的服务提供商,我们现在想针对中小企业提供服务。我们(声智科技)有一个口头禅,声智科技是比较实在的公司,我们更关注的是全链条用户的体验。当然,与很多语音技术提供商一样,包括声纹、分布式拾音、多轮对话、全轮对话,这些技术声智科技都会做,但是我们重点会关注整个链条真实的体验。
举个例子,整个链条的延时,如果通过多个云来做,产品延时会非常长,而超过 1.5 秒以后就会影响用户实际的体验,所以,声智科技希望通过三云合一,大大缩短这个时间。类似这样的产品体验提升,是声智科技的主要方向。
另外,我们要快速加快这些硬件的落地,可能会支持更多操作系统、硬件和操作平台,包括一些低功耗的,我们不会自己做芯片,但是会支持更多芯片公司、芯片厂家,赋予他们智能硬件的概念。
深圳湾:SoundAI Azero 全链条远场智能交互系统可以帮助客户两周内完成快速开发,那么到量产上市一般可以有多快?
周治国:「两周内完成快速开发」是针对语音链条的开发,至于整个产品的量产周期需要根据产品的复杂性而定。根据我们的经验,如果这个产品是无屏的智能音箱,基于 SoundAI Azero ,我们可以将目前市面上主流的 7~8 个月的产品上线时间缩短到 2 个月。■
微信号:shenzhenware
主笔、编辑:大树 / 深圳湾
/ / / / / / / / / /
// WARE 2019 III //
// WARE 峰会精彩回放 //
快到「湾」里来
深圳湾正在招聘:
真知灼见的科技记者
四通八达的运营编辑
才华横溢的市场策划
技能爆表的活动运营
热情四射的社区达人
简历传送门:
Lynn@shenzhenware.com
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。