用 AI 专核跑语音,全志携手 Arm 中国定义下一代智能音箱 | R329 与周易 AIPU 详解
将 Arm 中国首款自主 AIPU 集成在全志科技 R329 芯片上,将会为智能音箱市场带来怎样的变化?
- shenzhenware -
在上个月深圳湾的一篇行业解读中,我们提到了两份智能音箱市场报告:2019 年全球智能音箱销量达到 1.469 亿部,同比增长 70%,同年中国智能音箱市场销量 3682.2 万台,同比增长 126.6%。
单看国内市场,其中的贡献,一方面来自天猫精灵、百度、小米等榜单上的玩家,另一方面则是背后的几大头部芯片供应商全志科技、瑞芯微、晶晨半导体等。
据不完全统计,全志科技面向智能音箱的 R 系列主控芯片已经广泛应用于天猫精灵方糖 R、小度在家、小度音箱 Play、小爱音箱 Play、小爱音箱 mini、京东叮咚、腾讯听听、网易云音箱等多款产品。其中,R328 已经成为智能音箱市场客户认可的主流方案,并成为公司业绩增长的主要动力之一。
在深圳湾过往的多次交流中,全志科技都提到过智能音箱的往事:从 2011 年开始做 Wi-Fi 音箱(智能音箱的雏形)的主控芯片,没有成为第一波先烈,反倒是柳暗花明,坚持至今,最终成为智能音箱市场的一匹黑马,也是让我们看到了市场的机会。
转眼进入 2020 年,已经是全志科技涉足智能音箱领域的第 10 个年头,主打高性价比的 R328 的传奇还在继续,全志科技与 Arm 中国合作打造的 R329 横空出世。
4 月 16 日,深圳湾应邀参与了 Arm 中国和全志科技举办的媒体沟通会,与 Arm 中国产品研发副总裁刘澍、全志科技副总裁陈风,一起聊了聊成就 R329 的「周易」AIPU 和智能音箱的故事。
全志科技副总裁陈风指出,去年推出的 R328 也是采用了 Arm Cortex A7 处理器的典型产品,但它是用 CPU 来跑智能语音。在与很多友商和算法公司进行了大量的交流后,全志科技发现,市场对专用算力是有明确需求的。因此,经过了 10 个多月的研发,R329 应运而生。
R329 是基于 Arm 的多核异构处理器,集成了高性能的 AIPU、DSP、CPU 等 5 颗计算核,具有高算力、低功耗的特点,是一款 AI 语音专用芯片。
先看一下规格:
基于主频 1.5GHz 的 Arm Cortex-A53 双核架构,相较于 R328,全新升级的 R329 提供高达 1.58 倍整数算力,1.94 倍浮点算力。
集成了 400MHz 双核 HIFI4,可以更大限度地达到优异的能效比,在使用中降低产品发热,体验更优。
配合芯片集成的 SRAM 与嵌入式第二代 VAD 硬件,更进一步降低功耗和发热。1 节 2500mA 的电池,可实现 1 周的待机时长。
R329 首次搭载了 Arm 中国「周易」AIPU,可提供最高达 0.256 TOPS 的运算能力。周易 AIPU 作为 AI 专核,其理论 AI 算力是单核 A7 1.2GHz 和单核 HIFI4 600MHz 的 25 倍。
在「周易」AIPU 的加持下,更充足的专用算力可以支撑更多的语音应用。用深度学习做端到端的算法,相对于传统降噪、回声消除和关键词识别算法,效果提升巨大,显著提升识别率和交互体验。
此外,R329 芯片还通过丰富的音频接口(集成多路音频 ADC 和 DAC、3 路 I2S 和 8 通道 DMIC,同时集成 LDOs),提供更多的功能扩展。
Arm 中国产品研发副总裁刘澍首先向我们介绍了周易 AIPU 名字的来源。他指出,全志科技 R329 所采用的 Arm Z1-0701 是 Arm 中国「周易」AIPU 第一代架构,其中,07 是它有 2 的 7 次方的硬件 MAC,01 表示它里面还有一个通用的 Tensor 处理单元。命名即表明了处理核的个数,也表明了算力的承载能力。
周易 AIPU 处理器是针对深度学习定制的,其架构包含以下几个部分:
向量处理单元(Vector/Tensor process),类似 NEON 的向量处理指令集,通过 8 比特向量阵列进行向量计算。
AI Fix Function,将通用 AI 部件和单元固化下来成为硬件,。
Scalar,通用目的的 CPU 运行指令集,具有类似 CPU 的标量处理功能。
可扩展的安全架构,可兼容 Arm 的 TrustZone 安全方案。
可扩展的用户定义架构,如全志科技的案例。
Arm Z1-0701 是专门针对智能家居、智能楼宇、智能机器人场景深度定制的,同时也支持比较简单的视觉分析能力,如图像和人脸的识别和感知。
其最大的优势是在精度和算法移植的速度上也有很高的优化,它可以非常高效地运行本地的 KWS 和本地的 ASR 等各种语音算法。
而在用户端的体验则是功耗低,原先用 CPU 跑 AI,产品的发热需要在结构上做一些主动散热,现在用 AIPU 来接替 CPU 的运算工作,可以很好的缓解这个问题。这就为产品的进一步小型化、长续航提供了可行性。
其次是安全扩展。周易 AIPU 传承了 Arm 的 TrustZone 安全技术来保证整个设备里面数据的安全性。在设计之初,就已经考虑了安全保障,使用户隐私得到有效的保障。
那么,「周易」AIPU 与以往的语音加速器(DSP)有什么不同呢?Arm 中国产品研发副总裁刘澍指出:
周易 AIPU 具有高度的可配置性,可以实现单核上达到 0.2T~4T 的算力,而如果采用多核配置,可以增大到 64T,这样就能应用到汽车电子或其他大算力的服务器上。
而在开发的支持方面,可以实现 Tensorflow 模型 24 小时移植,接口也是和 Tengine 的接口是统一的,能够实现跨平台应用,给开发者很多便利。
此外,相比 Arm 的 U55 和 N77,周易 AIPU 更加通用,既可以与 Cortex-M 或 Cortex-A 一起工作,也可以作为处理器进行独立工作。
全志科技是 Arm 中国的战略合作伙伴,推动了「周易」AIPU 的首个落地应用。在技术选型上,全志科技陈风认为,传统的通用处理器 + DSP 的设计还不能支撑更高的算力,因此 R329 选配了「周易」AIPU 专核,来应对更大的语音智能处理需求。
全志科技对于「周易」AIPU 的信心,不仅来自于其强大的 AI 运算性能,还来自于全志科技对于智能音箱、乃至语音 AI 应用前景的前瞻。
陈风认为,首先,语音解决的是人们从「动手」到「动嘴」的问题。语音不可能替代键盘、触摸屏、按钮、鼠标等所有其他的人机交互方式,而一旦语音 AI 能够像一个贴身佣人一样,语音的实用性会大幅度提升,从而解决人「懒」的问题。
其次,语音具有「非接触」交互的优势。这次新冠疫情就已经把非接触摆到了一个非常高的位置,免接触电梯成为热点。语音是有它独特的使用场景。
最后,全志科技坚信,语音将带来功能入口的扁平化。相对于 PC 时代的网站导航和 Google、百度等搜索引擎,语音可以把几百个功能点简化成一句话,直达搜索结果。最典型的应用就是电视,未来语音搜索将成为电视标配,这也是智能音箱以外,语音应用的巨大增长点。
未来,R329 与周易 AIPU 将以智能音箱为主要切入点,渗入到智慧城市,包括智能楼宇、智慧工业以及智慧生活的方方面面。
从产品形态上,也不仅局限于智能音箱,语音遥控电视、语音服务机器人、物流机器人、语音面板、语音电梯、道闸、门禁等等。
正如深圳湾在此前的分析中指出的,随着 AI 性能在提升、交互模态在增加,智能音箱行业将呈现出低功耗高性能、多模态交互能力、边缘计算和本地控制、分布式控制等趋势。全志科技与 Arm 中国携手打造的这一用例,或许就像一面镜子,为我们映射出了下一代智能语音应用的样子。■
智能音箱 & 语音智能
2019 全球智能音箱出货量近 1.5 亿台,两份报告,一份解读 2019 Q3 智能音箱全球出货量 2860 万,这个市场还令人兴奋吗? 智能音箱已进入 3500 万中国家庭,谁的品牌认知度最高? 2019 Q2 全球出货量达 2610 万台,百度成全球第二大智能音箱厂商 2019 Q2 全球智能音箱出货量 3030 万,全年出货量有望达 1.5 亿 2019 Q1 全球智能音箱出货量 2070 万,2019 语音市场大不相同 2018 全球智能音箱出货量 8620 万,2019 市场主要增长点是带屏音箱 2023 年中国智能助手设备保有量将达到 58 亿台,大家电、智能手机是重点
实测小度语音定制后,对语音助手从工具向人格化方向进化的思考 文字转语音功能上线,用 Google Assistant 朗读网页内容是怎样的体验 从个人助理到生产力助理,微软 Cortana 回归办公场景的下一步 近 1.3 亿美国人使用车载语音助手,活跃度远高于智能音箱 语音助手三年变化,在全球化市场中探索新机会 Google Assistant 全体验:强化隐私、离线语音等多个跨场景功能
快到「湾」里来
深圳湾正在招聘:
真知灼见的科技记者
四通八达的运营编辑
才华横溢的市场策划
技能爆表的活动运营
热情四射的社区达人
简历传送门:
shining@shenzhenware.com
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。