透过聪聪的 AI 与爱,看云知声希望打造的标杆型儿童智能产品
- shenzhenware -
在不久前的深圳发布会上,国内人工智能企业云知声发布了新一代机器人操作系统 KEROS 2.0。这一系统在原有语音交互能力之上,加入了视觉、触控等多模态交互方式,赋予了设备更加自然、丰富的人机交互体验。
在此基础上,云知声还发布了「聪聪 AI 陪伴教育机器人」,提供了听、说、看、陪伴、提醒和学习几项功能——这是云知声成立 7 年来首次推出的面向消费市场的 AI 硬件产品,也是云知声 KEROS 2.0 智能教育操作系统落地到硬件设备上的标杆之作。
在产品正式上市之前,我们拿到了这款聪聪 AI 陪伴教育机器人,并让聪聪与我家小侄女(女孩,6 岁)有了一段相对深入的互动。硬件与软件的深入融合,聪聪不是一只莫得感情的机器人
说实话,不管是作为孩子的家长,还是这个行业的从业者,在与聪聪相处的这段时间里,我的感受都是惊喜的:聪聪的硬件是毫无疑问的「标杆配置」,但同时,聪聪的「标杆配置」又不仅仅只是靠硬件堆料,而是将硬件性能和 AI 能力做了深度的融合,使得产品的整体感觉更加灵动、舒服。
我们先简单了解一下聪聪 AI 陪伴教育机器人硬件配置:
聪聪搭载 7 寸高清防蓝光触摸屏,T 型 4Mic 阵列,支持 360° 声源定位+ 5 米远场拾音,产品内置大光圈广角摄像头、光感、距离传感器、重力传感器,以及 350° 高精度舵机。同时,产品内置了一个 4400mAh 电池,可脱离电源使用。
与很多带屏的儿童智能产品不同,聪聪的屏幕与机身其实是一个完整的整体。在待机或对话状态下,聪聪屏幕上只会有一双大眼睛,可以做出各种表情,比如爱心、皱眉、生气等,既蠢萌又灵动。
而在这双灵动的大眼睛之上,聪聪还进一步支持了声源+人脸跟随功能。不管站在任何角度唤醒聪聪,聪聪都可以主动把它的大脑袋转过来,并始终把视线放在主人身上。正是这一功能让我家小侄女格外得意,她告诉我,聪聪是她小跟班。
同时,聪聪还进一步支持了多轮对话,在整个对话过程中不需要重复唤醒聪聪,使得整体的对话过程更加流畅。
另外,根据云知声介绍,在后期的规划中,聪聪还将具备声纹+人脸认主的功能。未来,聪聪不仅可以做到及时响应用户的提问,还能精准地识别到底是小朋友在说话还是妈妈在说话,以提供更加精准的回答。
在学习方面,聪聪集成了一到六年级小学语文课本朗读、国学知识(古诗词、三字经等)、新课标必备读物(含语、数、英有声学习内容)、聪聪听听(睡前故事、成语故事、儿童音乐等),以及习惯养成、科学艺术等有声内容,基本覆盖了 3~12 岁儿童的学习内容。
在此基础上,聪聪还提供了 AI 伴读、口语评测、声率启蒙、成语接龙、AI 水果识别、AI 翻译等功能,通过多模态互动的形式,进一步提升学习的趣味性和效率。
本文中,我们重点分享一下伴读、口语评测和习惯养成等几项功能。
聪聪伴读相当于同类产品的绘本阅读功能,但聪聪的识别范围又不仅局限于绘本。根据介绍,聪聪已经可以支持市面上大多数的儿童绘本,以及小学一到六年级的英语课本。后续,聪聪还将进一步增加对其他读物的阅读支持。
由于聪聪的摄像头是面向正前方的,为了让整个阅读的过程更加舒服,聪聪还为这一功能准备了一个外挂装置——一个带有反光镜功能的小帽子。
使用时,只需要反光镜帽子放在聪聪的脑袋正上方即可自动进入伴读功能,随后,把绘本封面放在聪聪正前方进行识别后,便可以跟着聪聪开始绘本里的奇幻之旅了。基于图像识别技术,聪聪可以识别每一页绘本的内容,翻到哪里读哪里。
△ 戴上帽子的聪聪有种龙猫头顶绿叶片的即视感
相比于伴读功能,中文口语评测对小朋友的配合程度要求又高了一步,这一功能主要基于语音评测技术和自然语言处理技术来帮助刚刚开始学习语言的小朋友进行发音训练。
使用时,小朋友只需要选择对应的课本课程,然后跟着课程内容逐句朗读。完成朗读之后,聪聪会根据小朋友的朗读情况进行打分,并对朗读的流利度、完成度以及标准度进行逐项评分。同时,聪聪还支持收听课程标准读音、朗读情况回放。
实际上,口语评测是一款专业的智能化语言学习工具,往往被应用在培训机构、教辅机构或在线教育平台的英语或中文辅助教学中。而将这一功能带到了聪聪身上,则可以帮助家长更高效率地引导小朋友学习正确的发音和朗读方式。
或许很多家长都有过类似的体验,要让小邋遢们养成每天刷牙、准时睡觉等习惯是一件相对麻烦的事情,不仅小孩的配合度不高,而且因为家庭琐事很多,很多的时候家长未必能够每天都兼顾到。也正因此,聪聪身上的「习惯养成」功能显得格外「省心」。
使用时,家长需要在 APP 中的「成长管理」界面中进行相应的日程设置,比如添加起床、刷牙、洗澡、写作业等日程,或添加课程。完成相应设置后,到了对应时间,聪聪会在设备端提醒小朋友去完成对应任务。
现阶段,聪聪的「习惯养成」功能还比较简单。但比起以前我妈每天要强行把小朋友拎进洗手间的暴力催刷牙方式,用聪聪这一机器人来实现的「刷牙提醒服务」,不仅方式温和了许多,且可以一定程度上减缓孩子的抵触心理,让提醒成功率高了不少。对「误唤醒」的宽容与克制,聪聪还兼顾了其他家庭用户的体验
除了上述提及的功能点外,聪聪在唤醒方面的兼容与克制也让我格外欢喜——在误唤醒这一问题上,聪聪在最大限度降低误唤醒的前提下,也在一定程度上实现了对口音、发音问题的友好容错。
相比早前我们接触的很多儿童智能设备,聪聪在误唤醒方面可以说是做的最好的产品之一,在与聪聪接触的一周多时间里,聪聪基本没有出现过莫名其妙被唤醒的情况。同时,聪聪对于「你好通通」、「你好轰轰」、「你好公公」等挑衅行为,聪聪也都能做到充耳不闻。
而在另一方面,聪聪对各种带有方言的发音表现出了一种极高的宽容。作为一个广东老太太,我妈永远都只会「雷猴聪聪」等,而面对我们有意或无意发出的花式发音,聪聪基本每一次都快速反应、精准作答。
跳出聪聪这款硬件,我们再回过头来看看文章开头介绍的云知声 KEROS2.0 机器人操作系统。
在上一次采访中,云知声副总裁康恒在重新复盘了 2018 年儿童智能市场红海厮杀的格局之后表示,今年会呈现出一个完全不同的儿童市场,标准化的产品逐步减少,多样化、碎片化的需求不断增加。而面对这样市场,作为一家 AI 技术公司,云知声能够做的,便是将技术做的足够好用、易用,让内容商、服务商能够打磨出更多有价值的内容和服务,让设备商的创意和设计能够有「技」可施。一是在底层系统上将技术做的足够好,其中,包括了打断唤醒、多轮对话、语义理解等技术的优化,这些名词我们或许看着熟悉,但若要真的把技术落地,这需要下沉到产品和场景去做深度的打磨。而有了技术之后,还需要将技术与内容、硬件做更深层次的融合,让技术更好的服务于用户体验,提升儿童产品的陪伴与教育价值。也正式基于这样的思考,云知声才会花了一年多的时间,将 KEROS 从 1.0 版本升级到 2.0。从技术的维度来看,这个系统版本的升级是将相对单一的语音交互升级到了具备听、说、看、摸的多模态交互,但站在产品的角度来看,这一个用户体验的综合升级。
如我们在聪聪这款硬件身上感受的那种「舒服」一般,这是一种产品硬件和软件深层融合之后所带来的综合体验的升级。
在过去很长一段时间里,因为 AI 技术的不成熟,也因为产品缺乏视觉、肢体交互能力,大部分 AI 给用户的感觉始终是个莫得感情的机器人。但对于一款主打陪伴和教育功能的产品来说,莫得感情,AI 的价值就不复存在。在上一篇文章中我们指出,现阶段儿童智能硬件的用户活跃度不如想象中好,其背后的很大一部分原因是用户留存率太低,当产品过了新鲜期便被束之高阁。
相比之下,聪聪通过软硬件的深度融合,使得产品整体的举动、交互方式更加接近一个正常人,大大弱化了机器人身上的「机械感」,多了几分亲昵,赋予了聪聪与用户之间更多的情感关联。
有了情感关联,产品后续的陪伴和教育能力方可能成立。有情感关联之后,产品需要做的,就是将内容和服务体系做好,为后续的陪伴和教育能力持续输出。
不可否认,在这款聪聪的测试样机身上,产品依然存在不少问题,比如内容还比较单一,内容交互层级还不够深。但在已有的几个功能中,我们已经可以明显感受到,云知声 KEROS 2.0 正在尽可能多将内容和技术糅合起来,然后调用用户的眼睛、嘴巴、肢体,以一种更加投入的方式来进行产品互动,实现所谓的习惯养成和寓教于乐。
举个简单的例子,我家那个曾经十分不爱刷牙的小侄女,在聪聪的督促下,已经渐渐习惯每天到点就提醒奶奶一起去刷牙,然后躺在床上听故事睡觉。而这也大概是现阶段儿童智能产品可以为小朋友生活带来的最重要的价值之一。
聪聪 AI 陪伴智能机器人售价 1599 元,将于近期上市。想要买的话,请保持关注。■
微信号:shenzhenware
主笔、拍摄:大树 / 深圳湾
编辑:小花 / 深圳湾
快到「湾」里来
深圳湾正在招聘:
真知灼见的科技记者
四通八达的运营编辑
才华横溢的市场策划
技能爆表的活动运营
热情四射的社区达人
简历传送门:
Lynn@shenzhenware.com
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。