查看原文
其他

当AI住进智能音箱,我拥有了一位情绪稳定的话痨朋友

卷毛 头号AI玩家 2023-07-10

作者 | 卷毛
编辑 | 张洁
校对 | 月山橘


你用过前些年大火的智能音箱吗?现在是不是放在家里的某个角落吃灰了?


眼下,AI大模型有望给智能音箱“注入灵魂”!让它们从不太聪明的“人工智障”,升级为真正的“人工智能”。


上个月,天猫精灵发布了新品IN糖3 Pro,值得注意的是这次接入了阿里通义千问大模型,新增AIGC能力,目前正在内测中


虽迟但到,“头号AI玩家”近期也拿到内测资格,有幸体验了一段时间,发现不少有趣之处,现为各位玩家送上这份天猫精灵AIGC demo评测(含视频),欢迎围观!




实测IN糖3 Pro:更聪明的智能音箱


我们还是先通过以下4个日常生活中的使用案例,来感受一下天猫精灵升级前后的变化。


升级前后对比视频

1. 日程提醒

升级AIGC前:它有点听不明白需求

:帮我记一下明天早上11点开会。

IN糖3 Pro:您需要记录的是明天早上11点开会嘛?

:到时候,到时候(这里重复了一下)提醒我。

IN糖3 Pro:您需要记录的是到时候到时候提醒我嘛?

:我说的是明天早上11点开会,你到时候提醒我。

IN糖3 Pro:没有听清,我先退下了。

:设置明天早上11点的闹钟提醒我开会。

IN糖3 Pro:为你设置好了明天上午11点的闹钟。

看来面对升级前的IN糖3 Pro,说话的方式还是要简单点。

升级AIGC后:我感觉自己有私人助理了

:下午5点要开会,到时候提醒我。

IN糖3 Pro:稍等,没问题,我就静静地守在这里,等到今天下午5点,提醒您要开会。

(下午5点,叮的一声铃声响起,“现在是下午五点,您有一个提醒,要开会”)


2. 饮食建议

升级AIGC前:它好像很有自己的想法

:晚上吃什么好呢?

IN糖3 Pro:你可以尝试一下兰州拉面。

:我不想吃兰州拉面。

IN糖3 Pro:可我就喜欢吃面条。


升级AIGC后:我有了一位营养咨询师

:推荐一下中午吃什么。

IN糖3 Pro:推荐中午吃西兰花和鱼肉,这两样都是抗衰老和抗癌食物,也是最佳蛋白质来源,并且含有丰富的抗氧化物质,可以帮助维持机体的健康状态。另外,可以选择一些蔬菜,如菠菜、韭菜、芹菜、白菜、油麦菜以及茼蒿,选择其中2-3种在中午吃,可以为肉中的蛋白质提供非蛋白质热量,以提高减肥效果。此外,可以选择一些粗粮,为肉中的蛋白质提供非蛋白质热量,以提高减肥效果。

:适合夏天中午吃的菜。

IN糖3 Pro:夏天中午吃的菜可以选择清淡一些的,比如凉拌黄瓜、凉拌豆角、凉拌海带和西兰花,也可以选择一些水果,如西瓜、桃子、柠檬、草莓等,将它们入菜,消除干燥,打破沉闷,让你清凉舒适,精神抖擞!此外,还可以选择一些素菜,如红烧鸡翅、绿豆玉米粥、清蒸鱼、西兰花炒肉等,可以根据自己的口味进行选择。

3. 影视推荐

升级AIGC前:它需要特定的指令才能推荐影视内容

:最近有什么好看的综艺?

IN糖3 Pro:对不起,我不明白你的意思。

:搜索一下最近的热门综艺。

IN糖3 Pro:对不起,我不明白你的意思。


升级AIGC后:能听懂自然语言提问,根据多个条件推荐内容

:推荐一些经典的电影。

IN糖3 Pro:1.《教父》 2.《泰坦尼克号》 3.《罗马假日》 4.《霸王别姬》 5.《美国往事》 6.《美国精神病人》 7.《教父2:黑帮帝国》 8.《泰坦尼克号3D》 9.《教父3:黑色狂欢》 10.《美丽心灵》

:有没有喜剧电影?

IN糖3 Pro:让我短暂思考一下,当然有,以下是一些经典的喜剧电影: 1.《西虹市首富》 2.《美人鱼》 3.《疯狂的石头》 4.《三傻大闹宝莱坞》 5.《喜剧之王》 6.《西蒙和格蕾丝》 7.《阿甘正传》 8.《怦然心动》 9.《大话西游》 10.《喜剧之王2:月光宝盒》

可以可以,有内味儿了。


4. 讲个段子

升级AIGC前:播放已录制好的音频资源,段子比较老

:讲一个笑话。

IN糖3 Pro:主人,欢迎来听笑话。嗨,欢迎来到精灵的每日笑话专区。(播放欢快的背景音乐,主播开始讲笑话)有一天,李大聪在家里边打孩子,啪啪啪把那孩子打得嗷嗷直哭啊,媳妇看到之后就赶紧上去阻止,“你怎么回事,你怎么打孩子呢?”大葱说:“这个兔崽子,居然在学校里边和别人比赛。”他妈妈一听,“这好事啊,有上进心,怎么了?”大葱说:“你知道他和同学们比的是啥啊,他和同学们比谁的爹先死!你说我不打他打谁!”(哈哈哈哈的机器音)

好吧,这很难评。


升级AIGC后:当场输出土味情话

:你知道土味情话吗?

IN糖3 Pro:我考虑一下下,当然,很甜蜜呢!比如:“你是我最可爱的小宝贝,我愿把我的整个世界都给你。”

:那你给我讲一个比较搞笑的土味情话。

IN糖3 Pro:当然可以!比如:“你是我心目中最甜的奶油蛋糕,每一口都像是在跟你亲吻。”

虽然有点被油到了,不过能感受到它还是有点东西……‍‍


依照官方提供的核心场景介绍,升级后的天猫精灵至少还可以进行一些这样的对话:生成个性故事、生成个性歌单、生成菜谱推荐等。

比如为小朋友讲述(现编)一个故事:

小朋友:天猫精灵,能不能讲一个小精灵的故事呀?

天猫精灵:好呀。春天万物复苏,一只小精灵从小木屋里出来寻找新鲜的野果…… 

小朋友:小精灵什么样子? 天猫精灵:它长着一双兔子耳朵,大大的眼睛... 小朋友:是像小鹿一样的眼睛吗? 

天猫精灵:对呢,他有一双小鹿般的眼睛,喜欢到森林里采野果……
可以看到,升级大模型后,IN糖3 Pro依然非常“有个性”,而且拥有了连续对话能力。‍‍

只要说一次“天猫精灵”将其唤醒,之后就能进行多轮对话,它可以记忆和理解上下语境,让聊天更流畅持久。当然,你也可以随时打断对话,它会立刻给出新的回答。

据介绍,IN糖3 Pro涉及多模态能力和技术,同时基于以通义作为整个大模型的基础,在天猫精灵的多语音交互的场景去构建的整个技术体系,包含语音相关的技术,以及声学、信号处理、语音识别、文本转语音等技术和能力。

根据官方给出的操作指引,IN糖3 Pro的AIGC能力主要体现在以下5个方面

1. 知识挖掘

据测试,天猫精灵可以流畅介绍《三体》这本书的基本信息,回答叶文洁是拯救派还是降临派,黑暗森林法则的含义等复杂问题。


2. 情感理解

天猫精灵能在一定程度上理解人的情绪,给出适当的建议。

比如当我表示自己打王者荣耀连输20把,它表达了遗憾,并建议我去休息一下,调整状态,还劝我不要骂对手。就像一位善解人意且情绪稳定的朋友。


3. 拟人特征

天猫精灵接入通义千问后,变得更加拟人,知识、情感、个性、记忆能力得到大幅跃升。

比如这位天猫精灵角色名叫派拉,它介绍自己平时喜欢看电影、听音乐、看书,比较喜欢听的轻音乐来自班得瑞。


4. 写作辅助

据说目前为中学生左右水平,更适合辅助小学生写作。

比如让它写一篇主题为“春天”的散文,还挺有模有样。


5. 创作灵感

比如我想画一张六一儿童节主题的图片,直接问天猫精灵可以画什么内容,再根据它的回答继续细化画面,最后让它给这幅画配上相应的文案。


更多技能和玩法还有待探索,有了AI加持,新一代天猫精灵的确变得更加智能不过,目前通义大模型还在不断学习和迭代,仍存在缺陷和局限性,在体验过程中,我也发现了一些尚需完善的地方。

例如,由于连续对话反应过于灵敏,天猫精灵成了“一位容易接话的话痨朋友”,当它被唤醒后,20秒内听到的声音(即使不是对它说的),都很容易被识别成指令,并积极给出回应,根本停不下来……这时候只能主动要求它终止回复,次数多了可能会有点麻烦。

当然,这其实也是它的优点。此前天猫精灵方面在介绍“如何训练鸟鸟分鸟”时提到,他们在对话方面的训练中采用了天猫精灵的猫耳算法,“就是猫的耳朵是特别灵敏的,它能够分辨的误差也比较灵敏,而且它的耳朵是可以独立旋转的,当不同的地方发出声音的时候,它的耳朵可以立即旋转,准确地定位出不同的声源”。


除此之外,通义千问大模型据说具备联网能力,但我的测试结果是天猫精灵并不能很好地获取实时信息,比如要求它查一下五月天最近一场演唱会的时间,它回答说“主人,我们聊点别的吧”;要求搜索华为的最新手机,它介绍了HUAWEI Mate 20,然而最新款是Mate 50。

另外就是大语言模型都很难避免的“AI幻觉”,即可能会生成错误的、虚构的事实,这些回答听起来振振有词,但实际牛头不对马嘴。比如问天猫精灵2022年发生的事情,它竟然列出了秦朝灭亡、楚汉之争。


这也在提醒我们需要保持警惕,AI再聪明也可能会犯错,以及,AI智能音箱的升级虽已迈出第一步,但还需要时间。

就在最近,业内首个大语言模型治理开源中文数据集100PoisonMpts发布,十多位知名专家学者成为了首批“给AI的100瓶毒药”的标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题,并对大模型的回答进行标注,完成与AI从“投毒”和“解毒”的攻防。

据了解,首批领域数据围绕AI反歧视、同理心、商榷式表达等目标,已覆盖法理学、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公平等维度。100PoisonMpts数据集预计在6月开放第一批问答数据。

AI+智能设备正在兴起


AI大爆炸时期,大模型激活了落灰的智能音箱,AI+智能设备正在兴起。


值得一提的是,天猫精灵近期还发售了一款智能眼镜产品,使用了骨传导技术,在镜腿处设置了麦克风和扬声器,目前大模型能力正在内测中。


UP主“森树Tree”参与了内测体验,从她的内测视频来看,升级AIGC后,该眼镜支持智能语音交互,可陪伴用户即时运动、给出饮食建议、在玩游戏时陪聊角色攻略,相当于一个AIGC助手

         
公开资料显示,天猫精灵的技术内核是AliGenie智能交互系统。据上海证券报报道,今年4月,天猫精灵已开始试水首个阿里巴巴千问大模型的终端侧体验升级,并持续探索个性化大模型方向。大模型加上移动声学技术,被认为可以广泛应用于耳机、头盔等穿戴设备中。

目前,阿里方面暂未明确后续的智能终端系统升级政策,天猫精灵智能眼镜何时升级大模型能力并全面推向市场,尚无具体的时间表。

至于为何率先选择音箱、眼镜接入阿里大模型,而非其他硬件,官方给出了这样的回应

糖线是整个智能音箱市场上出货量最大的产品,也是天猫精灵创立以来最有标志性的产品线,有强大的用户基础,用来做AIGC的测试符合建立新的技术能力和消费端的感知。

而智能眼镜则可以展现随身终端的想象力,具有随时智能语音交互的能力。这也是个性化大模型走出家庭走进更开放的交互空间的尝试。天猫精灵智能眼镜主打骨传导专利技术,这份特质在一定程度上确实保证了移动“私密声场”的实现。

不仅是天猫精灵,各大厂都在纷纷对原有产品进行升级,或推出全新的AI产品。AIGC应用正从软件走向硬件。

百度在今年2月宣布,小度将融合文心一言的全面能力打造针对智能设备场景的人工智能模型,“小度灵机”应用到小度全系产品。近期,小度已推出一款名为“手表AI”的产品,定位是手表聊天AI与AI生活助手。接下来百度还将发布第一款整合小度AI技术能力的智能手机。

小米在今年一季度财报中也提到,要把AI大模型能力落地,小爱同学是典型场景。

“大模型技术可以将更多的数据和算力用于训练模型,从而提高语音识别的准确率和反应速度,进一步提升智能音箱的用户体验和智能、便捷的服务,从而吸引更多的用户。”中国通信工业协会两化融合委员会副会长吴高斌在接受媒体采访时表示,智能音箱作为智能家居领域的一大热门产品,虽然面临着一定的挑战,但通过大模型技术的不断升级和拓展应用场景,有望重新火爆起来

PS. 玩家朋友们,你们有打算入手一只AI版的智能音箱吗?‍‍‍‍‍‍




本文由「头号AI玩家」(ID:AIGCplayer)原创发布,而非AI生成。欢迎留言与我们交流,如需转载请留言。
后台发送关键词“头号AI玩家”进AIGC交流群,与我们一起玩耍,共同学习、探索、见证AI的进化。

 也欢迎你分享、点赞、在看
 一起研究AI 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存