查看原文
其他

AI+元宇宙,Meta 翻身稳了?

徐顺利 曹天鹏 飞哥说AI 2023-11-09
作者 | 徐顺利  曹天鹏
编辑 | 高    佳


今日凌晨,Meta Connect 开发者大会,小扎携 Meta Quest 3 卷土重来。在这场近几年来 Meta 最倍受瞩目的发布会上,小扎似乎也找回了曾经意气风发的时光。


继今年 6 月,苹果带着 Vision Pro 树立王者标杆,让科幻片走进现实后,剑拔弩张的 Meta 终于拔刃,践行其虚拟世界的梦想。


而此前深陷元宇宙深坑的 Meta,在此次发布会上试图重新讲述大模型新意。巨头林立之下,摸着劲敌过河,Meta 正彰显怎样的战略和勃勃野心?


Meta AI 落地虽无新意,却让其重回科技第一梯队


AI 在整场发布会中所占的比重没有想象中那么恢弘,甚至略显平淡。如果没有 OpenAI 两天前“炸场”的 GPT-4V(ision) 多模态模型,Meta 发布的图像生成模型——Emu(Expressive Media Universe),可能会“惊艳全场”。


但是现实世界中没有“如果”,OpenAI 能够“基于图片的对话”和“实时语音对话”的 ChatGPT,依旧“遥遥领先”。


这或许是 Meta 略显慌乱的主要原因,小扎正踌躇满志地想来一场正面团战,没想到被 Sam Altman 偷了家。以至于,发布会的直播倒计时之后又来了一遍倒计时,延期了 30 分钟。


虽然在 OpenAI 多模态的阴影下,Meta 的图片生成有些暗淡无光。不过 Meta 还是理清了其大模型的落地路径,与Google、微软大体相同,一方面将 AI 植入自家全家桶,赋能存量业务;另一方面研发 AI Native 应用,推出了基于 Llama2 打造的人工智能聊天机器人——Meta AI。


目前,这种路径已经成为了巨头们的常规玩法。而 Meta 也借此重新回到了科技第一梯队,过山车一般的股价也证明了这一点。



LLaMA 有望让 Meta 的元宇宙世界成真



此前,每年亏损 200 亿美金的元宇宙,让 Meta 承受了巨大的内外部压力。在大模型出现之前,或者说在 LLaMA 开源之前,很少有人看好 Meta 的元宇宙业务。

但基于 LLaMA,我们似乎看到了其元宇宙梦想成真的可能性。


Meta AI 推出了28种不同的 AI「明星助手」,每个助手都有角色定义,以服务不同目的。此外,Meta 将在明年推出沙盒,让任何人都可以尝试创造自己的人工智能。


在大模型的加持下,元宇宙中的角色和 Agent 都已经具备了一定基础,结合不断迭代的图像生成能力,元宇宙的场景生成也将得到持续地突破和优化。


凭借 LLaMA,小扎或许能够跳出元宇宙的深坑,开辟另一番可为天地。




元宇宙能否成为AGI的最佳载体?



未来人类跟 AGI 的交互方式具有两个特点:第一是自然语言交互,第二是多模态。从这个角度来看,智能硬件是人类与 AGI 之间交互的入口,也是最佳载体,智能硬件代表了未来的交互方式。


苹果发力 VR,Meta 强调 MR 正是看重并相信这个趋势。在两个巨头的引领下“AI+硬件”预计将迎来一波爆发。


元宇宙提供了一个沉浸式和交互式的环境,可以充分展示 AGI 的能力。在元宇宙中,AGI 可以作为虚拟助手、角色或其他实体,帮助用户进行各种任务和活动。AGI 可以增强元宇宙的功能和交互性,使其更加智能和个性化。从这个角度来看,元宇宙是 AGI 非常重要的一个应用场景。


但 AGI 的应用不能局限于虚拟世界,必须要通过智能硬件与现实世界交互,具有影响和改变现实世界的能力,如果无法解决物理世界中的问题,那并不是真正的 AGI。


元宇宙可能是AGI的一个重要应用场景,即使有 VR、MR 头显的加持,但是否是最佳载体还有待进一步探讨和证明。




双线作战,小扎可能选择了一个最优解



将 Facebook 改名为 Meta 宣布 All in 元宇宙的决策,差点让小扎沦为科技圈的笑柄。今年 2 月,充满喜剧色彩的开源 LLaMA,也让人有些出乎意料。


但两者结合之后却擦出了不一样的火花,虽然看起来 Meta 不仅在大模型赛道要和 OpenAI 、微软、Google、亚马逊大打出手,还要在智能头显上和苹果硬刚,处于双线作战的状态。


不过,小扎可能选择了一个最优的解法,堪称其独特的战略定位。


在开源方面,Meta 是在真心全意地投入,从 LLaMA 到 Llama2 ,模型的性能有了极大提升。Llama2 还开放了商用权限,这不仅让中小企业和学术界可以玩得起大模型,同时基于 LLaMA 构建起来的开源生态,还将有利于切实解决大模型一系列现有的落地问题,如幻觉、与领域数据库对接、精调便捷性、inference 成本和运行速度等。


如果 Meta 未来能够在 AI 生成元宇宙内容(Text to 3D)这一方向上不断突破,切实解决元宇宙内容的冷启动问题,那么它就能以正确的姿势大步踏上实现元宇宙的梦想之路。


据说,Meta 明年会出开源版 GPT-4,或让其傲然跃居真正的行业颠覆者。



对战苹果,Meta 底气十足



6月苹果发布 Vision Pro 之后,Meta 的压力很大,很多人也都想知道早就已经拥有头显的 Meta 会如何应对。

小扎的答案简单粗暴——价格战。Quest 3 在不仅前一代产品的基础上大幅提升各项硬件性能,还构建了丰富的 MR 生态。最重要的是便宜,不要3999,不要2999,只要499,在价格上直接碾压了苹果。


此外,相较于在大模型上后知后觉的苹果,Meta 有着将大模型与头显、智能眼镜融合的先发优势,在智能硬件这片战场上,与苹果对线, Meta 有着十足的底气。


在演讲结束时,小扎总结道,“MR+AI+智能眼镜,这个组合就是未来。”似乎 Meta 已经初现王者之姿,布局好了更长线的宏图战略。


而智能眼镜真的意味着解决硬件问题的终点吗?这种说法有些过于乐观。


虽然 MR、大模型引领下的 AI 都已经到达了相对成熟可用的状态,但智能眼镜作为一个老生常谈的概念——从 Google Glass 到苹果的 iGlass 每年都会被拿出来说一遍,能否在短时间内真正成为大众消费品,还尚未可知。


即使 Meta 大发神威,明年成功将 Ray-Ban Meta 智能眼镜普及,“MR+AI+智能眼镜”也只会成为人机交互的另一个入口,很难说它就是“未来的一切”。




以下直击发布会现场‍



Meta AI:Meta版ChatGPT叫板OpenAI



自 Llama2 开源之后,Meta 的大模型应用无疑是业内关注的焦点。发布会上,Meta 发布了对标 Bard、Bing 和 ChatGPT 的全能人工智能助手——Meta AI。


Meta AI 适用于所有 Meta 应用程序,用户可以直接与它交谈,或者在 Instagram、Messenger 或 WhatsApp 里对话。




Meta 构建了 28 种不同的 AI 角色,以服务于不同目的。例如,用户可以与副主厨聊天以获得烹饪建议,或者与编辑聊天以获得写作帮助。

聊天机器人旨在让人感觉像是在与真人聊天,使用户体验更具互动性和亲密性,Meta 还可以让 AI 扮演名人角色,包括史努比狗、汤姆·布雷迪、肯德尔·詹纳和大阪直美等。

多模态方面,虽迟但到。Meta 发布了对标 DALL-E 和 MidJourney 的 AI 图像生成器应用——Emu。扎克伯格对 Emu 进行了现场演示,Emu 生成的时间约为 5 秒。


在 Emu 和 Llama2 的支持下,AI 贴纸功能可以用户在 WhatsApp、Messenger、Instagram 和 Facebook Stories 上用任何文本提示生成贴纸。


Meta 还推出了 to B 工具 AI Studio,该平台允许企业为公司的消息服务(包括 Facebook、Instagram 和 Messenger)构建 AI 聊天机器人。



Quest 3 :低价版 Vision Pro 硬刚苹果



Meta 将在今年发布 Quest 3 早已不是什么新闻了。在发布会开始之前,Meta 最新的 VR 头显 Quest 3 的外形和配置已经被曝光得七七八八,和苹果每年的手机一样。



相比于上一代产品,Quest 3 搭载了基于 Arm 架构的高通骁龙 XR2 Gen 2 芯片。Meta 表示,Quest 3 的处理能力是 Quest 2 的两倍,甚至比运行一代 XR2 芯片的 Quest Pro 要好得多。

显示方面,Quest 3 的单眼分辨率为单眼 2064 x 2208 像素,双眼分辨率 4128 x 2208 像素,分辨率较上一代提升了近 30%。Quest 3 提供水平 110 度、垂直 96 度的视野,比 Quest 2 扩大了约 15%。


在功能上,Quest 3  能够实现 VR 和 MR 两种模式的无缝切换,只需要使用手柄或敲击两次头显切换即可实现,用户可以在 MR 模式下同时看到头显中正在显示的内容。


另外,Quest 的手部动作追踪功能也更加完善,即便不使用控制器,也能识别用户的手势动作。


售价方面,Quest 3 起售价 499 美元,较前代 Quest 2 起售价贵了 200 美元,涨幅约 67%。基本款 Quest 3 配备 128GB 内存售价499.99美元,512GB 的版本售价 649.99 美元。相比苹果Vision Pro 3499美元“天价”,Quest 3 可谓太“良心”,会迎合更广大的受众市场。



从游戏切入,构建 MR 生态



除了硬件性能的升级,Quest 3 更主要的卖点在于 MR 生态的构建。

Quest 开发者生态系统已经成为全球最强大的VR平台之一。迄今为止,Quest 商店中的游戏和应用所产生的营收已经超过了 20 亿美元,平均每 12 款游戏中就有一款游戏的总营收超过了 1000 万美元。‍

发布会最早出现的应用,便是乐高 Lego Bricktales 的 MR 游戏,之前这款游戏只能在平面屏幕中玩,现在 Meta 现在可以让你用 Quest 3 的 MR 功能在客厅实景里玩。


今年 12 月,Xbox Cloud Gaming 将登陆 Quest 3,解锁 100+ 款游戏,整个 Quest 将成为一个便携式 Xbox「串流神器」。玩家戴上 Quest 3、拿起控制器、设置虚拟屏幕,就可以玩 Halo、Forza 等其他 400 多种游戏。


为了提供更好的 MR 应用体验,Quest 3 通过传感器以及 AI 算法,将具有更强的环境感知能力。Quest 3 是其首款支持采集场景数据、网格数据和深度数据三种空间数据的 VR 设备。

这使得设备能够识别物体和表面、标记物体(如桌子、沙发、窗户等)以及估计物体的大小、形状以及彼此之间的距离信息等。


玩家在游戏时,既能看到现实世界的环境,又能查看游戏或内容,无需再划分安全边界,VR 游戏体验可以进一步实现虚拟世界与现实环境配合,如将屏幕锚定在桌子上方、射击游戏碰到墙壁会出现反弹效果、虚实遮挡呈现更加自然等。


除了游戏,Quest 3 还支持体育赛事直播如 NBA、LFA 和 UFC,感受身临其境的观赛体验。


此外,Meta 也发布了和苹果 Vision Pro 一样的办公场景应用,宣布微软 Office登陆 Quest 3。


MR 办公应用 Softspace 可让用户在现实环境中生成虚拟工作空间,用户可在其中记笔记、整理照片以及组织想法等,该应用也即将在 Quest Store 上线。




持续加码,首款搭载 Meta AI 的智能眼镜



Meta和雷朋联合推出的第二代智能眼镜,被命名为“Ray-Ban Meta”,是本次发布会上的另一大亮点,将于10月17日正式发售,起售价为299美元。


该款智能眼镜搭载了高通骁龙最新推出的 AR1 Gen1 芯片,可持续使用四到六个小时,拥有32GB存储空间,可以存储 100 个视频、500 张照片,比上一代轻 32% 更轻,一次充电续航 36 小时。


在镜腿上配备了一颗摄像头,可以拍摄高达 1200 万像素的照片,或者是在 1080p 分辨率下录制最多 30 秒的视频。


因为没有像传统智能眼镜那样配备屏幕,而是采用了类似于太阳镜的设计,这款智能眼镜在功能上相对较为单一,可以播放只有佩戴眼镜的用户能听到的音乐;右镜腿上有小型的摄像头,可以当作相机使用。


值得一提的是,通过 Ray-Ban,用户只需在镜腿上轻按几下,就可以直接开始在 Facebook 或 Instagram 上进行直播。直播时,出于隐私安全考虑,用于提醒他人录制正在进行的捕捉 LED 变得更明显,它还会以脉冲模式闪烁。


不仅如此,新一代 Ray-Ban 智能眼镜会内置 Meta AI,可为用户提供所看物品的信息。但遗憾的是,今天全新发布的Meta AI,要等到明年才能上机,到那个时候,具备有多模态能力的Ray-Ban Meta,才算是一款完整的智能眼镜。



相关阅读:

WWDC观后感:苹果硬件依旧王者,但与AIGC第一梯队渐行渐远

Google I/O观后感:AGI时代,Google廉颇未老,尚能食肉

AGI时代,Google必须开源,封闭不是壁垒

新的Google DeepMind成立,看好,祝Google在AGI时代重振雄风


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存