AI+元宇宙,Meta 翻身稳了?
今日凌晨,Meta Connect 开发者大会,小扎携 Meta Quest 3 卷土重来。在这场近几年来 Meta 最倍受瞩目的发布会上,小扎似乎也找回了曾经意气风发的时光。
继今年 6 月,苹果带着 Vision Pro 树立王者标杆,让科幻片走进现实后,剑拔弩张的 Meta 终于拔刃,践行其虚拟世界的梦想。
而此前深陷元宇宙深坑的 Meta,在此次发布会上试图重新讲述大模型新意。巨头林立之下,摸着劲敌过河,Meta 正彰显怎样的战略和勃勃野心?
但是现实世界中没有“如果”,OpenAI 能够“基于图片的对话”和“实时语音对话”的 ChatGPT,依旧“遥遥领先”。
这或许是 Meta 略显慌乱的主要原因,小扎正踌躇满志地想来一场正面团战,没想到被 Sam Altman 偷了家。以至于,发布会的直播倒计时之后又来了一遍倒计时,延期了 30 分钟。
虽然在 OpenAI 多模态的阴影下,Meta 的图片生成有些暗淡无光。不过 Meta 还是理清了其大模型的落地路径,与Google、微软大体相同,一方面将 AI 植入自家全家桶,赋能存量业务;另一方面研发 AI Native 应用,推出了基于 Llama2 打造的人工智能聊天机器人——Meta AI。
目前,这种路径已经成为了巨头们的常规玩法。而 Meta 也借此重新回到了科技第一梯队,过山车一般的股价也证明了这一点。
LLaMA 有望让 Meta 的元宇宙世界成真
但基于 LLaMA,我们似乎看到了其元宇宙梦想成真的可能性。
Meta AI 推出了28种不同的 AI「明星助手」,每个助手都有角色定义,以服务不同目的。此外,Meta 将在明年推出沙盒,让任何人都可以尝试创造自己的人工智能。
在大模型的加持下,元宇宙中的角色和 Agent 都已经具备了一定基础,结合不断迭代的图像生成能力,元宇宙的场景生成也将得到持续地突破和优化。
凭借 LLaMA,小扎或许能够跳出元宇宙的深坑,开辟另一番可为天地。
元宇宙能否成为AGI的最佳载体?
未来人类跟 AGI 的交互方式具有两个特点:第一是自然语言交互,第二是多模态。从这个角度来看,智能硬件是人类与 AGI 之间交互的入口,也是最佳载体,智能硬件代表了未来的交互方式。
苹果发力 VR,Meta 强调 MR 正是看重并相信这个趋势。在两个巨头的引领下“AI+硬件”预计将迎来一波爆发。
元宇宙提供了一个沉浸式和交互式的环境,可以充分展示 AGI 的能力。在元宇宙中,AGI 可以作为虚拟助手、角色或其他实体,帮助用户进行各种任务和活动。AGI 可以增强元宇宙的功能和交互性,使其更加智能和个性化。从这个角度来看,元宇宙是 AGI 非常重要的一个应用场景。
但 AGI 的应用不能局限于虚拟世界,必须要通过智能硬件与现实世界交互,具有影响和改变现实世界的能力,如果无法解决物理世界中的问题,那并不是真正的 AGI。
元宇宙可能是AGI的一个重要应用场景,即使有 VR、MR 头显的加持,但是否是最佳载体还有待进一步探讨和证明。
双线作战,小扎可能选择了一个最优解
将 Facebook 改名为 Meta 宣布 All in 元宇宙的决策,差点让小扎沦为科技圈的笑柄。今年 2 月,充满喜剧色彩的开源 LLaMA,也让人有些出乎意料。
但两者结合之后却擦出了不一样的火花,虽然看起来 Meta 不仅在大模型赛道要和 OpenAI 、微软、Google、亚马逊大打出手,还要在智能头显上和苹果硬刚,处于双线作战的状态。
不过,小扎可能选择了一个最优的解法,堪称其独特的战略定位。
在开源方面,Meta 是在真心全意地投入,从 LLaMA 到 Llama2 ,模型的性能有了极大提升。Llama2 还开放了商用权限,这不仅让中小企业和学术界可以玩得起大模型,同时基于 LLaMA 构建起来的开源生态,还将有利于切实解决大模型一系列现有的落地问题,如幻觉、与领域数据库对接、精调便捷性、inference 成本和运行速度等。
如果 Meta 未来能够在 AI 生成元宇宙内容(Text to 3D)这一方向上不断突破,切实解决元宇宙内容的冷启动问题,那么它就能以正确的姿势大步踏上实现元宇宙的梦想之路。
据说,Meta 明年会出开源版 GPT-4,或让其傲然跃居真正的行业颠覆者。
对战苹果,Meta 底气十足
小扎的答案简单粗暴——价格战。Quest 3 在不仅前一代产品的基础上大幅提升各项硬件性能,还构建了丰富的 MR 生态。最重要的是便宜,不要3999,不要2999,只要499,在价格上直接碾压了苹果。
此外,相较于在大模型上后知后觉的苹果,Meta 有着将大模型与头显、智能眼镜融合的先发优势,在智能硬件这片战场上,与苹果对线, Meta 有着十足的底气。
而智能眼镜真的意味着解决硬件问题的终点吗?这种说法有些过于乐观。
虽然 MR、大模型引领下的 AI 都已经到达了相对成熟可用的状态,但智能眼镜作为一个老生常谈的概念——从 Google Glass 到苹果的 iGlass 每年都会被拿出来说一遍,能否在短时间内真正成为大众消费品,还尚未可知。
即使 Meta 大发神威,明年成功将 Ray-Ban Meta 智能眼镜普及,“MR+AI+智能眼镜”也只会成为人机交互的另一个入口,很难说它就是“未来的一切”。
以下直击发布会现场
Meta AI:Meta版ChatGPT叫板OpenAI
自 Llama2 开源之后,Meta 的大模型应用无疑是业内关注的焦点。发布会上,Meta 发布了对标 Bard、Bing 和 ChatGPT 的全能人工智能助手——Meta AI。
Meta AI 适用于所有 Meta 应用程序,用户可以直接与它交谈,或者在 Instagram、Messenger 或 WhatsApp 里对话。
Meta 还推出了 to B 工具 AI Studio,该平台允许企业为公司的消息服务(包括 Facebook、Instagram 和 Messenger)构建 AI 聊天机器人。
Quest 3 :低价版 Vision Pro 硬刚苹果
Meta 将在今年发布 Quest 3 早已不是什么新闻了。在发布会开始之前,Meta 最新的 VR 头显 Quest 3 的外形和配置已经被曝光得七七八八,和苹果每年的手机一样。
显示方面,Quest 3 的单眼分辨率为单眼 2064 x 2208 像素,双眼分辨率 4128 x 2208 像素,分辨率较上一代提升了近 30%。Quest 3 提供水平 110 度、垂直 96 度的视野,比 Quest 2 扩大了约 15%。
在功能上,Quest 3 能够实现 VR 和 MR 两种模式的无缝切换,只需要使用手柄或敲击两次头显切换即可实现,用户可以在 MR 模式下同时看到头显中正在显示的内容。
另外,Quest 的手部动作追踪功能也更加完善,即便不使用控制器,也能识别用户的手势动作。
售价方面,Quest 3 起售价 499 美元,较前代 Quest 2 起售价贵了 200 美元,涨幅约 67%。基本款 Quest 3 配备 128GB 内存售价499.99美元,512GB 的版本售价 649.99 美元。相比苹果Vision Pro 3499美元“天价”,Quest 3 可谓太“良心”,会迎合更广大的受众市场。
从游戏切入,构建 MR 生态
发布会最早出现的应用,便是乐高 Lego Bricktales 的 MR 游戏,之前这款游戏只能在平面屏幕中玩,现在 Meta 现在可以让你用 Quest 3 的 MR 功能在客厅实景里玩。
玩家在游戏时,既能看到现实世界的环境,又能查看游戏或内容,无需再划分安全边界,VR 游戏体验可以进一步实现虚拟世界与现实环境配合,如将屏幕锚定在桌子上方、射击游戏碰到墙壁会出现反弹效果、虚实遮挡呈现更加自然等。
除了游戏,Quest 3 还支持体育赛事直播如 NBA、LFA 和 UFC,感受身临其境的观赛体验。
此外,Meta 也发布了和苹果 Vision Pro 一样的办公场景应用,宣布微软 Office登陆 Quest 3。
MR 办公应用 Softspace 可让用户在现实环境中生成虚拟工作空间,用户可在其中记笔记、整理照片以及组织想法等,该应用也即将在 Quest Store 上线。
持续加码,首款搭载 Meta AI 的智能眼镜
该款智能眼镜搭载了高通骁龙最新推出的 AR1 Gen1 芯片,可持续使用四到六个小时,拥有32GB存储空间,可以存储 100 个视频、500 张照片,比上一代轻 32% 更轻,一次充电续航 36 小时。
在镜腿上配备了一颗摄像头,可以拍摄高达 1200 万像素的照片,或者是在 1080p 分辨率下录制最多 30 秒的视频。
因为没有像传统智能眼镜那样配备屏幕,而是采用了类似于太阳镜的设计,这款智能眼镜在功能上相对较为单一,可以播放只有佩戴眼镜的用户能听到的音乐;右镜腿上有小型的摄像头,可以当作相机使用。
值得一提的是,通过 Ray-Ban,用户只需在镜腿上轻按几下,就可以直接开始在 Facebook 或 Instagram 上进行直播。直播时,出于隐私安全考虑,用于提醒他人录制正在进行的捕捉 LED 变得更明显,它还会以脉冲模式闪烁。
不仅如此,新一代 Ray-Ban 智能眼镜会内置 Meta AI,可为用户提供所看物品的信息。但遗憾的是,今天全新发布的Meta AI,要等到明年才能上机,到那个时候,具备有多模态能力的Ray-Ban Meta,才算是一款完整的智能眼镜。