AI PC,联想发布了,巨头们要真正下场了
4月18日,联想正式发布了“真正的”AI PC,揭示着大模型规模化应用落地,预计今年年底,全球约10%的电脑都将是AI PC,近3000万活跃用户。
AI PC引领了对大模型与终端设备相结合的市场验证。通过端侧设备建立起个人AI用户体验,包括PC、手机、汽车、可穿戴设备和AI原生设备,正在汇成今年生成式AI应用的最大赛道。AI PC作为计算平台,当前最适合容纳完整而又最小可行的通用推理能力,率先交卷。联想希望6月能将大模型也塞进手机与平板。
这条赛道充满了想象空间。苹果、微软等传统的垂直整合巨头优势明显;全球最大的整机厂商联想,整合供应链并完整交付设备与用户体验。甚至连英伟达也抢先向PC部署大模型。AI PC的创新与竞争,将很快全面展开。
真正的AI PC
联想这次发布了六款AI PC,并试图定义为全球首批真正意义上的AI PC。它具备五大特征:内置个人大模型与用户自然交互的智能体、本地异构算力(CPU/GPU/NPU)、个人知识库、开放人工智能应用生态、个人数据和隐私安全保护。它们会在5月20日正式发售。
与以往的产品相比,它首要的区别就在于本地部署模型,并且在本地实现生成式AI功能。本地是数据生成的地方,在本地完成推理,才能真正带来个性化(Personalized)的AI计算(Compute)体验。这是AI PC的另一重含义,也是未来所有AI终端所要去往的地方。本地也意味着用户隐私得以保障。
个人智能体“联想小天”提供了用户直接交互的界面。与其以文字、语音等方式自然交互,目前已经可以在离线的环境下,实现图片生成、PPT制作、文档总结、知识问答等十大功能。用户也可以点击按钮,在本地环境与云端环境之间切换。
发布会上,大力倡导AI PC的英特尔CEO基辛格、AMD CEO苏姿丰,以及高调主张混合AI的高通CEO安蒙,都认为AI PC开启了个人AI时代。
个人知识的“外挂”
增强检索生成(RAG)与智能体(Agent)技术,正让大模型在与人类的共同学习与工作中,获取本地知识,感知用户意图,并不断进化,是满足个人AI体验的关键技术。
知识工作者是AI PC的早期主流用户,会在AI PC上留下整天的工作痕迹。未来的智能体工作流(Agentic Workflow),将整合并深入用户在各类软件上产生的数据,通过RAG技术,更好地扮演工作助理的角色。吴恩达等大佬们相信,GPT-3.5在各类智能体工作流的协助下,就能达到GPT-4的水平。
完整版AI PC的发布,将牵引具体应用场景落地。中国南极昆仑站首任站长分别在云端环境与本地环境下向“联想小天”询问同一个问题,结果本地大模型给出了更贴近他职业身份的回答。因为个人智能体已经帮他将以往工作积累的文档,都整理成了个人知识库。
这样的个性化AI体验具备商业价值,用户愿意为之买单。而这正是目前大模型所苦苦寻觅的。同样面对台风来袭,云端大模型可以给出它的行进途径,但只有结合企业知识库与企业大模型,才能更好地分析它沿途将中断的供应链,同时规划好替代方案。
研究者们仍在持续发散式地探索各类RAG技术。比如希望将大模型从被动的知识获取,扭转为主动学习;或者识别更多模态,营销与创意人员迫切需要从长期工作积累的海量视频中捞到最合适的素材。
集体智能的再个性化
每个大模型都是对人类集体智慧的抽象,部分更具通用性,部分则在特定领域独具优势;每个用户又都是在不同场合下不同社会身份的集合。通过混合(Mixture)、融合(Merge)或堆叠(stack)更多的大模型,生成新的大模型,是对人类集体智慧的再个性化,可以迅速部署到它需要出现的场景之中。
混合专家模型(MoE)的颗粒度越来越细。在推理时,Mixtral-8x7B会从8个专家模型中选取其中的2个,实际激活130亿参数。DBRX更大一点,共1320亿参数,但会从16个专家模型中激活其中4个,组合方式更多,通过覆盖更多的细分场景,兼顾针对性与泛用性。
甚至可以让大模型自己动手,尝试最优组合。Transformer八子的Llion Jones,最近发布了EvoLLM系列模型,可以从数据流空间(Data Flow Space)或参数空间(Parameter Space)入手,将多个不同的开源模型,“进化”并“融合”成新的模型,以适用于不同的工作场景。
联想向未尽研究透露,在训练“联想小天”的时候,也采取了相应的技术,实现端侧优化与场景优化。“我们不是训练大模型的专家,但我们是把大模型压缩和适配到设备上的专家”,联想CEO杨元庆说。
个性化AI将无处不在首批真正的AI PC的发布,是对个人AI时代的初次商业化探索,增强了市场对它的全面到来的确定性。随着异构算力性能的逐步提升,以及开放权重模型性能的逐步逼近,个人AI体验将在AI PC逐步提升,并扩散至更多个人终端。
AI PC的本地推理性能,会从今年下半年起进一步提升。英特尔与AMD等目前为AI PC提供的芯片,整体AI算力接近40 TOPS ,而到了今年下半年,高通Arm架构的芯片,仅NPU算力就突破了40 TOPS,届时整体算力将达到100 TOPS。英特尔与AMD的计划在年底发布的下一代芯片,也将AI性能提升至了这一代的3倍。
开源模型的性能也正在逐步逼近闭源模型,目前约落后18个月。未来几周内,最受关注的将是Llama3,Meta计划先推出它的两个小参数规模版本。这将掀起新的微调定制与本地部署的热情。Llama 2已经通过ChatRTX等形式在端侧落地。谷歌的无限注意力(Infini-attention )技术,也让支持百万上下文的模型,很快可以装到笔记本电脑里了。
随着算力芯片的单位成本的“通缩”,以及模型的单位规模性能的“扩展”,个人AI体验会迅速在越来越广泛的个人终端落地。在联想的规划里,继5月20日中国市场上首次发售AI PC之后 ,联想PC在中国市场上第二批将有50%是AI PC,到2024年底渗透至80%。联想还将在今年6月把大模型装进手机与平板等个人终端。
塑造个人AI体验之争
以AI PC为代表的个人AI终端是一次产品的革命,仍处于发散式创新的阶段。真正的玩家,有以苹果Mac为代表的软硬件垂直整合,以微软为代表的操作系统结合AI杀手级应用的整合,以联想为代表的整机厂商会在用户反馈下建立起混合推理引擎与AIOS。
微软正在践行Windows on Arm战略。今年,它有望一手GPT-5,一手Windows 11升级版,凭借高通芯片强大的本地算力,让用户按一下专门的物理按键,就能在Surface上实现Copilot的本地推理。微软的AI生产力工具,在实现货币化的同时,对用户有着足够的黏性。它可能在5月21日的Build 2024上透露更多信息。
苹果是传统PC时代垂直整合的典范,又自研了AI芯片与AI框架MLX,陆续抛出论文证明自己仍处于第一线。它的最新的M4芯片已经接近量产,具有三种不同性能型号,旨在以AI为重心,重造自己的Mac PC产品线。6月10日的WWDC期间,可能会有iOS 18与M4的最新消息。
整机厂商的优势在于直接面对用户塑造体验,可以依靠广泛的客户网络与丰富的应用场景,时刻验证技术路径、功能需求、交互体验,根据用户反馈调优产品。用户群体越庞大,细分场景越齐备,就越有机会“融合”与“进化”出兼顾针对性与通用性的大模型与智能体。
未来,如果AI PC继续向手机、电动车、可穿戴等更多个人终端设备迁移,那么,在塑造围绕个人AI体验中逐步确立垂直整合地位的中国企业,将越有机会在产品创新中发挥主导作用。
获取完整“AI PC报告”,在后台发送 AIPC