“坏了,这波冲苹果来的”,库克急来布局
作者 | 南风窗记者 黄靖芳
风起云涌的AI浪潮里,新技术就像随时改变市场格局的那个X因素,一旦能顺利利用到自己身上,落后者也能先发制人;但如果切入的时机不合适,巨头也会翻车。
如今,苹果就是那个略为焦灼的巨头,当他们从造车的项目里猛然回头,发现竞争对手们已经纷纷上岸,世界不一样了。
布局生成式AI,苹果罕见地成为了追赶者。
库克表示,他的公司正在投入“大量的时间和精力”将人工智能整合到其软件平台中
看似联手,实则“求救”
同样是智能手机里的老大哥,三星似乎比苹果先下一城。
2024年1月18日,三星推出了最新的高端旗舰机型Galaxy S24 Ultra、Galaxy S24+和Galaxy S24。作为首款搭载端侧AI的机型,S24系列能完成很多辅助功能,给消费者带来新的体验。
AI能给智能手机带来什么加成?在三星的发布会上,通话实时翻译功能是外界最关注的功能之一,能帮助用户在通话的同时标记实时的文字内容,还能在多种场合里进行翻译和记录。
另外,还有一个“即圈即搜”的功能,相当于如今淘宝识图功能的升级版,无论在什么平台里,AI都能直接识别文字、图片、视频里的信息。
目前,Galaxy AI功能还是免费使用的。对这款手机,三星上下抱有不小的期待。三星电子移动通信部门总裁自豪地宣称:“三星Galaxy S24系列为未来十年移动设备的创新指明了方向。”
三星Galaxy S24
不过,业内人士不难发现,这款新的旗舰机型缺席了三星自家的自研大模型,反而是选择和谷歌合作,将Gemini AI模型预装到Galaxy S24系列手机之中。
2023年11月,三星在首尔研发中心公布了其自行研发的生成式AI模型高斯(Gauss,以数学家高斯的名字命名),这个模型包括“Samsung Gauss Language”(语言)、“Samsung Gauss Code”(代码)和“Samsung Gauss Image”(图像)等子模型。当时,外界预计,基于这些生成式AI模型的产品有望很快推出。
实际上,高斯模型仅仅处于刚发布的阶段,勉强能在PC端跑起来,距离在手机端侧跑通有很长距离。自研大模型,并不是一件易事。
同为巨头,苹果也撞上了这堵墙。
13年前,当苹果首次发布语音助手Siri时,通过NLP(自然语言理解)技术,实现了人工智能的漂亮开场。可是,Siri伴随着苹果的封闭生态,这限制了其可以访问的数据量。
iPhone 仿生芯片
在这股AI浪潮里,机器学习的算法需要庞大的数据量才能有效运行和检验,封闭的生态导致了Siri无法在大样本量的基础上进行能力的提高。无法拥抱开源的技术,也就很难实现后续高效的开发,也就导致了苹果在生成式AI的潮流里留下“慢人一拍”的印象。
和三星的选择类似,苹果也找到了合作伙伴,试图通过“强强联手”,脱离目前的困境。
据彭博社报道,内部消息源透露苹果正在与谷歌沟通,计划将Gemini模型整合到其旗舰产品iPhone内。这个合作瞬间点燃了人工智能界,双方用户数量的规模和两者合作的形式,有可能会重新定义AI行业的规则。
Gemini是谷歌开发的生成式AI模型套件,其特点和优势是能同时识别文本、图像、音频、视频、代码这五种不同的数据。有评测称,在性能方面,Gemini对上述几种数据的理解和对数学问题的推理,几乎都超过了GPT-4。
所以,和谷歌联手是时下苹果“超车”的最佳选择。另外,由于谷歌在中国受限制,苹果也需要在合作领域找到国内靠谱的AI产品。3月25日,有消息称苹果将和百度合作,为在中国发布的iPhone 16等产品搭载AI功能。
不过,后来知情人士否认了这一说法。实际上,不管这个合作最后是否落地,苹果的生成式AI发展需要帮手,并且需要在中国实现技术本地化的战略,是显而易见的。
不久前,苹果CEO库克现身上海,与演员郑恺在黄浦江边合照。在被媒体问到与中国在AI领域的合作时,他给出的回答是:“我们计划在多个领域进行合作。”
库克与郑恺/图源:@郑恺
自研的路上
当然,苹果也在同步自研AI大模型的开发,他们的野心一点都不小。
2024年初,苹果发布了一篇论文《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》,里面介绍了怎样在一个有限存储的基础上运行大模型(LLM)。
因为大模型很大,需要占据很多的内存和算力,所以,苹果团队试图通过大幅度提高内存使用的效率,支持设备的运行,并且保证推理的速度。
在这个领域,苹果的研究成果还不少。最近发布的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》,提出了他们的MM1多模态大语言模型,最高30B参数,并在多个方面取得了“最先进”的结果。
语言模型的发展
M1是苹果的自制芯片,也许由于这个原因,他们把自己的大模型命名为MM1。在这篇论文里,苹果分享了关于MM1多模态大语言模型的预训练方法、分析和启示。所谓多模态,是指在各种格式(如图像文件、视频文件和音频文件以及纯文本数据)上训练的模型。通过这样的大规模训练,能够在多项基准测试中实现最先进的少量样本学习结果。
如今,苹果显而易见地展现着自己在战略重心上往人工智能方向调整的决心。
过去,苹果在发展AI战略上摇摆过,他们希望在造车上先走一大步。在苹果曾经的设想里,Apple Car是一款颠覆时代的座驾,拥有全自动驾驶,没有传统的车钥匙和方向盘,座椅有四个朝向。
但是,苹果造车之路走得并不顺畅,经历了人事上的变动以及项目研发上的受挫,量产越来越难。直到今年2月底,苹果取消了长达十年、投入数十亿美元的电动汽车项目。这一决定最初令参与的员工颇感意外,后来,从事汽车研发的员工相继被调整至人工智能部门。
与此同时,苹果的收购步伐也在加速。
苹果概念小型货车的电动汽车,代号为“Project Titan”
据媒体报道,苹果公司在今年早些时候收购了加拿大人工智能初创公司DarwinAI,后者的数十名员工已加入苹果的人工智能部门。作为交易的一部分,DarwinAI联合创始人、加拿大滑铁卢大学人工智能研究员Alexander Wong目前已加入苹果,担任人工智能团队的总监。
DarwinAI的核心技术之一是让AI系统变得更小、更快。这项技术可能对苹果有帮助,因为苹果正专注于在设备上运行AI,而不是完全在云端运行。
实际上,苹果收购的动作比同行还要多。从2010年收购Siri开始,苹果在十年时间里收购多达30余家AI初创公司,通过把初创企业纳入自己的生态,苹果产品的功能得以愈加完善。
但是,就像高盛选择把苹果股票从其“确信买入”名单中剔除的原因一样,苹果一直给人缺乏清晰的人工智能战略的印象。
Alexander Wong(中)与加拿大滑铁卢大学学生合照
而且别忘了,在中国,苹果也是强敌环伺。
竞争对手
国内的市场里,“AI手机”似乎已经不是什么大新闻。随着本土品牌的创新和研发实力不断增强,AI元素很快加入各家品牌的旗舰机型。
比如华为,是国内几家头部厂商中布局AI大模型最早的一家。2023年,华为率先将大模型接入手机,使得手机可以执行文本生成、知识查找、资料总结、智能编排、模糊/复杂意图理解等复杂任务。
而且,华为还开启了内置大模型的语音助手小艺的众测。这是在华为盘古L0基座大模型的基础上,融入大量场景数据,对模型进行精调,最后炼成的一个L1层对话模型,体现了华为大模型端云协同的能力。
“盘古大模型不作诗,只做事。”2023年华为开发者大会上,这一颇具古韵的话术将华为在大模型领域的定位讲得很明确。华为云CEO表示,华为自研的盘古大模型3.0是一个完全面向行业提供服务,以行业需求为基础设计的大模型体系。
华为云CEO张平安在华为开发者大会进行演讲/图源:澎湃新闻
除了华为,vivo、OPPO等厂商也发布了其自研大模型的进展。
vivo在2023年11月发布了搭载自研蓝心大模型的X100系列手机,号称是“国内首个运用AI预训练大模型的手机产品”。2024年1月8日,OPPO发布首个端侧应用70亿参数大语言模型手机Find X7。几天后,荣耀发布了首款搭载自研70亿参数端侧平台级“魔法大模型”。至此,中国手机市场上排名前五的国产手机厂商,都发布了其端侧大模型的产品。
自研AI大模型为什么对手机厂商来说这么重要?核心的原因是,目前智能手机市场遇到了瓶颈,不管是国内还是国外的手机品牌,都发展到了难以直接刺激消费者产生换机欲望的程度。在这个背景下,人工智能浪潮恰如其时。语音识别、智能交互、更快响应等等的全新体验,也许是激发智能市场消费升级的契机,也能为品牌进一步建立差异化优势。
这是苹果所面临的激烈竞争局面,也是其着急的原因所在。
值得一提的是,目前,在手机端运行AI大模型有两种方法:一种是端侧计算,一种是云端和端侧同时运行;前者的难度在于如何提升内存容量,以及压缩和优化模型。相比起云端运行模型,苹果更希望开发端侧大模型,这样会提升用户的使用体验,并且保障数据的安全。如果苹果最终能成功研发并使之落地,那在体验感和隐私性上将会超越对手,扳回一城。
苹果与Gemini
自成一派的苹果,最后是会走出自己的道路,还是兜兜转转回到原地,科技界都等着答案。
本文首发于《南风窗》杂志第8期
-END-
编辑 | 向由
值班编辑|张来
排版 | 诺言
南风窗原创纪录短片
《疯狂宠物家》
看宠物如何捕获人类。
南风窗新媒体 出品
未经授权 禁止转载
欢迎分享至 朋友圈
投稿、投简历:newmedia@nfcmag.com
广告、商务合作:
seakykyyy
点击图片即可直接订阅