查看原文
其他

智能晚报|麦当劳要在2024年部署生成式AI;阿里旗下又一款大模型夸克通过备案,刚升为战略创新业务;AMD的AI芯片上市...

江睿杰、杨秋秋 新皮层NewNewThing 2024-03-08

「每周一三五更新」


撰文:江睿杰、杨秋秋

编辑:王杰夫

Key Points


Meta更新多个AI功能;


AMD的AI芯片MI300终于上市


Helen Toner就解雇Altman回应立场


微软明年发布新版Windows,AI功能大幅增强


阿里旗下又一款大模型夸克通过备案。

Meta更新多个AI功能

12月6日,就在Google发布多模态大模型Gemini不久,另一个OpenAI的追赶者Meta也宣布旗下一系列社交应用如Facebook、Instagram和WhatsApp的更新,主题就是让生成式AI更好地与这些产品结合起来。

文生图产品Imagine有了独立界面

9月27日推出的Meta AI智能助手测试版就已经拥有文生图能力,现在Mata决定把这个能力开放出来,它建立了一个网站imagine.meta.com,该功能目前对美国地区的用户免费开放。

在使用Meta账户登录后,Imagine允许用户通过用自然语言描述来创建AI图像。输入提示词后,它会生成4张1280×1280像素的图片,用户可以免费下载这些图片。不过每张图片左下角还会有一个小的「Imagined with AI」水印,这是为避免AI图片被滥用而采取的防护措施。Meta表示,在未来几周内新的AI图片还会被添加上透明水印,「以提高AI生成图像的透明度和可追溯性」。

Imagine产品是基于Meta现有的Emu图像生成模型构建的。为了训练该模型,Meta使用了11亿张公开的Facebook和Instagram图片数据,Meta也表示这种独一无二的训练数据使得Emu相比其他模型有着独特的优势。

随着公共领域可用于生成式AI训练的数据逐渐耗尽,Meta等社交公司拥有的大量用户生成内容(UGC)成了香饽饽,这也成为这些公司模型产品的卖点之一。例如马斯克的Grok就用了X平台的数据来训练,Google的Gemini训练中也使用了大量YouTube视频数据。

Meta AI推出新功能

在本次更新中,Meta AI也增加了两个AI驱动的新功能:

  • Reimagine:聊天中微调AI图像

    在这项功能中,群聊中的用户可以通过自然语言提示来重新创建AI图像。首先,用户需要群聊中调用Meta AI来生成图像,随后,群聊中的其他用户可以通过按住图像来增加新的语言描述。Meta AI就会根据用户的提示和修改从而生成全新的图像。

    两位好友在交流中对AI生成的图片做调整。


  • Reels:用视频回答问题

    Reels嵌入在Instgram内的短视频产品。在此次的更新中,用户可以通过询问Meta AI来调用Reels,从而查看查询事物的可视化例子。例如在制定旅行计划时,用户可以在群聊中要求Meta AI推荐最佳游览地点,并分享这些热门景点和景点的相关视频,Meta AI就会调取符合要求的Reels视频。


    Meta AI 现在可以推荐Reels视频。

28个AI聊天机器人有了记忆

Meta宣布,此前推出的一系列聊天机器人目前已在美国全面推出,用户可以WhatsApp、Messenger和Instagram和它们聊天。其中部分AI聊天机器人具有「长期记忆」的功能,能够在保留用户会话数据,并在下一次聊天时从上次中断的地方继续。此外,Meta也宣布,更多的角色将支持Bing搜索的功能,支持用户通过和聊天机器人的对话框搜索。


参考链接

https://about.fb.com/news/2023/12/meta-ai-updates/


AMD的AI芯片MI300终于上市

12月6日,AMD宣布开始销售其最新的Instinct MI300系列芯片。这是MI300芯片自6月发布之后的又一大动作,意味着AMD的AI芯片开始正式向市场交付。

MI300到底牛在哪儿?

这次发布的MI300系列芯片包括两款产品,即加速器(accelerator)MI300X加速处理单元(accelerated processing unit,APU)MI300A。两者的区别在于,MI300X的核心处理器是纯粹的GPU,MI300A则是GPU和CPU的结合体。

在计算能力方面,GPU通常适用于简单任务的大批量训练,AI训练普遍依赖GPU;而CPU适用于处理复杂任务,但较难承担大批量工作。将GPU和CPU结合,既利用了AMD自身在CPU上的传统优势,也提升了处理速度。

AMD CEO苏姿丰在发布会上介绍AI芯片。

目前MI300系列芯片最主要的竞争对手是2022年9月开始投产的英伟达H100系列芯片。MI300X和MI300A分别会内置192G和128G的GPU内存,均高于H100的80G。AMD CEO苏姿丰称,MI300X在训练700亿参数的大语言模型Llama 2时,表现比H100好1.4倍。

在MI300系列面世前,AI训练芯片领域几乎由英伟达一家垄断。英伟达11月发布了最新款的AI芯片H200,内存提升至141G,但GPU核心参数没有改变。在训练同样的Llama 2模型时表现仅比H100提升90%。

数据中心和AI模型训练都耗能巨大,因此AMD还在努力降低芯片的能耗,计划到2025年将能耗降低到2020年的1/30。MI300A芯片将CPU和GPU结合在一起的目的之一就是提高产品的能源利用效率,降低能耗。

谁会买MI300?买来干啥?

目前已确认购买MI300的巨头包括微软和Meta。微软11月就在其云服务Azure上发布了使用MI300X的虚拟机产品。Meta也计划在其数据中心里使用MI300系列处理器。除了企业,美国Lawrence Livermore国家实验室的超级计算机El Captain也会使用MI300A芯片,该计算机预计明年完全投入使用,届时其性能可能会跃居全球第一。

技术公司如此积极地尝试AMD的AI芯片,背后的原因不难理解。过去一年生成式AI热潮导致AI芯片的需求在短期内急剧增长,但市面上可供使用的AI芯片却只有英伟达一家的。供需关系严重失衡之下,拥有充足的AI芯片成了竞争的关键要素,英伟达可以说是挟A100、H100以令群雄。当时微软、Meta、OpenAI等公司纷纷宣布要自研AI芯片。如今这些技术公司总算等来了它们的Plan B。


参考链接

https://www.amd.com/en/newsroom/press-releases/2023-12-6-amd-delivers-leadership-portfolio-of-data-center-a.html


Helen Toner就解雇Altman回应立场

OpenAI前董事会成员、AI学者Helen Toner在12月7日接受《华尔街日报》采访时,阐述了她在OpenAI内部权力斗争中的立场。在采访中,Toner并没有透露前董事会投票解雇CEO Sam Altman的具体细节,但她称Altman被解雇的主要原因是失去了董事会对其的信任。

Altman被解雇的原因是缺乏信任

Toner表示,自2021年她加入董事会以来,经常由于意见不合与Altman发生冲突。今年10月,Toner曾与乔治城安全与新兴技术中心(CSET)合作发表了一篇论文,关于OpenAI发布ChatGPT引起「主要技术公司内部的紧迫感」,从而引发了道德和安全问题。而Altman认为这篇论文既是对董事会成员的批评,也是对OpenAI的损害。

随后,Altman联系并尝试说服其他董事会成员解雇Toner。在与一名董事会成员的一次讨论中,Altman留下了误导性的看法,称另一名董事会成员认为Toner应该离开。这使得前董事会对Altman的诚实和信任感到担忧。最终,这导致了Altman因未能「在沟通中保持坦诚」而被解雇。

Toner认为OpenAI需要坚守使命

Toner表示,董事会想要解雇Sam Altman的原因不是安全,相反,而是缺乏信任。她坚称,OpenAI作为一个非同寻常的组织,它的使命是确保AGI(Artificial General Intelligence,通用人工智能)造福全人类。因此,Toner在接受《华尔街日报》采访时表示,解雇Sam Altman的目标是强化OpenAI的创立原则。

在员工对奥特曼被解雇的抗议中,OpenAI的一名律师表示,董事会解雇Altman的决定可能会导致公司垮台,如果她不立即辞职,将违反信托义务。而Toner仍然坚持自己的观点,即OpenAI不是服务于投资人,而是要造福于全人类的。

Toner将继续AI政策、安全领域

在Sam Altman复职之后,OpenAI董事会现由Salesforce前高管Bret Taylor担任主席,美国前财政部长Lawrence Summers和技术企业家Adam D'Angelo组成。而Helen Toner已经辞去了OpenAI的董事会职务,并表示自己将继续专注于人工智能政策、安全和保障方面的工作。Toner表示,自己非常尊重OpenAI团队,并相信「我们的道路在未来几年将会多次交叉」。


参考链接

https://www.wsj.com/tech/ai/helen-toner-openai-board-2e4031ef


微软全新Windows版本细节披露,AI功能大幅增强

科技媒体Windows Central日前披露了微软内部Windows项目的新进展。微软计划并大幅强化新版本中的AI体验,并调整Windows版本的发布节奏。

新版本预计明年下半年装机,将大幅增加AI体验

微软目前在研的Windows版本包括Germanium和Hudson Valley两款。前者是基础版本,预计明年4月正式启用,而功能更丰富的后者要到8月以后才会装机。

Hudson Valley被认为很可能就是Windows 12。这一新版本将聚焦于在操作系统层面提供全新的AI体验。

新版本的操作界面将由AI提供底层支持,还将搭配比现阶段更强的Copilot助手功能。该助手将能够在后台工作,并无形中提高搜索、启动任务、切换工作流等场景的效率,还能理解操作的上下文。

用户将可以直接下达语音指令来控制电脑,而电脑能够智能地理解人类的复杂语言指令,并提供实时帮助。同时新的操作系统还可以智能生成壁纸、通过智能运算提高视频的清晰度甚至实时翻译正在播放的音视频节目或通话。

除此之外,微软还计划让新版本变得更节能,预计可望将电池使用寿命延长50%。

Windows团队换血,版本发布节奏或更改

曾在微软工作近20年的微软Windows和设备执行原副总裁兼首席产品官(CPO)Panos Panay已于9月离职并加入亚马逊。在他离职之后Windows团队原先的发布节奏正在调整。

原本Windows平台的主要版本计划以3年为一个周期来发布,同时每年辅以若干小更新。按照这个频率2024年将发布新一代Windows。但继Panay之后的新负责人计划减少甚至取消每隔几个月出一次的小更新,而专注于每年提供一个有明显特色的大升级。这更像是苹果对操作系统的更新节奏,iOS、MacOS都是每年推出一个大更新。

这一新节奏预计将于Hudson Valley版本发布之后正式落地。


参考链接

https://www.windowscentral.com/software-apps/windows-11/exclusive-microsoft-readies-groundbreaking-ai-focused-windows-release-as-new-leadership-takes-the-helm


Bonus

阿里巴巴自研夸克大模型通过备案

12月8日有消息称,阿里智能信息事业群自研的夸克大模型近日已通过备案。该模型于11月14日发布,拥有千亿级参数,是基于Transformer架构、自主研发的多模态大模型。阿里巴巴计划将夸克大模型优先落地在通识问答、专业搜索等信息服务领域,未来还将应用于搜索、智能工具和资产管理助手等场景。

有趣的是,夸克大模型并没有基于阿里巴巴的通义大模型研发,而是选择自研。此次夸克大模型通过备案,意味着阿里是目前国内唯一一家拥有两个通过备案的大模型的公司。夸克目前隶属于阿里巴巴智能信息事业群,除了夸克外该事业群的主要产品还有UC浏览器、书旗小说、智能营销平台等。

11月16日的财报发布会上,阿里巴巴CEO吴泳铭宣布了阿里巴巴第一批战略级创新业务,夸克是其中之一(另外3个战略级创新业务为1688、闲鱼和钉钉)。


麦当劳要在2024年开始部署生成式AI

麦当劳正在与Google合作,计划在2024年对数千家门店的软硬件做升级以部署生成式AI,最终目的是提升运营效率。该项目由位于芝加哥的麦当劳Speedee Labs与Google Cloud团队合作承担。Speedee Labs是麦当劳于2022年9月刚刚成立的新部门,专注于通过创新提升客户体验。

麦当劳首席信息官Brian Rice称,「将我们世界各地的餐厅与数字生态系统中的数百万个数据点连接起来,意味着工具变得更加好用,模型变得更加智能,餐厅变得更容易运营,最重要的是,我们的客户和工作人员的体验变得更好。」


Grok正式向X Premium Plus用户推出

Grok是由马斯克的人工智能初创公司xAI开发的AI聊天机器人,已经在X(前身为Twitter)上正式推出。Grok是以名为Grok-1的生成模型为基础训练的。不同于其他聊天机器人,该模型不仅可以根据网络数据和人类反馈进行训练,还可以将X上的实时帖子合并到它的回答中,在理论上使其能够用最新信息回答问题。

X表示,在下周之前,Grok的访问权限将向X Premium Plus用户陆续开放。Premium Plus是X推出的订阅服务,用户每个月花费16美元就可以无广告地访问该平台。其中长期订阅者将拥有优先访问Grok的权利。

-END-


我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。

和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。

在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。


以下是最近发生的其他智能资讯

大公司|Google发布Gemini,暗示GPT-4不是「原生」多模态

智能晚报|微软Copilot接入GPT-4最新功能;Mistral AI再融4.5亿欧元;马斯克的xAI寻求10亿美元融资...

智能晚报|王慧文参股袁进辉的AI初创公司;商汤考虑让自动驾驶、医疗保健部门独立融资;OpenAI推迟发布GPT商店...


与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye

 

喜欢就关注我们吧,记得设为星标」

继续滑动看下一个

智能晚报|麦当劳要在2024年部署生成式AI;阿里旗下又一款大模型夸克通过备案,刚升为战略创新业务;AMD的AI芯片上市...

江睿杰、杨秋秋 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存