查看原文
其他

英特尔高宇:AI 工作负载有多种形态和规模,硬件上没有一刀切的解决方案

AI前线 2024-01-21
作者 | 李冬梅

去年年底以来,随着 ChatGPT 应用体验界面的推出,使得以大模型为主的生成式 AI 技术取得了重大的并且快速地发展,大模型也展现出了令人惊叹的智能涌现能力,表现出了更为强大的创造性和通用场景的普通适用性,技术得以快速发展。

首先取得重大突破的是公共通用大模型,从人类社会大量存积下来的公共数据当中去学习,进而生成高质量的文本、图像、声音甚至是视频等内容,为各个领域的智能创新和每一个人的智能体验创新提供了巨大的想象空间。

然而,出于数据的安全和隐私保护的考虑,以及更高效率,更低成本来享用大模型通用能力的角度考虑,人们又既希望获得公共大模型目前的各类强大的通用服务,同时又希望 AI 能够真正理解自己,提供专属的个性化服务,还要能够充分地保障个人的数据和隐私安全,为此,公共大模型和面向个人的专有大模型混合部署,正逐渐成为产业的一个共识。

在这样的时代背景下,作为消费和商用个体用户中最坚挺的终端,PC 在 AIGC 时代承载了怎样的使命?

12 月 7 日,首届 AI PC 产业创新论坛在北京联想总部举行。此次论坛汇聚了众多用户、终端厂商、算力厂商(芯片)、AI 技术厂商(大模型)、应用领域生态合作伙伴,深度探讨 AI PC 为 AI 普惠带来的巨大改变。此外,在此次论坛上,业内首份《AI PC 产业(中国)白皮书》重磅发布。

与会嘉宾认为,AI PC 到来之际,大模型将成为每一个人必不可少的助手,同时对推理的算力需求将超过训练的算力需求。算力集中于云端的模式变得不可持续,AI 计算负载将逐渐由云端向边缘侧和端侧下沉。在搭建本地智能算力上,CPU+NPU+GPU 异构式架构方案是目前最为成熟的方案之一。

对此,英特尔中国区技术总经理高宇表示,AI 工作负载有多种形态和规模。所以,从硬件上没有一刀切的解决方案。“基于多年的学习与市场经验,我们提出了 XPU 的概念,包括 GPU/NPU/CPU。”他说,联想是英特尔的战略合作伙伴,双方已经基于即将发布的 Meteor Lake 处理器推进 AI 体验的开发和创新。

作为算力厂商的代表,英特尔正采取三项措施,来持续构筑端侧的算力。一是构建为 AI 而设计的高效能 AI-Ready 平台;二是提供工具以支持广泛的 x86 应用生态系统,三是激发创新,开启全新的 AI 体验,包括为软件和应用开发人员提供支持,以便在各个领域里都能更好将 AI 功能完美部署到 PC 客户端上。

英特尔今年还正式启动了首个“AI PC 加速计划”,将在 2025 年前为超过 1 亿台 PC 带来人工智能特性。其中,通过与超过 100 家 ISV 合作伙伴深度合作,并集合 300 余项 AI 加速功能,英特尔将在音频效果、内容创建、游戏、安全、直播、视频协作等方面继续强化 PC 的体验。

据了解,在实践中,英特尔 13 代酷睿处理器已经可以流畅运行 70 亿到 180 亿参数的大模型,并成功部署了 LLM。高宇表示,即将推出代号 Meteor Lake 的 AI PC 处理器,代表英特尔 40 年来最重大的架构转变,旨在为 AI PC 时代铺平道路。它是首个内置 AI 加速引擎 NPU 的处理器,可在 PC 上实现高能效的 AI 加速和本地推理。

为了完成用户相对复杂的任务,AI PC 往往需要调动不同的模型和应用,为 AI PC 的能力进行补充和延伸。因此,AI PC 功能的发挥不仅需要像英特尔这样的算力厂商的参与,还需要整个开放的行业生态作为支撑。

在 AI PC 的推动下,PC 产业生态将从应用为本转向以人为本,用户成为行业生态创新的驱动者和创造者。模型、应用、算力厂商都需要围绕 AI PC(终端)形态下新的以人为本的需求做出改变,在研发工作中对 AI 的高效运行予以充分的考量,以适应 AI PC 新时代。

联想作为终端厂商,是离用户最近的一端,因而被推到台前,成为生态组织者和生态的核心中枢。以场景需求为基础面向用户整合产业资源,承担 AI PC 技术整合创新交付者、新一代个人智能体及 AI 入口创造者和用户体验维护者、本地化个人数据及隐私安全守护者和开放的 AI 应用生态标准制定者和推广者身份,职责重大。正是出于行业责任,联想联合国际数据公司 IDC 发布业内首份《AI PC 产业(中国)白皮书》,对 AI PC 进行了全新定义,以加速构建 AI PC 产业新生态。

高宇最后表示,AI PC 加速计划由即将发布的 IntelCore Ultra 处理器率先驱动。未来,英特尔将搭建性能并行和吞吐量适用于融合 AI 的媒体 /3D/ 渲染的 GPU,打造适用于持续的 AI 和分担 AI 负载的专用低功耗 AI 引擎 NPU;迭代能够快速响应,适用于轻量级、单次推理的低延迟任务的 CPU,相信在新平台的加持下,英特尔将加快与联想共同打造混合 AI 算力架构,驱动 AI PC 落地。

 活动推荐

《行知数字中国数字化转型案例集锦【第二期】》重磅发布,覆盖多个行业,对话一线专家,挖掘企业数字化的实践故事,揭秘数字化时代背景下如何重塑企业组织、技术与人才。扫描下方二维码,关注「InfoQ 数字化经纬」公众号,回复「行知数字中国」即可解锁全部内容。


继续滑动看下一个

英特尔高宇:AI 工作负载有多种形态和规模,硬件上没有一刀切的解决方案

向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存