查看原文
其他

研究资讯 | 产业视角—人工智能芯片的发展现状与趋势研判

SAIA 上海市人工智能行业协会 2023-05-14

人工智能芯片作为人工智能产业链中重要一环,主要提供底层算力支撑技术,因此又被称为人工智能加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责),与其它芯片相比,AI芯片是特意针对人工智能算法做了特殊加速设计的芯片。从广义范畴上讲,只要是面向AI计算应用的芯片都可以称为AI芯片。

一、人工智能芯片的分类与应用


人工智能芯片(AI 芯片)可以分为传统芯片和智能芯片两类,传统人工智能芯片包括 CPU、GPU、DSP、FPGA四类,智能芯片包括通用型智能芯片、专用型智能芯片(即 ASIC)两类。


1、CPU:CPU技术成熟,是通用性最强、可执行各种类型的计算机应用程序,非常适合传统的控制密集型计算任务。它的优势在于对人工智能应用开发生态成熟,但性能已无法满足人工智能快速增长的计算能力需求,目前广泛应用于个人电脑、移动终端、传统服务器等领域,在人工智能芯片市场渗透率相对较低。


2、GPU:GPU已经发展到相对成熟阶段。GPU 即图形处理器,是个人电脑、游戏设备、平板电脑、智能手机中进行图像和图形运算的芯片。由于深度学习算法需要很高的内在并行度、浮点计算能力以及矩阵运算能力,基于 CPU 传统计算架构逐渐无法充分满足高性能并行计算需求,2015年后,GPU 的应用使得硬件计算能力的不足得以被弥补。GPU 擅长数据级并行处理,峰值运算性能高,但能耗也较高。在人工智能领域,GPU多应用于数据中心服务器,在终端应用较少。


3、DSP:DSP目前技术发展较为成熟,最初为数字信号处理任务设计,早期多用于传统的通信和音视频信号处理。在人工智能领域主要用于处理图像、语音等任务,编程开发门槛高。该芯片通常在云端应用较少,但在手机等终端设备中有一定生态基础,应用较多。


4、FPGA:FPGA 具有可编程性。FPGA 是一种在硬件层面可编程的芯片,利用门电路直接运算,用户可以自由定义门电路和存储器之间的布线,改变执行方案。换而言之,FPGA 上的电路可以更改,具有很高灵活性。相较于 ASIC,FPGA 在性能、功耗上有提升空间。不过,由于 FPGA 灵活性好、处理简单指令的重复计算比较强,CPU+FPGA 的混合异构相比 GPU具备更低功效和高性能,在深度学习的推理阶段有着更高的效率和更低的成本。


5、通用型智能芯片:通用型智能芯片相关技术仍在持续发展中,拥有全新的完备高效的指令集,可覆盖各类智能算法所需的基本运算操作,性能、功耗比较传统芯片优势明显,可适应各种场景和规模的人工智能计算需求,在云端、边缘端和消费类电子终端都开始出现广泛应用,渗透率将逐渐提升。


6、ASIC:ASIC 是专用定制芯片的统称,在设计、架构、工具链等方面的个性化强。ASIC 即专用集成电路,是应特定应用场景的需求专门设计和制造的集成电路,不能重复编程。ASIC 基于人工智能算法进行定制,在大规模量产的情况下具备性能更强、体积更小、功耗更低、成本更低、可靠性更高等优点,常用于在低功耗、成本敏感的终端上支撑特定的智能应用。其缺点在于通用性差,前期研发成本高,研发周期长。


二、人工智能芯片产业链分析


产业概述:人工智能芯片作为人工智能产业底层算力基础,在整个产业链中发挥着至关重要的作用。整体产业链可分为上中下游三部分,上游以AI芯片的研发设计企业为主,中游以AI芯片的生产制造和封装测试环节为主,下游为芯片具体应用场景,包括云端和边缘端,按照应用领域不同而分类。


1、上游研发设计:目前在芯片的研发设计环节,虽然国际上涌现出了英伟达、博通、英特尔、东芝、三星、苹果等巨头企业,但近几年尤其是2020年芯片危机出现以来,我国政策的不断加持与鼓励,使得芯片设计行业日益受到重视,目前已经成为社会公认的芯片产业链环节上最具潜力的环节之一,诞生了众多优秀企业,如华为海思、大唐电信、北京君正、汇顶科技等,国产设计能力不断提升、创新和突破,目前我国在芯片设计能力与国外差距不断减小,甚至某些领域呈超越态势。


2、中游生产制造:在生产制造环节,由于基础理论、关键设备等仍落后于国际一流水平,因此芯片制造环节与国外仍有较大差距,并且短期内难以追赶和超越。


3、下游具体应用:数字化转型升级趋势直接加速了AI芯片在各行各业的应用,并且随着我国大型算力中心的不断增多,间接拉动了AI芯片在云端服务器上的应用。目前AI芯片比较常用的领域除了云端,还有边缘端的智能驾驶、智能安防、智能医疗、智能制造、智能教育、智能金融、智能家居等领域,整体市场容量仍在不断增大。


三、人工智能芯片发展现状


1、市场现状

全球市场:根据QYR(恒州博智)的统计及预测,2021年全球人工智能(AI)芯片市场销售额达到了56亿美元,预计2028年将达到502亿美元,年复合增长率(CAGR)为36.6%(2022-2028)。


国内市场:从国内人工智能芯片发展来看,虽然与国际芯片技术水平相仍存在较大差距,但随着AI应用的快速落地,未来我国AI芯片需求增长可能更为迅速。据了解,当前我国人工智能芯片行业的下游应用场景主要聚集在云端、自动驾驶、智能手机、无人机、智能、安防等领域,但随着元宇宙、量子计算等技术的突破,未来芯片应用场景将扩展到社会各行各业,前景十分可观。据相关数据统计,2020年我国人工智能芯片市场规模为183.8亿元,预计2023年市场规模将达到1338.8亿元。


2、产业分布

人工智能芯片产业作为科技密集型、人才密集型和资金密集型产业,在国内城市分布上比较亲睐于一线发达地区,主要分布于北京、上海、杭州、深圳等城市,企业分布的集聚优势和地域特性比较明显。


3、典型企业

(1)AI芯片企业发展概述

一是从企业类型看,AI芯片领域的企业主要分为两类:第一类是集成电路设计龙头企业,包括Nvidia、Intel、AMD、Qualcomm、Xilinx、联发科、华为海思等,以IP授权为主要商业模式的ARM、Cadence和Synopsys等公司也在其列。第二类是以寒武纪、地平线机器人、Graphcore等为代表的专注于人工智能芯片研发的公司。第一类集成电路设计龙头企业有着多年的技术沉淀和研发积累,在综合技术实力、销售规模、资金实力、人才团队等方面拥有优势。第二类专业人工智能芯片设计公司成立时间相对较晚,在营收规模、综合技术积累等方面难以与集成电路设计龙头企业相比,但在AI算法和针对AI应用场景的专用芯片研发方面有着一定的技术优势。二是从企业数量来看,我国AI芯片企业的发展以2010年为界,2010年以前企业量仅为十多家,2010年之后逐渐爆发式增长至74家,后面逐渐增加到100多家,未来仍有上升趋势。三是从企业分布来看:人工智能芯片企业目前主要分布于北京、上海、杭州、深圳四个城市,但随着用人成本的不断提升,未来成都、合肥、武汉凭借高校人才聚集优势,成为后起之秀。四是从企业发展细分赛道来看,目前企业仍以智能安防、语音和图像、物联网类芯片赛道居多,其次为汽车和存储类为辅。


(2)AI芯片龙头企业例举

人工智能芯片技术领域的国内代表性企业包括中科寒武纪、中星微、地平线机器人、深鉴科技、 灵汐科技、 启英泰伦、百度、华为等;国外代表性企业包括英伟达、 AMD、 Google、高通、Nervana Systems、 Movidius、 IBM、 ARM、 CEVA、 MIT/Eyeriss、苹果、三星等。

(3)典型芯片企业产品案例


  • 中科寒武纪:寒武纪科技成立于 2016 年,总部在北京,创始人是中科院计算所的陈天石、陈云霁兄弟,公司是全球第一个成功流片并拥有成熟产品的 AI 芯片公司,拥有终端 AI 处理器 IP和云端高性能 AI 芯片两条产品线。2016 年发布的寒武纪 1A 处理器(Cambricon-1A) 是世界首款商用深度学习专用处理器,面向智能手机、安防监控、无人机、可穿戴设备以及智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越传统处理器。今后,公司将继致力于打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。

  • 地平线机器人(Horizon Robotics):地平线机器人成立于 2015 年,总部在北京,创始人是前百度深度学习研究院负责人余凯。BPU(BrainProcessing Unit) 是地平线机器人自主设计研发的高效人工智能处理器架构IP,支持 ARM/GPU/FPGA/ASIC 实现,专注于自动驾驶、人脸图像辨识等专用领域。

  • 百度:百度 2017 年 8 月 Hot Chips 大会上发布了 XPU,这是一款 256 核、基于 FPGA 的云计算加速芯片。合作伙伴是赛思灵(Xilinx)。XPU 采用新一代 AI 处理架构,拥有 GPU 的通用性和 FPGA 的高效率和低能耗,对百度的深度学习平台 PaddlePaddle 做了高度的优化和加速。据介绍, XPU 关注计算密集型、基于规则的多样化计算任务,希望提高效率和性能,并带来类似 CPU 的灵活性。

  • 华为:麒麟 970 搭载的神经网络处理器 NPU 采用了寒武纪 IP,如图 12 所示。麒麟 970 采用了 TSMC 10nm 工艺制程,拥有 55 亿个晶体管,功耗相比上一代芯片降低 20%。CPU 架构方面为 4 核 A73+4 核 A53 组成 8 核心,能耗同比上一代芯片得到 20%的提升;GPU 方面采用了 12 核 Mali G72 MP12GPU,在图形处理以及能效两项关键指标方面分别提升 20%和50%;NPU 采用 HiAI移动计算架构,在 FP16 下提供的运算性能可以达到 1.92 TFLOPs,相比四个 Cortex-A73 核心,处理同样的 AI 任务,有大约具备 50 倍能效和 25 倍性能优势。

  • 英伟达(Nvidia):英伟达创立于 1993 年,总部位于美国加利福尼亚州圣克拉拉市。早在 1999 年, 英伟达发明了 GPU,重新定义了现代计算机图形技术,彻底改变了并行计算。深度学习对计算速度有非常苛刻的要求, 而英伟达的 GPU 芯片可以让大量处理器并行运算,速度比 CPU 快十倍甚至几十倍,因而成为绝大部分人工智能研究者和开发者的首选。自从 Google Brain 采用 1.6 万个 GPU 核训练 DNN 模型, 并在语音和图像识别等领域获得巨大成功以来, 英伟达已成为 AI 芯片市场中无可争议的领导者。

  • 高通:在智能手机芯片市场占据绝对优势的高通公司,也在人工智能芯片方面积极布局。据高通提供的资料显示,其在人工智能方面已投资了 Clarifai 公司和中国“专注于物联网人工智能服务” 的云知声。而早在 2015 年 CES 上,高通就已推出了一款搭载骁龙 SoC 的飞行机器人——Snapdragon Cargo。高通认为在工业、农业的监测以及航拍对拍照、摄像以及视频新需求上,公司恰好可以发挥其在计算机视觉领域的能力。此外,高通的骁龙 820 芯片也被应用于 VR头盔中。事实上,高通已经在研发可以在本地完成深度学习的移动端设备芯片。

  • IBM:IBM 很早以前就发布过 watson,投入了很多的实际应用。除此之外,还启动了类脑芯片的研发, 即 TrueNorth。TrueNorth 是 IBM 参与 DARPA 的研究项目 SyNapse 的最新成果。SyNapse 全称是Systems of Neuromorphic Adaptive Plastic Scalable Electronics(自适应可塑可伸缩电子神经系统,而 SyNapse 正好是突触的意思),其终极目标是开发出打破冯·诺依曼体系结构的计算机体系结构。

四、人工智能芯片发展趋势


在信息业十分发达的今天,芯片作为信息发展的基础与核心部件,其不可替代作用日益凸显。然而我国目前高技术含量的芯片仍十分依赖于进口,非常不利于国家安全与行业发展。因此,近年来国家高度关注人工智能芯片产业的发展, 在2021年发布的《“十四五”规划纲要和2035年远景目标纲要》中明确指出,“十四五”期间,我国新一代人工智能产业将聚焦高端芯片等关键领域。国家政策和战略地位的加持,使大众越来越关注于人工智能芯片的发展趋势,主要包括了产业发展趋势与技术应用趋势。

(一)产业发展趋势:


1、人工智能芯片产品呈多元化发展趋势。近年来,人工智能应用落地场景越来越丰富,人工智能芯片的种类也呈现不断增加趋势。在发展最初时期,AI芯片都是GPU形式出现,但随着人工智能技术的逐渐成熟,AI芯片更多的向边缘、终端蔓延,除GPU之外的FPGA、ASIC、NPU等的市场占比也越来越多。


2、人工智能芯片应用场景不断增加趋势。未来随着5G、AIoT、智能汽车以及新兴的元宇宙等场景发展,人工智能芯片应用场景将迅速增加、丰富多样。


3、芯片厂商从单一生产功能将向一站式解决方案转变。芯片厂商除了提供适用性强、复用性强的人工智能芯片模块之外,还提供包括工具、软件、设计服务等在内的一站式解决方案,并将逐渐成为主流。


(二)技术应用趋势:


1、从技术应用范畴趋势看,AI芯片将向高性能的通用智能芯片发展,通用型芯片的应用场景和综合性能将不断提高。


2、从技术架构应用特征看,以GPU、FPGA、ASIC为代表的AI芯片传统架构,是目前可大规模商用的技术路线,其中ASIC芯片是全定制芯片,长远看更适用于人工智能,因为算法复杂度越强,越需要一套专用的芯片架构与其进行对应,ASIC基于人工智能算法进行定制,其发展前景看好。


3、从AI芯片性能提升角度看,有五大提升方向:一是更高效的大卷积解构/复用,即在标准 SIMD 的基础上, CNN 由于其特殊的复用机制,可以进一步减少总线上的数据通信。而复用这一概念,在超大型神经网络中就显得格外重要。如何合理地分解、 映射这些超大卷积到有效的硬件上成为了一个值得研究的方向。二是更低的 Inference 计算/存储位宽,即AI 芯片最大的演进方向之一可能就是神经网络参数/计算位宽的迅速减少——从 32 位浮点到 16 位浮点/定点、 8 位定点,甚至是 4 位定点。在理论计算领域, 2 位甚至 1 位参数位宽,都已经逐渐进入实践领域。三是更多样的存储器定制设计,即当计算部件不再成为神经网络加速器的设计瓶颈时,如何减少存储器的访问延时将会成为下一个研究方向。通常,离计算越近的存储器速度越快,每字节的成本也越高,同时容量也越受限,因此新型的存储结构也将应运而生。四是更稀疏的大规模向量实现,即神经网络虽然大,但是,实际上有很多以零为输入的情况, 此时稀疏计算可以高效的减少无用能效。来自哈佛大学的团队就该问题提出了优化的五级流水线结,在最后一级输出了触发信号。在 Activation层后对下一次计算的必要性进行预先判断,如果发现这是一个稀疏节点,则触发 SKIP 信号,避免乘法运算的功耗,以达到减少无用功耗的目的。五是计算和存储一体化,即通过使用新型非易失性存储(如 ReRAM)器件,在存储阵列里面加上神经网络计算功能,从而省去数据搬移操作,即实现了计算存储一体化的神经网络处理,在功耗性能方面可以获得显著提升。


4、从AI芯片技术发展趋势看,类脑芯片是人工智能最终的发展模式,但是由于技术的局限性,使得目前类脑芯片主要还处于实验室阶段,离产业化发展还有较大一段距离。


人工智能产业正处于百花齐放、日新月异的发展阶段,而智能芯片作为产业链基础层,是产业链其它两环节,即技术层和应用层借以发展的基石平台,然而在我国人工智能产业市场占有量中却只有20%,仍存在较大上升空间。另外,对于智能芯片的发展趋势也并不只是局限于以上列举的几类,仍存在较多的变量因素,未来随着元宇宙、智能驾驶、智能家居等应用场景的扩大,智能芯片应用市场将继续保持增长,各种可能性和前所未有的趋势均有可能会出现。但归根究底,芯片的发展速度和发展质量仍离不开它对现有技术的突破能力和突破时长,这其中还包含了其赖以发展的5G、大数据、物联网等其它信息技术的创新步伐,只有通过共同发展、共同进步才能构建一个相互依赖、相互促进、和谐发展的信息技术生态体系。



往期推荐



研究资讯 | 【园区视角】上海张江人工智能岛 — 国内首个人工智能产城融合创新应用区

研究资讯 | 云计算产业的发展现状与趋势研判

研究资讯 | 政策观点《国家标准化发展纲要》开启新时代的标准化路程

研究资讯 | 机器学习产业发展现状及技术趋势

研究资讯 | 智能传感器的发展现状与趋势研判

研究资讯 | 数字技术成为能源变革的关键支撑

【研究资讯】元宇宙产业发展现状及趋势

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存