“围剿”英伟达
2018年的春天,似乎比以往来得更早一些,特别是对于AI芯片行业而言,在经历过去一年人工智能爆发之后,今年AI芯片市场必将大热。
3月28日凌晨,英伟达2018 GPU 技术大会在加利福尼亚州圣何塞举行,NVIDIA今日公布了深度学习计算平台所取得的一系列重要进展,相较于六个月前发布的上一代产品,其深度学习工作负载性能实现了10倍提升。
NVIDIA 创始人兼首席执行官黄仁勋在 GTC 2018 上公布了这一消息,他表示:“深度学习的超凡,进展仅仅是对未来的启示。其中的很多进展都是基于NVIDIA深度学习平台,该平台已快速成为全球标准。我们正在以大幅超越摩尔定律的步伐加快提升平台的性能,以实现突破,进而为医 疗保健、交通运输、科学探索和其他众多领域带来革命性改变。”
嵌入式AI可将桌面扬声器转换为个人助理,给机器人装上大脑,将智能手机变成智能相机、音乐播放器或游戏控制台,而传统芯片缺乏支持这些智能特性的计算能力。根据Gartner报告,2017年芯片市场的总收入达到4000亿美元,预计2018年将超过4590亿美元。
是什么“点燃”了AI芯片市场?
先来了解什么是人工智能芯片。
人工智能芯片,也称为人工智能加速器,是用于人工智能相关计算任务的处理器。因为机器学习技术对训练算法和运行应用程序的计算能力提出了很高的要求,这是传统计算硬件无法提供的,也是专用AI芯片需求迅速增长的原因。
人工智能行业的主要芯片类型如下:
CPU (中央处理单元)--是为一般计算目的而设计的芯片,强调计算和逻辑控制功能。它们在处理单个复杂计算顺序任务方面很强,但在大规模数据计算方面较差。
GPU (图形处理单元)--最初是为图像处理而设计的,但已经成功地应用于人工智能。GPU包含数千个内核,能够同时处理数千个线程。这种并行计算设计使得GPU在大规模数据计算中具有极强的功能。
FPGA (现场可编程门阵列)--是可编程逻辑芯片。这种类型的处理器在处理小规模但密集的数据访问方面功能强大。此外,FPGA芯片允许用户通过其微小的逻辑块对电路路径进行编程,以处理任何类型的数字功能。
ASIC (专用集成电路)--是为在特定应用中提供卓越性能而定制的高度定制芯片。然而,定制ASIC一旦投入生产就不能改变。
其他芯片类型,如神经形态处理单元( NPU ),其架构类似人脑,有可能成为未来的主流,但仍处于早期发展阶段。
近年来人工智能芯片的发展
上世纪60年代,Intel从专用芯片转向通用型芯片中央处理器(CPU),英伟达转成GPU,这两年又产生了TPU。由于终端市场巨大需求,促使专用芯片爆发。因为通用芯片效率比较低,制作成本比较高。
AI芯片用得最多的领域就是视频监控。2016 年,我国视频监控市场规模已经达到1000亿元。据HIS 研究报告,2013年-2018年,IPC SoC芯片的出货数量复合增长率高达55.9%。
现在国家已经把人工智能产业上升到国家战略方面,而政策的助推与保障措施使得产业结构充分优化,因而推动了人工智能产业的发展。
2017年7月,国务院发布了《新一代人工智能发展规划》,对人工智能产业的发展做出详细的规划和明确的政策支持。规划中表明,人工智能产业要达到发展规划中的产业规模,政府给予资源配置以及保障措施等政策帮助。
2017年以来,政府引导产业基金大量涌入,一级市场对人工智能的景气度高,芯片融资现象非常火热。
“新时代”的核心是科技创新,几十年来,国内IT企业在应用层做了很多创新,但在基础层的创新极少。因为芯片底层架构一直被国外巨头控制,行业标准已然成型,难以超越。而人工智能引领的新时代,可能会给中国IT企业一个弯道超车的机遇。
我们知道,深度学习是一个非常新的技术,底层计算结构比较简单,国内AI芯片公司跟国外的巨头处于同一起跑线,也成为AI红利的受益者。
AI芯片火热也离不开行业的炒作。芯片是一个长期、高投入领域,这也给很多创业讲“故事”的机会。因为芯片行业如果能做起来非常有潜力,想象空间大,会更容易拿到钱。
今年以来,AI逐渐成为手机标配,也将AI芯片推向高潮。苹果、小米、华为等厂商纷纷发布AI手机,而手机一年的出货量比安防市场摄像头历年存量还要大。Counterpoint Research研究机构高级分析师Lene park预测:“根据我们的估计,到2020年,至少会有三分之一的智能手机芯片会内置人工智能处理器。”
英伟达的软肋
人工智能芯片可分为三个主要应用层面:训练(training)层和云推理(inference)层和边缘设备推理层。英伟达在训练层基本垄断市场,而在推理层和边缘设备层竞争力不大。
人工智能芯片的三个应用层面(图片来自雷锋网)
训练是算法分析数据、从中学习并最终获得智能以响应现实事件的过程。该算法在训练过程中分析了数万亿个数据样本。芯片制造商不仅要提高处理器性能,而且还要提供一个完整的生态系统,包括硬件、框架和其他支持工具,以使开发人员能够缩短其人工智能技术开发流程。
NVIDIA是训练领域的领导者。当开发人员发现GPU的并行计算架构可以加速深度学习培训过程时,这给GPU巨头NVIDIA带来了巨大的优势。NVIDIA抓住这一机遇,将自己转变为一家人工智能计算公司,并开发了一种新的GPU体系结构Volta,强调深度学习加速。NVIDIA的GPU已经被广泛应用于机器学习算法的培训中,目前该公司在硬件培训市场上占据着垄断地位。
2018年2月9日,英伟达发布了其截至到1月28日的2018财年第四季度和全年的财报,由于英伟达的数据中心、游戏设备和挖矿对芯片需求的增长,英伟达全年净利润达到了30.47亿美元,同比增长83%。
然而,英伟达在训练层也面临巨大的潜在威胁——谷歌入局。
基于AlphaGo及其云服务上数百万用户的成功,Google在训练市场具有强大的潜力。该公司开发了自己的TPU (张量处理单元),以与NVIDIA竞争。TPU是一种专门为深度学习和谷歌的张量流框架设计的ASIC。谷歌表示,其TPU可以提供180万亿次浮点运算性能,比NVIDIA最新的数据中心GPU特斯拉V100要快六倍。
TPU相对性能(W)
目前,谷歌是英伟达的第一大GPU客户,据悉英伟达AI计算芯片三分之一是供给了谷歌,可想而知,一旦谷歌不用GPU而改用TPU,是多么可怕的局面!
最可怕的是,深度学习算法本身也在不断迭代,如果接下来几年出现其他的算法——比如强化学习获得突破,需要的计算量小,功能强,数据小,那么也就不需要那么大的计算力。而英伟达GPU要兼容以前架构,历史包袱重,很可能彻底被时代抛弃。
“围剿”英伟达
英伟达已垄断训练层,但在云端推理层和边缘设备层,英伟达正在被“围剿”……
云端推理——
在云端推理层,GPU不再是最优的选择,取而代之的是,阿里云、Amazon、微软Azure都纷纷探索的云服务器+FPGA芯片模式。
因为,针对人工智能应用领域(如图像识别或机器翻译)开发的机器学习模型通常具有很高的复杂度,并且所需要的推理计算量太大而不能部署在边缘设备上。
云上的推理对于许多人工智能应用的部署是必要的。当数千人同时使用应用程序时,云服务器还需要强大的功能来满足推理需求。在这种情况下,FPGA是云公司的首选。这种类型的处理器擅长于低延迟流传输和计算密集型任务。
此外,FPGA提供了一种灵活性,允许云公司修改芯片。所以传统芯片制造商、云服务提供商和初创企业都在开发FPGA解决方案。
英特尔是开发异构计算技术的主要公司之一。通过收购芯片制造商Altera,英特尔提升了其FPGA技术专业知识,并开发了一款CPU + FPGA混合芯片,用于云计算的深度学习推理。通过利用这两种处理器类型的优点,该混合芯片提供计算能力、高存储器带宽和低延迟。微软也采用这一技术来加速其Azure云服务。
腾讯就是云服务提供商开发支持云推理的FPGA解决方案的一个例子。腾讯为云服务云虚拟机开发了中国首款“FPGA云计算”服务。与基于CPU的云服务器相比,FPGA集成的CVM提供了更好的计算能力,支持HPC应用和深度学习开发。在云中访问FPGA还消除了购买硬件的需要,降低了开发人工智能应用程序的成本。此外,腾讯还支持商业用途的第三方人工智能应用开发。
DeePhi Tech(深鉴科技)是一家专注于云推理的初创公司。该公司获得了4000万美元的资金,用于开发其DPU (深度学习处理单元,基于FPGA的ASIC )平台。借助DNNDK (深度神经网络开发工具包),DeePhi technology旨在为深度学习技术的开发和部署提供一站式服务。
DeePhi联合创始人韩松博士是一位受人尊敬的人工智能研究人员,他提出了一种称为“深度压缩”的方法,以减少模型规模、工作量和功耗,从而提高深度学习效率。英特尔和NVIDIA等芯片巨头采用了这种方法。
边缘推理——
在边缘设备层,英伟达更不可能一家独大。
边缘推理是指像智能手机、无人机、机器人、VR和AR沉浸式体验设备、自动驾驶汽车等都需要特定的人工智能硬件支持。此外,近年来的技术突破已经减少了芯片体积,使得其能够嵌入到几乎任何设备上,让边缘推理更加可行。
英伟达创始人黄仁勋接受记者采访时说,“未来,AI与AI芯片将会无处不在:咖啡机、保温杯、麦克风、甚至耳环、鞋子这些小物件都会智能化。”
互联网连接可能并不总是稳定的,云无法适应AI创新的所有计算负载。因此,未来的边缘设备将要求其推理特征具有更大的独立性。
为了满足不同设备的需求,许多初创企业都在生产自己的ASIC。大型芯片制造商也在他们的处理器中添加支持人工智能的功能。
例如,华为( Huawei )正在通过集成AI芯片来提高SoC的性能。华为与芯片初创公司Cambrikon合作,采用了NPU (神经处理单元,一种来自Cambrikon的ASIC )来推进其旗舰智能手机Mate 10的SoC麒麟970。这种集成增强了手机相机的图像处理功能。
AI芯片初创企业
中国新创业公司WestWell Lab((西井科技)的DeepSouth神经处理器是模拟人脑神经元的ASIC。该公司创建了一个基于深南的大脑模拟器,可以用来加速医疗设备支持帕金森氏症、阿尔茨海默氏症和神经损伤的研究。
Horizon机器人是另一家专注于嵌入式人工智能的初创公司。公司开发了两种类型的ASIC来支持不同的人工智能应用。日出系列处理器适用于智能相机中的人脸识别和视频分析解决方案。travel系列处理器适用于自动驾驶汽车,提供八种类型的实时检测和识别处理能力。
总之,人工智能还远未成熟,随着人工智能创新生态系统的不断发展,芯片市场也会波动。随着算法开发新框架的出现,当前硬件训练市场的领导者可能面临新的竞争。对云市场的推断也在不断增长,随着更多人工智能应用的开发,云服务提供商之间的竞争将加剧。与此同时,边缘计算市场是大公司和初创企业的竞技场。未来几年,AI芯片公司势必群雄崛起,“围剿”英伟达的局面来日可期。
水立方之夜,猎豹将一批过时的AI产品“包装”的真好!
公众号后台回复“进群”
加入人工智能读者俱乐部