AI“芯事”:群雄逐鹿,未来何方?
关注我们,思考像钟摆,永不停歇
阅读关键词:AI核心硬件、CPU、GPU、FPGA、ASIC、类脑芯片、国产芯
在上篇“产业图谱系列”(人工智能技术从萌芽到“神坛”!)中,我们了解了人工智能的整体发展历程。从图灵机,到早期的神经网络和计算机,到麦卡锡和人工智能的“心-身”问题,再到进入产业化后的两落三起……八十多年来,人工智能没有像早期学者认为的那样发展顺利,但到今天,它的影响力已不容小觑。
今天,给大家带来的是AI产业图谱系列第三篇:核心硬件。
目前我们正在经历第三次AI产业革命,此次浪潮下,人工智能的主要工作原理是:算法+数据+计算。算法需要有东西来承载,数据的计算也需要通过相关介质进行处理,芯片就是用来承载算法的载体。而算法和芯片的结合,就是软硬结合。
下面这张表格,是目前AI芯片行业的主要厂商及代表产品。
机器人文明制图
传统派
传统芯片厂商布局AI,肯定少不了英特尔、英伟达和AMD。它们的主攻领域仍然是CPU和GPU。
CPU和GPU都基于冯·诺依曼结构,CPU可执行任意指令,需要有指令储存器、译码器、各种指令运算器、分支跳转处理逻辑。由于功能承载多,指令流控制逻辑复杂,不能有太多条独立指令流,于是 GPU使用单指令流多数据流(CPU也支持),让多个执行单元以同样步调处理不同数据,大大加强了计算能力,被广泛应用到数据中心执行计算密集型任务。
英特尔
具体来看,英特尔作为传统CPU龙头,目前占数据中心服务器芯片市场的绝大部分份额,是CPU领域的NO.1。而具有生态环境建设优势的英伟达,其GPU在AI芯片更具先发优势,加上AMD和其它芯片厂商今年来在AI上的全方位发力,英特尔在这一领域并不占优。
但为了避免掉队,英特尔还是做了不少努力。
首先,产品方面,推出新品系列和进行优化。其中,Xeon SP系列白金版本与GPU的最高性能间差距已缩小到近2倍,而不是早前的100倍。而在深度学习框架高度偏向GPU优化的情况下,英特尔采取了措施,让已经为GPU优化的框架进行了CPU优化。
其次,英特尔还通过收购的方式将NLP公司Indisys(2014年)、FPGA公司Altara(2015年)、数据挖掘公司Saffron Technology和神经网络芯片公司Nervana Systems(2016年)、智能驾驶视觉系统公司Mobileye(2017年),以及小型芯片厂商eASIC(今年年中)纳入囊中。
值得一提的是,收购Nervana后,它成为了英特尔人工智能的战略核心。按照规划,英特尔最新AI芯片“Nervana NNP L-1000将在2019”年正式推向市场,成为英特尔第一个商用神经网络处理器产品。
英伟达
在GPU界约占70%市场的英伟达目前被认为是AI芯片处理器“头号玩家”,早于英特尔和AMD,英伟达在2011年便开启了对AI的布局。包括FB、谷歌、亚马逊、阿里巴巴、微软在内的各大互联网和云服务提供商都在使用英伟达GPU,即使华为发布了自己的AI芯片,但其仍然使用英伟达的芯片。
战略上,英伟达比英特尔和AMD定位更加清晰,涵盖当下需求正旺的游戏、数据中心和正在
爆发需求的无人驾驶,以及机器人等领域。去年,英伟达推出两款针对AI的高性能GPU,5月发布的Tesla V 100和12月发布的Titan V,均适用于深度学习超算。
在自动驾驶领域,英伟达的“DRIVE”系列也是各个性能爆表。年初的“CES 2018”上,CEO黄仁勋再次展示了NVIDIA最新的自动驾驶技术“DRIVE XAVIER”,并在2018年Q1开始流片。
此外,作为Issac项目的嵌入式硬件平台,Jetson主要面对的应用场景是机器人。相较于此前TX1(Maxwell架构)、TX2(Pascal架构)型号,加了“Xavier”的Jetson含了六颗处理器,每秒可执行30万亿次操作。
和英特尔在资本领域的活跃不同,英伟达早前收购了移动芯片Icera,但在四年之后放弃了这项业务。也正是从2015年开始,英伟达将重心放在游戏、云服务器以及车载领域。
AMD
在CPU和GPU市场上,AMD都一直处在老二的位置。但在以54亿美元收购ATI 后,公司之后的十年一直在走下坡路,甚至一度被外界认为会重蹈Altera覆辙被同行收购。但在新任CEO苏姿丰上台后,AMD重回正轨。
2016年底,AMD推出了堪称“咸鱼翻身”的Zen架构,同频性能大跨步追平Intel。基于Zen架构,去年年初发布了 Ryzen7系列,这让AMD的CPU市场份额一度提高到31%。同时,大数据和人工智能趋势也给AMD带来更多生机。
其中,游戏和VR是AMD瞄准的主要方向。今年年中,基于台积电7nm工艺的Vega 20如约而至,新Vega的晶体管密度是之前2倍,性能是1.35倍,能效是2倍。
现代派
除了CPU和GPU之外,FPGA、ASIC和类脑芯片也是未来人工智能核心硬件的发展趋势。
FPGA是一种硬件可重构体系结构,无指令、无需共享内存,可以同时拥有流水线并行和数据并行,因此对流式计算任务,FPGA比GPU有明显的速度优势。ASIC则具有高性能、低功耗、量产成本低的优点。
赛灵思
赛灵思的FPGA在全球市场占有率超过一半,其基于FPGA、SoC的硬件优化和SDx软件定义来解决包括CPU、GPU等集成的性能和功耗优化问题,产品应用于包括5G、物联网、无人驾驶、工业智能等各个领域。
本月中旬,赛灵思在中国展示了7nm首款ACAP架构的芯片系列——Versal,包括6大款产品。其中,AI Core核心系列主要面向AI产业,包括5款产品,提供128-400个专为AI推断和高级信号处理工作负责而优化的AI引擎,应用场景包括云端、网络、自动驾驶等技术,将于2019年下半年正式推向市场。
性能上,据其官方数据,AI Core核心系列产品的AI推理性能将比英伟达Tesla V100 GPU提高8倍。
虽然使用场景没有CPU和GPU丰富,但如果未来 FPGA、SoC成为应用主流,凭借多年积累,赛灵思会成为受益者。
IBM
IBM在人工智能产业的起步较早,在第三次人工智能浪潮兴起的前十年,IBM的深蓝便战胜了国际象棋世界冠军卡斯帕罗夫。但这个优势没能延续下去,互联网科技巨头崛起之后,纷纷在布局AI,这让IBM成为这一领域第二梯队。
在人工智能的布局上,IBM围绕Watson和类脑芯片展开,其中,Watson系统是一种认知计算。2014年,IBM发布了类脑芯片TrueNorth,这款芯片只有邮票大小,集成100万个“神经元”,256个“突触”,4096个并行分布的神经内核,用了54亿个晶体管,功耗只有70mW。
与CPU、GPU、FPGA都不相同的是,类脑芯片不是采用冯·诺依曼架构,它的功能正如其名,
模仿了人类大脑神经元结构,计算效率和可扩展性都远胜计算机。在加载神经网络模型基础上,TrueNorth可作为实时感知流推理引擎使用,而且能够在快速、准确分类的同时保持超低功耗。
虽然不会取代传统芯片,但以TrueNorth为代表的类脑芯片未来将很肯能成为自动驾驶汽车和机器人的关键技术。
谷歌
ASIC专门为特定目的和需求设计,具有高性能、低功耗、量产成本低的优点。作为ASIC的一种,谷歌TPU是专门为TensorFlow 深度学习框架所设计的。
尽管比不上传统芯片玩家,但在自研AI芯片上,谷歌还是可以的。在2015年推出TPU1.0版本后,又相继推出了2.0和3.0版本。与其它家芯片对外出售不同,谷歌的TPU芯片设置在云端,并且“只租不卖“,服务按小时收费。
除了TPU,谷歌在核心硬件上的开发还体现在智能移动端。本月,公司推出了Google Pixel 3/XL智能手机,搭载了包括Pixel Visual Core、Titan M在内的三款独立芯片。其中,Titan M是Google专门为智能手机安全而设计打造的芯片。
在AI资本市场上,谷歌也是收购大户,与芯片相关的包括2016年对芯片初创公司Agnilux的收购,以及在去年以11亿美元收购HTC Pixel团队。
中国派
中国在人工智能产业上目前位列世界第二,排名前三的领域分别是应用技术视觉图像、语音识别和自然语言处理,以及应用产品智能机器人。处理器/芯片企业只有十多家,占整体数百家的体量份额极少。
但近来,尤其是在中美贸易战和中兴事件之后,芯片开始受到前所未有的关注。在AI领域,也蓄势待发。
寒武纪
“寒武纪”原本是中科院从2008年开始的一项研究。相较于FPGA大概6个月的研发周期,ASCI 的开发周期要一年,且灵活性较差,为了解决这一问题,“SoC(System-on-chip)+IP”的模式开始流行,中科院从2008年开始这一项目研究,被命名为“寒武纪”,负责人是陈
氏兄弟陈云霁和陈天石,他们也成为后来寒武纪科技的创始人。
寒武纪科技的正式成立在2016年,同年11月推出世界首款商用深度学习专用处理器 Cambricon-1A,面向手机、无人机等类手机的终端设备。一年之后,中国科学院再次发布全球新一代人工智能芯片“寒武纪”系列——分别是3款面向智能手机等终端的“寒武纪”处理器IP,两款面向服务器等云端的“寒武纪”高性能智能处理器,以及1款专门为开发者打造的人工智能软件平台。
资本方面,作为创业公司,截至目前寒武纪共完成了三轮融资,天使轮一千万、A轮一亿美金,以及今年年中由中国国有资本风险投资基金等领投,中金资本等跟投的数亿美元B轮。
地平线
寒武纪的起家是“国家队”,地平线则从一开始就是“市场派”。
成立于2015年7月的地平线科技,智能驾驶业务为ADAS和自动驾驶两条线并行。虽然成立时间不算长,但因创始人余凯曾在百度担任研究院副院长、深度学习实验室主任的身份,以及来自于世界顶级高校和著名科技产业园区的创业团队,而被寄予了担纲中国“智造”领队的重任。
今年上半年,地平线发布了新一代自动驾驶处理器征程2.0架构,以及基于该架构的高级别自动驾驶计算平台Matrix1.0。相较于去年底推出的面向ADAS的征程1.0芯片,征程2.0是在高斯架构基础上的升级迭代,是面向L3及以上伯努利架构的自动驾驶处理器。
资本上,地平线已经完成了数轮融资,包括2015年天使轮,2016年获得投资家Yuri Milner A轮融资和后续跟投。2017年10月,获得由英特尔投资领投的近亿美元A+轮。在日前举办的安博会上,余凯透露今年将有一轮5亿到10亿美金之间的融资,投资方是一家和英特尔规模相当的半导体厂商以及大规模的汽车厂商。
华为
月初举办的全联接大会上,华为发布了昇腾910和昇腾310两款面向AI的芯片。
其中,910被解读为对标英伟达的“Tesla V100”。作为史上规模最庞大的GPU,TeslaV100拥有超过210亿个晶体管,以及超越上一代的5120个CUDA单元,充分保证了超强算力。
310是昇腾迷你系列的第一款产品,功耗仅为8瓦,采用12nm工艺,算力却可达16TFLOPS。
为实现这一目的,华为从2004开始研发手机芯片,到2009年第一颗K3、2012年K3V2的失败,再到2014年海思麒麟手机芯片开始跻身业界主流,前后经历了十年。中兴事件之后,华为更是与BAT等互联网巨头一起被寄予“中国芯”厚望,尤其此次入局AI产业,更是让国人看到了敢英伟达,超英特尔的希望。
本文由“机器人文明”出品
转载请注明出处
也可以撩撩群主~拉你入群
长此以往,我们就是朋友了!
往 期 精 选
来自AI创业公司的高薪Offer?小心掉坑!| AI七日谈
激荡80年,这些大牛将AI拥向“神坛” | 产业图谱系列二
马斯克的嘴炮“罪孽深重”,自动驾驶未来“后会无期”?
霍金留给人工智能的“遗言” | AI七日谈思必驰俞凯:NLP通过图灵测试还早 不如先来“玩死纠正哥”
我是广告:欢迎给“机器人文明”投稿~
好文请投:tougao@gsi24.com
— 完 —