华为麒麟970是不是真正的AI芯片？

查看原文

其他

华为麒麟970是不是真正的AI芯片？

原创 2017-09-04 Lina 漠影 智东西

这款AI芯片打造了多少个月？仅是加了一个NPU模块就能叫“AI芯片”吗？为什么华为要这么紧赶慢赶抢“第一”？……以上种种问题，智东西带你一一揭晓。

【智东西人工智能、汽车科技编辑/记者、实习生开放招聘，和我们一起看未来！简历至hr@zhidx.com，职位详情在智东西公众号回复“招聘”或查看原文链接】

智东西文 | Lina 漠影

华为这周末搞了件不大不小的事——发布了“世界首款手机AI芯片”麒麟970——各位科技媒体小编都辛苦了，大周六晚上的不是飞去德国跑会就是在电脑前蹲直播，连约会都要改期，好气哦。

咳，言归正传。

（华为官方推特介绍，“世界上第一款搭载NPU的AI芯片”）

华为为了抢这个“世界第一”着实花了不少心思，作为一个以“自研”为骄傲的企业，本次麒麟970上不仅使用的是别家的（寒武纪的）神经网络处理单元（NPU），智东西还独家获悉到，麒麟970在物体识别方面的一整套嵌入式AI解决方案（从算法＋Camera Tuning）都来自中科创达。

此外，据业内人士透露，寒武纪的AI架构在麒麟970上实现的梳理也并非全部是华为海思自研的技术。

这款芯片打造了多少个月？仅是加了一个NPU模块就能叫“AI芯片”吗？为什么华为要这么紧赶慢赶抢“第一”？联发科、深鉴科技等业内人士又是怎么看待麒麟970？……以上种种疑问，智东西将为你一一揭晓。

一、参数轰炸

麒麟970的参数想必大家已经被刷屏了一遍又一遍，但为了文章完整性这里还是不能免俗地需要列一列数据，看过的读者可以直接跳过这段：

众所周知，目前九成的手机芯片采用的是ARM的架构，麒麟970也不例外。麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构，采用了台积电10nm制造工艺，搭载12核高效GPU、8核高性能CPU，4.5G高速LTE Modem，支持LTE CAT.18，最高下载速度可以达到1.2Gbps，与高通目前发布的最强的X20 LTE基带实力相当。

特别值得一提的是，麒麟970的GPU用上了ARM最新推出的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。这个架构很厉害，比上一代的Mali-G71性能提高了40%，能效提高了25%。

但如果抛去数据，一个小细节能让你更直观地理解它：在智东西跟某移动端大咖聊天的过程中，他对NPU、10nm统统只是点头微笑，唯有在看到MP12 GPU小小地惊讶了一下。

与此同时，麒麟970拥有两个用于处理图像信息的ISP，能够更快速地响应处理图片，并且能在低光照度环境下对降噪进行优化。

由中科创达提供的智能拍照技术则将自动识别镜头内的物体（比如一朵静止小花又或是一个奔跑的人类），系统根据该物体的属性调整相机参数或是进行主动去糊。

麒麟970会搭载在将于10月16日于慕尼黑发布的华为Mate 10手机上。

二、寒武纪？何方神圣？

既然一直在说“寒武纪”的NPU，那么这个寒武纪究竟是何方神圣呢？

寒武纪科技（Cambricon）是中科院计算所孵化出来的AI芯片创业公司，中科院计算所不仅对寒武纪进行了天使轮融资，同时还给与了长期的支持与投入。8月底，寒武纪宣布完成了1亿美元的A轮融资，投资方为国投创业、阿里巴巴、联想等，一跃成为国内AI芯片届当之无愧的独角兽。

不仅如此，寒武纪的两位创始人也非常神奇——一对出身中科院的兄弟。哥哥陈云霁目前仍在中科院计算所担任研究员，从事基础科技研发，弟弟陈天石则当起了公司的CEO。

（弟弟陈天石与哥哥陈云霁）

不过，很长一段时间，寒武纪这家公司一直以“研究性”企业被业内所知，说白了就是没有产品出来。直到去年4月份的世界互联网大会期间，宣告自己的第一款AI芯片产品寒武纪1A流片了，这一点不断拿来背书，新闻联播、人民日报都说了这事；不过之后其产品到底有没有商用，有没有量产，并没有官方说法，按照2016年底寒武纪CEO 陈天石的说法，“芯片从研发、量产到商用，是一个以年为单位的周期，所以在明年，大家将可以在市面上看到使用寒武纪技术的芯片产品，比如在手机、安防监控等智能终端和云端服务器上。”

（寒武纪板卡）

不过根据中国科学院计算技术研究所发布的贺信显示，麒麟970芯片上的NPU正是集成寒武纪1A处理器作为其核心人工智能处理单元，实现了手机上本地、实时、高效的智能处理。这也是寒武纪1A真正意义上的一次产品化应用。

不过话说回来，恐怕也只有华为这个量级的土壕，才有能力让寒武纪1A真正产品化，从这一点看寒武纪是抱上了一个不错的大腿。

三、到底什么是“AI芯片”？

上文提到，麒麟970之所以敢叫自己“AI芯片”，最主要的就是集成了寒武纪的NPU（Neural-Network Processing Unit，神经网络处理器。

现在所谓的手机处理器，比如高通的835、苹果的A11、麒麟970等，实际上所指的是一个“处理器包”封装在一起，这个计算包专业一点说叫Soc（System-on-a-Chip），高大上的说法是“计算平台”；根据分工不同，很多专用功能的处理单元加进来，比如我们最熟悉的是GPU，现在这个包里的独立单元数量已经越来越大，比如ISP（图像处理）、Modem（通信模块）、DSP（数字信号处理）等，不同的数据进来，交给不同特长的计算模块来处理，这个NPU就是手机处理器平台新加入的一个擅长神经网络计算的单元，那么到底哪些应用会用到神经网络计算？也就是现在最能代表人工智能计算的一些应用，比如模式识别里的语音、图像（人脸）识别，比如其他会用到深度学习的一些AI应用。

为了让这个深度神经元网络连接更快，“寒武纪1A”还设计了专门的存储结构，以及完全不同于通用处理器的指令集。“它每秒可以处理160亿个神经元和超过2万亿个突触，功能非常强大，功耗却只有原来的1/10。

有时候，有些计算单元会独立出来，不封装在SoC里，比如观察苹果iPhone的主板结构，其Modem模块就一直独立在其A系列处理器模块之外；寒武纪的这个NPU单元之前也是一个独立的处理器单元，只是这次整合封装到了麒麟970的Soc里面。

（华为海思麒麟970架构）

（高通835架构和华为海思960架构）

虽然芯片里的CPU、GPU、DSP都可以用来做运算，但是NPU是专门用于神经网络架构计算的，号称比CPU快25倍的同时效率将提高了50倍。有点类似于你想要剪东西，我给你一把剪刀。

至于为什么用的是寒武纪的NPU呢？主要原因是目前国内能做AI芯片级别的公司只有那几家，而寒武纪是中科院出身，和华为的合作自然也是顺理成章。中科院计算自己也表示，计算所自2011年以来就和华为展开合作，组建了“中科院计算所-华为联合实验室”。

不过，也没有说现在其他芯片的CPU＋GPU＋DSP架构在人工智能应用方面效果差到哪里去了，恰恰相反，现在的众多手机厂商都在这个架构上对AI功能进行优化。从高通骁龙到联发科Helio，无不在人工智能的芯片应用上进行了大力优化。比如高通在骁龙800和600系列芯片上做了一个软件的神经处理引擎，高通也承诺未来也会出专门用来做神经网络运算的核——比如NPU。

所以说，这个NPU，重要，但也没那么重要。以深度学习为例，深度学习分为训练（Training）和推理/应用（Inference）两部分，训练阶段的确需要非常高的计算能力，但在应用层面其实并不需要巨大的计算量——相信没有哪个纯真的用户拿手机去做Training的。

另一方面，AI不AI，最终还是得看应用嘛……需要整个移动AI应用的生态起来了，才能体现出硬件的优势。

同为手机芯片制造商，联发科的一位产品技术负责人也认为，在芯片上集成硬件相对容易，关键还是上层的应用，用户不会在意这个是不是AI，只会在意体验。

虽然华为展示出了三个常见应用方向（AR、计算机视觉、自然语言处理），还动用了开发者网页、开发者工具包、应用商店来招揽开发者，华为消费者业务CEO余承东也在发布会现场承诺，华为将打造一个开放的AI环境，开发者可以直接接入华为NPU功能，也可以通过第三方AI框架接入（目前支持TensorFlow和Caffe）。

不过，就目前来看，移动AI应用开发还很少，华为现场展示的AI功能也集中在降噪、拍照美化等方面，快则快矣，没有什么鸡蛋。在应用缺失的情况下，麒麟970、骁龙835、甚至性能再弱些的芯片使用起来也会让用户感觉相差不大。

四、为了这个“世界第一”煞费苦心

不知道大家还记不记得，去年12月16日，华为旗下手机品牌荣耀推出了2016年最后一款旗舰手机——荣耀Magic。

荣耀总裁赵明在讲述这款荣耀3周年的特殊新产品的过程中，全程未提硬件配置，只谈了这款手机的八曲面外形设计和搭载由华为2012实验室研发4年的人工智能引擎Magic Live。

除了2012实验室外，华为旗下还有诺亚方舟实验室、高斯实验室、香农实验室，华为没有透露本次麒麟970使用的人工智能技术是否来自这些实验室，但从目前看来主要是这几个部门在研发。

不过，仅从深度学习来说，华为的技术并不算领先。这也是为什么虽然华为海思方面非常想要自研“AI芯片”，但为了来得及抢上这个“世界第一”的名头，最终选择了和寒武纪、中科创达合作。

一位业内人士对此的评价是——“从急促的拍板签下IP核合同，到和Mate 10分开，赶在苹果之前发布这款芯片，时间上感觉有点赶鸭子上架。”

那么华为这个“世界第一”真的要抢得这么急吗？

真的要。

据传言，这次麒麟970的项目做了大概4-5个月，其中包括了寒武纪、中科创达方面的技术整合、以及流片。从速度来说真的很快，一方面是华为干脆果断的行事作风体现，另一方面也侧面证明了这个“世界第一”真的很急。

据了解，台积电下半年的生产线上已经有超过30款“AI芯片”的代工排期了。虽说并不全都是手机芯片，但可以看得出这的确是一股潮流趋势。这一趋势在智东西和业内人士交流过程中也感受颇深。

五、业内声音：AI芯片是趋势

同为手机芯片商，联发科的一位产品技术负责人告诉智东西，“AI芯片”确实是目前的行业趋势之一，随着手机差异化越来越少，久而久之NPU将会变成“大家都得有”的东西。

在智东西此前跟荣耀掌门人赵明的对话中也可以感受到，互联网手机的竞争正从之前的网络营销、网络销售变成更技术化的比拼，在后互联网手机的时代，人工智能正成为核心竞争点之一。

从深度学习芯片层面，与寒武纪类似，国内还有另一家专注于“AI芯片”的明星创企——深鉴科技——虽然说他们做“AI芯片”严格意义上是不对的，他们做的是用于深度学习推理应用（Inference）的FPGA板卡（具体参见智东西此前的深度专访《成立一年估值超10亿与谷歌飙技术这位90后CEO如何做到？》）

深鉴科技创始人兼CEO姚颂则认为，不光是手机芯片，整个半导体行业都将受到AI的冲击。随着深度学习的兴起，不同公司所在意的性能重点不同，一个语音公司与另一个安防摄像头公司所用的芯片不同，比如对于语音识别的用户，他们更加关注延迟，而不是单一的增加吞吐量。未来，处理器的架构分类上将会以应用为导向。

结语：我们离真正的AI芯片还有多远？

目前看，华为通过用麒麟970这款手机芯片架构整合NLP，抢到了“AI芯片”这个高位，噱头也好，美名也罢；但还有很多问题值得我们关注：

1、用上了NLP神经网络计算单元的麒麟970到底能发挥多大作用？会给手机体验带来什么改变，是不是“然并卵？”，要等华为Mate 10发布后具体看。

2、麒麟970这套玩法是不是就是真正的“AI芯片”套路，之后无论高通、三星还是苹果的处理器SoC是不是也会用这种在手机芯片SoC上加入类似NLP的计算模块？

3、麒麟970能不能代表华为在人工智能方面的积累，如果是，是不是NLP这样的处理单元也应该一手包办？苹果、三星、高通会一手包办还是采用第三发专攻这一领域的处理器IP方案，这是未来AI芯片产业发展模式走向需要明确的路径。

但总的来说，麒麟970的出现，让AI在手机端开始由软到硬地落地，是人工智能进一步产业化落地的一个典型代表。

在智东西公众号回复“人工智能”，获取142篇人工智能研报下载。

（本文系网易新闻·网易号“各有态度”特色内容）

点击下方图片直接阅读

往期回顾

硬创先锋（2017）

人工智能&大数据

擎朗智能 | 先声互联

康夫子 | 异构智能 | 医拍智能 | 彩云AI | 神策数据

竹间智能 | 深鉴科技 | 钢铁侠科技 | 蓦然认知 | 达闼科技

VR/AR

VeeR | RealMax | ObEN | 所思科技

汽车

天瞳威视 | Auto X | 速腾聚创 | Vector.ai

智行者 | WayRay | 游侠汽车 | EZZY | 开云汽车

聚焦特写

捧出滴滴ofo捞到24条大鱼朱啸虎的嘴炮和金沙江的钱袋子

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖