查看原文
其他

柏林现场:华为正式发布全球首款移动AI芯片,终端布局已领先苹果、高通及三星

2017-09-02 林宗辉 DeepTech深科技


在本届德国柏林国际电子消费品展览会(IFA)上,最大的亮点之一莫过于先前已引起极大关注的华为移动端人工智能解决方案。


就在刚才,德国当地时间 9 月 2 日下午 2: 00,华为消费者业务 CEO 余承东在 IFA 发表了主题演讲,华为移动端AI解决方案终于浮出水面。DT 君第一时间在会议现场发回了报道。

 

图丨海思的麒麟系列芯片已经是华为手机方案的主力,现已披上AI战袍(图片来源:DT君)


众所周知,云端的 AI 布局已由各大厂商占据山头,云里有微软、谷歌、亚马逊、百度、腾讯、阿里巴巴等,云上的天空看起来相当拥挤。而在终端 AI 部分,相比之下虽然竞争并没有进入白热化,但各方势力也正伺机而动,暗潮汹涌。

 

当前,从主流移动芯片方案厂商在该领域的动作来看:高通收购了机器学习公司 Scyfer,主要想从软件应用层面去发掘骁龙平台的计算潜力;苹果也想借由推出“神经引擎”(Neural Engine)来争夺终端 AI 生态,该方案可能是独立芯片,但具体进展也不得而知;三星虽然低调投资了 AI 芯片设计公司 Graphcore,但作为主要营收来源的半导体业务分掉了三星太多精力,短期内很难有大动作。可以说,高通、苹果、三星这三家 AI 终端的主要竞争者目前的 AI 芯片计划都还处在筹备阶段。



图丨本届德国柏林国际电子消费品展览会(IFA)现场(图片来源:DT君)


但这种局面却给了另一个竞争者绝好的空窗期,让来自中国的智能手机兼通讯设备大厂华为抢先一步:在德国柏林国际电子消费品展览会(IFA)上正式推出其最新 AI 芯片“麒麟970”(Kirin 970),并希望通过这枚芯片来布局AI终端生态。

 

图丨NPU参数


图丨余承东在介绍麒麟970


图丨麒麟系列发展史


图丨NPU和不同架构组合在处理AI计算性能的差別,可以看到NPU远高于其他组合


图丨支持开放API,可以同时取用各种运算组合


图丨三种主要的应用方向


图丨三大开发环境



图丨利用isp和npu做的动态补偿,避免模糊


图丨展示970所有功能整合的图


华为成全球首家推出AI芯片的手机厂商


华为之所以要推出 AI 芯片,是因为这类芯片与传统芯片的巨大区别。首先,传统芯片在运算时只需要根据指令来调用相应系统进行工作,而 AI 指令之下则包含大量并行计算与建模。这无疑对处理器的计算能力提出了很高要求。

 

其次是移动端的数据收集能力,尤其是手机。优秀的 AI 应用要收集大量的数据来对模型进行训练,而手机无疑是最好的数据收集工具。随着诸如麦克风、摄像头、重力感应器、定位装置等越来越多的传感器加入手机中,一种能实时收集、同步处理、连接协调不同传感器的“人工智能”芯片就显得尤为重要。

 

2017 年,高端手机方案都先后进入 10nm 时代,整合的运算架构较以往更为强大。换言之,手机要做到本地端的学习、反馈,其实客观环境已经相对成熟。因此,这次华为在 IFA 所公布的芯片将是 AI 终端的重要里程碑,而且比高通和苹果都抢先了一步。 



在此次发布会上,华为宣布麒麟 970 将首次整合 AI 模块——功能不再仅仅是语音助手,而是全面进入生活、强化用户体验。


那么,除了语音之外,AI 芯片最有可能的应用是什么?很可能是图像识别,举个简单的例子,目前的自拍软件在拍摄完成后,需要上传到云端,通过通用模型来完成“一键美颜”。但移动端的 AI 芯片则可根据用户平时的喜好,在照片拍摄完成后(甚至拍摄之前的取景阶段)就同步完成照片美化。除此之外,深度人脸识别、动态图像处理都将是其应用场景。


图丨本届德国柏林国际电子消费品展览会(IFA)微软展厅(图片来源:DT君)


当然,一片在指甲盖大小的面积上集成了超过 55 亿个晶体管的 AI 芯片不可能只用来拍拍照这么简单。目前手机上已经有语音服务、机器视觉识别、图像处理等智能应用,未来还会增加包含医疗、AR、游戏 AI 等更多元化的应用类型。而通过麒麟 970 芯片的布局,除了满足手机上的 AI 应用,未来也将有机会拓展其他更有潜力的市场,比如自动驾驶。


在今年 2 月份有消息传出,华为目前正在进行无人车的研究,而合作的对象就是清华大学。根据了解,双方合作研发的无人车已经在华为的曼卡科技园进行过了自动驾驶测试,可以完成自动避让行人、绕行障碍以及自动泊车等操作。华为官方并未对此消息进行确认。但如果属实,加上麒麟 970 在视觉辨识方面的能力获得大幅强化,那么被用在汽车上也不过是水到渠成的事情。


图丨此次发布会华为打出的口号是:你移动端中的新大脑,世界首款移动端移动端AI处理器(图片来源:DT君)


麒麟970到底是一枚什么样的芯片?

  

麒麟 970 定位在最高端的性能方案,根据目前的信息,该芯片将使用 ARM 的Cortex-A73,以及Mali-G72,可能会搭配定制的运算加速单元,并配合采用ARM 的多媒体加速单元。原本麒麟系列的 ISP(Image Signal Processor)是采用外购的现有方案,然而从麒麟 950 开始改为自主开发的整合式设计,除强化效能表现外,也能降低占用 PCB 板的面积,让整体的结构更紧凑。

 

图丨麒麟 970的细部架构,NPU是最大亮点(资料来源:华为)


为什么 CPU 用 ARM 上一代的 Cortex-A73,而不是最新的 Cortex-A75?首先是成本因素,新架构理所当然比较贵,同频性能增长有限。Cortex-A73 已经用在麒麟 960 上,性能和功耗都表现一流,且 CPU 在未来移动应用中所扮演的运算角色其实越来越不重要,因此没必要再换一个功耗更高、尺寸更大、且价格更贵的方案。


其次,Cortex-A75 在结构复杂度方面有所增加,虽强化了性能表现,但是在功耗性能比,也就是每瓦性能方面会稍落后于 Cortex-A73,毕竟主打应用还是手机,功耗其实还是要摆到优先考量地位。而且,在人工智能领域,CPU 所占的运算比重只会越来越低。最后,芯片从开发到量产往往需要一年以上,Cortex-A75 发布不过半年,要定制化时间上也来不及。


图丨Cortex-A73是ARM能效比最高的产品,新推出的A75也要自叹不如(资料来源:ARM)


由于本质上仍是手机芯片,所以即便增加了 AI 处理能力,但麒麟 970 在无线连接的性能方面也能够兼顾。上一代麒麟 960 领先业界支持 Cat.12,麒麟 970 则是再次抢先支持 Cat.18,频宽表现达 1.2Gbps,是 5G 正式规格推出前最快的上网速度,硬是强压高通目前市场上最高阶的 X16 以及仅有书面发表的 X20 基频,不止满足电信运营商不断发展的联网频宽成长脚步,同时也要降低延迟,让串流传输或关键信息能够得以实时处理,满足消费者对联网体验不断飙升的严苛要求。


但若以标准 Google 生态来看,GPU 仍会是很重要的一部分,包括拍照或者是视觉获取部分的处理能力强化。这部分会使用内建 ISP,配合 DSP 以及 GPGPU 来强化整体处理效能。

 

但有好的架构,也需要有好的制程来搭配,不然性能和功耗表现还是会大打折扣。麒麟 970 使用台积电 10nm 制程生产,目前台积电的 10nm 制程良品率提升,产能也明显增加。另根据供应链消息,苹果采用 A11 处理器的 iPhone8 可能推出日期与产能都会不如预期;而联发科的 10nm 芯片客户少,需求极低,其他 10nm 客户产能需求也有限,对华为而言算天赐良机。

 

华为 Mobile AI才是麒麟 970的真正重头戏!


前述标准架构方面的强化是为了配合 Google 在 Android 上的计算加速生态,另外,华为针对自有 Mobile AI 生态布局,打造 NPU 智能计算架构,加上其软件发展资源与与终端基础,布局更深层的机器学习应用——而这才是本次麒麟 970 的真正核心诉求。

 

根据华为透露的 NPU 相关架构信息,以其宣称的 25 倍于 CPU 性能,且 50 倍的能耗表现的架构数据,大概就是以 ASIC 为基础,类似寒武纪或者是谷歌的 TPU 计算架构。这种专用的 AI 类神经加速架构,可在一个指令集的时间同时完成多道神经元分支运算,由于走 ASIC 设计,占芯片面积不大,在台积电 10nm 制程工艺的协助下,直接整合进芯片中也不会对成本或功耗造成太大负担。


图丨本地端AI + 云端AI = 移动AI (图片来源:DT君)


以华为的 NPU 架构要处理原先设定的自然语言或者是实时处理图像数据应用自然是十分轻松,甚至有点大材小用。但如果考虑到三五年后的应用,以及包含更广的 AI 市场,包括汽车、工业、AR/VR 等,此类特制的类神经 ASIC 结构可以在有限的成本增加前提下,达成极高的计算效率成长。

 

以目前华为主打的手机生态而言,不是只要把先进制程、处理单元塞进核心方案,手机就可以立马变成超智能助手。如果没有应用,再强大的硬件也不过是空壳——华为预计将配合此次的硬件设计,推出一系列包含语音、视觉处理,甚至 AR、VR 等应用,让消费者能够在购入手机后,就能直接感受到硬件进化、结合生态所带来的体验优化。


NPU只能用在移动生态上吗?未必!造车?


但手机芯片就一定用在手机上吗?高通和联发科都分别把手机芯片换了个招牌与营销口号就推往汽车或其他应用,华为想要仿效的可能性也完全存在。


前段时间,华为被揭露已经和清华大学合作,秘密研发自动驾驶很长一段时间,如果麒麟 970 在视觉辨识方面的能力获得大幅强化,那么被用在汽车上也不过是水到渠成。


而这恐怕才是华为对这款 AI 芯片所布下的真正杀手级应用策略:结合华为/海思在无线射频上的丰富技术资源与专利,以及手机上的人机交互与智能应用生态,加上自动驾驶汽车需要的视觉识别运算能力,从而打造真正的智能汽车。

 

虽然华为曾否认要造车,毕竟造车所需要的资源太庞大,但不代表华为不能为业界提供造车所需的人工智能解决方案,若能满足造车的应用需求,那么要进入其他产业应用,门槛就更低了。

 

竞争对手高通先发后至


作为 AI 芯片的重要玩家之一,高通也是从很早就开始了相关的研究。高通副总裁 Matt Gob 曾公开宣称,以其芯片方案为基础的 AI 生态研究早在十年前就已经开始。目前,其方案已经支持了终端 AI 的全部功能,以及基本性能需求。而基于骁龙芯片的 AI 应用已经遍布于个人语音助理、计算机视觉、智能手机以及自动驾驶、无人机上,提供各种针对个人使用情景优化的机器学习机制。


图丨高通认为,AI不只在云上,在终端上导入更能优化使用者体验(资料来源:高通)

 

虽然高通骁龙芯片与竞争对手同样是基于 ARM 的标准方案开发出来的产品,但高通非常看重芯片本身的综合计算性能表现,借助一流的 GPGPU、DSP 架构设计,使其方案可在低功耗的条件限制下提供优于市场竞争对手的系统实时反应能力。

 

然而与竞争对手相比,高通在 AI 生态上的领先幅度并不大,因为其开发体系在不久之前仍是走封闭路线,直到近几年才逐步把这些计算能力透过SDK的方式开放给一般开发者。

 

这表明高通的作法主要是求稳,若开放太多底层资源给第三方开发者,可能会影响到其主要客户,也就是那些大手机厂的应用竞争力,各手机厂多半都需要些定制化功能来维系自家产品的竞争力,剥除这些定制化应用,在手机硬件设计同质化越来越高的情况下,市场营销也会更困难。


但近来,高通也意识到过去为了迁就客户而放缓了生态发展的脚步存在问题。为了追赶上发展落差,高通也展开了一系列的举动,包括并购附属于阿姆斯特丹大学、聚焦在机器学习技术的 Scyfer 公司。该公司并非一般产业认知的方案或芯片提供商,而是作为在各种计算架构上的机器学习与AI应用布局研究,并提供技术服务,目前提供服务的领域包括了工业、物联网、金融与移动计算等等,也因为 Scyfer 公司擅长解决将不同 AI 应用安置到不同计算硬件平台上的技术瓶颈,高通希望借其帮助,一举扩大骁龙芯片的AI应用生态。


苹果仍在挣脱束缚,依靠独立AI芯片追赶


苹果公司在移动终端拥有绝对的影响力,过去该公司从现成方案使用者转换成自研,在芯片技术及配合芯片的生态经营上积累了庞大的优势,而且消费者现在使用苹果产品,多半不是只为了硬件本身,而是为了与苹果硬件捆绑的优势生态。

 

举例来说,语音助手概念就是苹果最早提出,而搭配的许多包含影音、LBS服务,以及各种个性化的设计,让消费者有被尊重的感觉,让他们觉得是被手机服务,而不是迁就手机。

 

然而,对苹果而言,是个难以克服的难关,著名的苹果分析师 Gene Munster 曾表示:“AI 不在苹果的基因里”,苹果擅长整合市场成熟技术,对新兴科技的导入过去一向都偏保守,当初 Siri 的推出其实已经把机器学习的部分精髓导入到苹果的产品线中,但后来却没有持续的突破,以致于被 Google 及其他手机大厂逐渐跟上,甚至原本在产品规划中的几个计划也告中断,比如说自驾车的开发。

 

由于终端的机器学习必须和个人数据的管理紧密结合,而这是过去苹果所不愿意碰触的地方。隐私的注重让他们对消费者的个人行为模式的追踪和学习显得束手束脚,但缺了这块,终端的 AI 又将难以达成。

 

不过,苹果也在加速追赶落下的 AI 进度。



苹果公司AI研究主管Ruslan Salakhutdinov

 

从 2016 年开始,苹果雇用卡内基梅隆大学的 AI 专家 Ruslan Salakhutdinov,他专长于深度学习或非监督式的自主学习技术,该技术虽同样属于机器学习的一部份,但更复杂。另外,苹果也开始积极发表 AI 相关论文,这对过去的苹果而言,是件不可思议的事情。

 

苹果也在今年的 WWDC 发表泛用 AI 的机器学习框架 OpenML,可在苹果的所有设备上将训练完的学习模型以极高效率整合进 APP 之中。不过 OpenML 本身不具备建模的能力,其模型必须来自于外来的机器学习工具。


图丨CoreML的目的很单纯,就是把既有机器学习建立的模型快速导入到APP之中(资料来源:苹果)


Core ML 中提供包含用于高效能图片、影片分析的 Vison、用于协助自然语言处理的 Fundation 、及让游戏开发商可以在游戏中导入 AI 的 GameplayKit 等三大应用框架。

 

当然,除了被动使用模型的 OpenML,苹果也不可能放过终端自建模型这块更高深、能带给消费者更好体验的技术领域。该公司在前几个月也被知名媒体 Bloomberg 揭露正在开发一款独立 AI 芯片,命名为“Neural Engine”(神经引擎)。

 

神经引擎主要是用来处理脸部以及语音识别的复杂计算加速工作,以及目前正在风头上的 AR 增强现实功能,降低应用处理器的工作负载。

 

据报导,该芯片已经被放置于部分 iPhone 原型机上进行测试,而且也不排除会用在其他设备的可能性。过去几年, 苹果 CEO Tim Cook 不断强调,AI 与 AR 会是苹果未来重要的两大发展核心,如果顺利的话,2018 年将有可能看到这款芯片或相关功能出现在苹果产品中。




2017年是人工智能终端应用元年,华为抢先一步超越同时代方案


人工智能的发展分好几个阶段,从最早大型计算机时代,到中期的机器人,到目前这个阶段,主打结合人类食衣住行。不得不说,目前的技术发展已经非常接近实用。


要实用就必须考量到所采用方案的特性,有些设备或终端可能需要高端方案,强调性能与实时反应能力,借以优化用户体验;有些更注重成本结构,强调能够大范围复制、扩散,并快速建立生态。


华为和高通、苹果同样针对了高端 AI 应用,且布局各种应用平台,没有画地自限,华为借麒麟 970 的推出抢先两大厂一步在智能手机上有所突破,但后续基于此方案的相关应用成败还是要看华为能否持续有效的经营生态,并借由 AI 创造更好的使用体验。

 

另外,根据市场分析公司 Tractica 的资料显示,2015 年基于深度学习项目的硬件支出达到 4.36 亿美元。而据他们估计,到 2024 年这一数字会飙升到 415 亿美元,这里面也包含了云端与终端的相关硬件。


毫无疑问的是,华为的这次发布会在智能手机领域是具有里程碑意义的开端,也标志着人工智能将从云端走向本地端的趋势已经出现,而预计在未来数年,AI 终端迎来爆发性增长的趋势也已越来越明显。


-End- 



欲知会员计划详情,请点击以上图片


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存