查看原文
其他

Mate40 大战iPhone12 | 带你深度解读NPU、屏幕和材质

探臻科技评论 探臻科技评论 2023-01-01

图片来源:界面新闻


导读

近日,继iPhone12系列发布后,华为也发布了年度旗舰手机Mate40系列。众所周知,由于美国当下对华为芯片设计和制造的全面制裁,此次一并亮相由华为自主研发的“麒麟芯”备受瞩目,加之华为承诺未来对鸿蒙系统的支持,使其一度成为消费者竞相追逐的热点。华为Mate40 Pro此次归来,其背后又会有什么样的故事?在与iPhone12 Pro的较量中,究竟谁能笑到最后?且看下文细细道来。


本文将简要介绍NPU芯片的机理和两款手机的比较,总字数5888,阅读约18分钟


作者简介:

许凌辉,生命学院博士生,研究方向是病毒分子生物学,关注电子科技、数码和半导体等领域。

季静远,机械工程系博士生,研究方向是生物制造,关注生物工程、机械制造、药物递送和3D打印等领域。

李浩,微纳电子系硕士生,研究方向是人工智能芯片,关注人工智能芯片和芯片加工技术等领域。

张少杰,土木系博士生,研究方向是FRP符合材料,关注新材料和新结构等领域。


特别鸣谢微沙龙:特别鸣谢微沙龙提供写作讨论支持!特别感谢探臻科技评论作者团队同学们的鼎力支持!


在10月22日,华为发布了本年度的“旗舰机”——其中Mate40Pro智能手机。由于台积电对华为芯片代工的断供”,Mate40Pro搭载的麒麟9000处理器可能会成为麒麟系列芯片的绝唱。说起麒麟9000,它在工艺制造、CPU构架构、AI计算和安全性方面,均具有良好的表现。它采用5nm工艺制造,集成多达153亿个晶体管,是目前晶体管最多、功能最完整的5G SoC(System on Chip, 片上系统,集成了手机运行所需的各类逻辑处理器和基带射频等模块,目前高端Soc基本和内存封装在一起)。CPU部分为双丛簇+八个核心架构,其中primer core的峰值频率高达3.13GHz,是目前频率最高的手机处理器之一。GPU更是达到了前所未有的24核心的超大规模(9000E为22核心)。AI方面集成两个大核、一个微核的NPU,还有四个核心的ISP。在5G网络上,首创四网协同技术,可将Wi-Fi 2.4GHz、Wi-Fi 5Ghz、主卡5G、副卡4G进行高效融合,在多变的网络条件下可带来聚合高网速、稳定低时延,实现网络优选或并发下载。同时,麒麟9000系列芯片也是全球首个在安全性能上通过国际CC EAL5+的移动终端芯片。


图1 | Kirin9000系列SoC逻辑处理模块,

调制模块及储存模块集成示意图


麒麟9000上集成了如CPU、GPU、NPU等诸多的“PU”(Processing Unit,处理单元),而其中的NPU就是专门用于处理AI(Artificial Intelligence,人工智能)算法的“PU”。那么为什么要专门为AI算法单独设立一个处理模块呢?NPU又与其他的传统的“PU”有什么区别呢?为了回答这些问题,且让我们先回顾一下NPU的发展历史。


Part 01

NPU的“前世今生”

在AlphaGo赢得了与李世石的“人机大战”之后,全球都掀起了一股研究AI的热潮,更有人预言:跟随在互联网时代之后的就将是人工智能时代。也借由这样的一股热潮,AI算法在手势识别、语音识别、人脸识别等具体的应用上也都有了巨大的发展。而在AI算法中,最为广泛使用的就是人工神经网络算法。


图2 | 人工智能将改变我们的生活


人脑可以说是自然界最为杰出的作品之一,人脑的容量只有1.5L左右,功耗只有大约20W,但借由着其中复杂的神经网络系统,人脑能够进行不断地进行学习,并进而处理千变万化的实际问题。“大自然是最好的老师”,人工神经网络算法就是通过参数可调的数学模型来模仿人脑的神经系统,并在实际应用之前让模型进行有效的学习,以最终实现类似于人脑的功能。组成人神经系统的最小单元是神经元,在人工智能算法中,一般通过如下图所示的结构来对人脑神经元进行模仿。


图3 |  自然神经元(左)人工神经元(右)对比图


从图中可以看出,在已经训练完成的神经元运行时:多个输入数据分别与神经元内部的多个确定的权重数据相乘,并将相乘的结果进行累加,这个过程模仿自然神经元的树突收集信息的过程;之后再与神经元内部确定的偏置相加,最后通过一个由非线性函数构成的激活模块,得到该神经元的运行结果,并输出到其他神经元上,这个过程模仿自然神经元的轴突与神经末梢等结构对所收集信息的处理和传输。

在实际的神经网络算法中,会有大量这样的神经元,神经元之间可以实现多层的前后互联,进而组成如下图所示例的神经网络。一些声音、图像数据输入进这样的神经网络,就能够实现如语音识别、人脸识别等实际功能。


图4 | 多层的深度神经网络


由此可见,神经网络算法在运算类型上主要为乘法运算、加法运算、激活运算等等,且运算量巨大。在神经网络算法还比较简单的时候,传统的CPU或者GPU还能够应付下来。但是,随着人们对于神经网络算法不断提出更加严苛的要求,神经网络的深度、广度也在不断地提升。传统的CPU或者GPU都属于较为通用的处理单元,而且难以对数据进行大规模并行处理,这就意味着它们在处理深度神经网络算法时,无论是能效还是速度都会不够理想。


图5 | 麒麟990中独立于CPU与GPU的DaVinci NPU模块

(右上,图源TechInsight)


使用算力较强的大型计算机是一种解决方法,但是这很难在如智能手机这样的可携带设备上实现。这时候,就需要一种更加轻便的专用处理单元来更好地运行神经网络算法,诸如NPU这样的网络处理单元应运而生。

NPU(Network Processing Unit,网络处理单元)是AI芯片的一种。其最主要的作用就是在移动终端上更加高效快捷地处理人工神经网络算法,简化的NPU运算结构如下图所示。


图6 | 简化的NPU运算架构


从图中可以看出,由于神经网络中含有大量乘加运算这一特殊性,NPU舍弃了传统CPU中用于运算数据的ALU(Arithmetic Logical Unit,算术逻辑单元)结构,而使用了并行度更大、能效更高的PE(Processing Element,处理单元)阵列。阵列中的每一个PE都由一定数量的乘法器与累加器组成,完全适用于进行大规模的并行乘加运算。在PE阵列之后还有专门进行非线性激活的激活单元,以及一些用于不同类型网络的特殊运算模块。


图7 | 人工神经网络的软件(左)硬件(右)运算结构


图8 | 华为自研NPU的达芬奇架构


这里只是给出了一个简单的NPU结构,实际的NPU结构会复杂得多(如上图所示的达芬奇架构概念图),以更好地满足实际需求。此外,一般在软件层面上还会为这套运算架构搭配上专用于处理神经网络算法的指令集,使得NPU对于神经网络的运算更加流畅。这样,NPU就如同藏在智能手机中的“人脑”,智能地识别与处理如语音、图像等信息,为人们的生活带来更多的方便,也成为全球各个处理器厂商未来应用的热点。


Part 02

条条大路通“AI”

随着NPU这样专用于AI算法的处理单元出现,全球各个处理器厂商也在不断推出独家研发的用于搭载在智能手机上的AI芯片,华为麒麟9000系列就是很好的例子。除华为的麒麟系列芯片以外,三星的Exynos系列处理器也采用NPU结构。三星在2018年发布的Exynos9820处理器中就集成了NPU模块,该NPU在三星此前用于AI视觉处理的VPU(Visual Processing Unit)基础上进行了改进,加强了处理器运行AI算法的能力,丰富了AI芯片的功能。


图9 | 三星的Exynos9820处理器集成了NPU单元


苹果在2020年9月16日凌晨的新品发布会上,发布了A14 Bionic处理器芯片,其采用台积电最新的5nm EUV工艺,同样采用了独立的NPU结构,将CPU、GPU、NPU集成在了A14 Bionic上。相较于A13 Bionic,其NPU的运算核心从8个提升至16个,加大了整个NPU的运算并行度。在运算核心翻倍与最新5nm工艺的双重加持下,A14 Bionic的处理速度达到了11.8万亿次/秒。


图10 | 苹果最新的A14 Bionic处理器也集成了NPU单元


与华为、苹果、三星这样专门的智能手机厂商不同,高通和联发科这样的手机SoC供应商并没有将专门的AI处理单元分离出来,而是将其融在了传统的运算架构当中。高通的骁龙系列处理器和联发科的曦力系列处理器并没有单独集成的NPU结构,而是在原本CPU和GPU的基础之上,分别集成了HTA(Hexagon Tensor Accelerator,张量加速器)或者VPU到处理器当中,与CPU、GPU共同构成优化的AI算法处理结构。这也是现在针对AI算法进行硬件优化的一种思路。然而,现在关于NPU处理单元还是存在很多没有解决的问题。


Part 03

未来的AI芯片

现在的手机处理器在基本性能提升的基础之上,越来越强调对于AI算法的处理,但是依然存着一些需要解决的问题:

1、现行的NPU基础架构大多依然在使用经典的冯诺依曼结构,即“处理器+存储器”的结构。但这样必然会带来“冯∙诺依曼瓶颈”,即处理器和存储器之间的传输速度会极大地限制整个NPU的处理速度。未来,在NPU中引入“存内计算”技术,能够进一步模仿人脑的处理与存储机制,消除“冯∙诺依曼瓶颈”。在2019年,密歇根大学的卢伟教授团队研发出全球首款基于忆阻器阵列的通用AI芯片。这款新型 AI 芯片使用忆阻器进行数据存储,同时利用忆阻器的电压电流特性,直接在忆阻器上实现神经网络的乘加运算,真正实现了“存算一体”化。可以说,这是AI芯片向“非冯∙诺依曼架构”迈出的重要一步。


图11 | 忆阻器阵列芯片


2、要得到更好的AI效果,一般会意味着更加复杂的AI算法。但这会对处理器芯片带来极大的运算与存储的负担。现在已经有了一些行之有效的网络剪枝、网络稀疏化的方法。未来的NPU将能够支持更多简化网络、稀疏网络的运算,进一步提升运行速度与能效,以较低的代价实现更高精度的AI算法。

在讲完NPU的发展历程和未来趋势后,接着对麒麟9000(华为Mate40Pro)和A14 Bionic(iPhone12 Pro)的特性做个对比,并比较两款手机的其他性能。


Part 04

“华为Mate40 Pro”与“iPhone 12 Pro”硬件规格对比

华为Mate40系列和iPhone12系列是目前世界上仅有的两款搭载5nm制程芯片的手机,其分别使用的芯片是麒麟9000和A14 Bionic,分别装载安卓和IOS两大系统。

芯片与系统性能对比

图12 |  麒麟9000和A14 Bionic性能比较


相较于苹果A14 Bionic芯片,麒麟9000集成了153亿颗晶体管,比外挂BP的A14 Bionic多出30%。同时,由于麒麟9000直接集成了5nm的5G基带,在集成度方面要领先于苹果。在系统方面,苹果的iOS系统与硬件整合度高,形成全封闭的生态,且用户体验更加稳定、安全。相应地其APP准入门槛也较高,但生态圈内设备之间的无缝连接能带来更大便利性。而华为Mate40系列的EMUI11系统,在延续一贯风格的基础上,增加了息屏显示和手势功能。


屏幕面板材质对比

iPhone 12系列屏幕采用了康宁公司一种全新的材料:超瓷晶面板。官方称该材质比任何智能的屏幕玻璃都更坚固,跌落性能提高4倍,是 iPhone 在可靠性上有史以来最大的飞跃。


图13 | iPhone12官方宣传图(图片来源于苹果官网)


通过引入硬度比大多数金属还要高的纳米级瓷晶体(应该是氧化物,比如氧化锆、氧化铝等物质),使其与玻璃融为一体。相对于传统的化学强化玻璃,最大的优势便是破裂的粘合度,也就是即使掉落摔倒,氧化物本身对玻璃的粘合度会让整个玻璃碎面大大减少,从而减少整个破碎的碎面面积。

原理听上去简单,但因为瓷的本身并不透明,所以实际加工难度极高。通过特殊的工艺配方,控制晶体类型和结晶度,从而尽可能体现瓷的硬度,同时保持材料的光学通透性。除了坚固,超瓷晶玻璃面板还抗刮划。采用与玻璃背板相同的双离子交换工艺,对面板进行强化,以抗刮裂和划痕,抵御日常磨损。正是这些技术上的突破,成就了这块非常适合在显示屏上使用的超瓷晶面板。


图14 | 一种微晶玻璃(图片来源于百度图片)


超瓷晶面板实际就是一种微晶玻璃,英文名字叫“ceramic-glass”。微晶玻璃是指加有晶核剂(或不加晶核剂)的特定组成的基础玻璃,在一定温度制度下进行晶化热处理,在玻璃内均匀地析出大量的微小晶体,形成致密的微晶相和玻璃相的多相复合体。它具有玻璃和陶瓷的双重特性,普通玻璃内部的原子排列是没有规则的,这也是玻璃易碎的原因之一。而微晶玻璃像陶瓷一样,由晶体组成,也就是说,它的原子排列是有规律的。所以,微晶玻璃比陶瓷的亮度高,比玻璃韧性强。

康宁公司在微晶玻璃(ceramic glass)方面的专利布局,时间早、数量多。截止目前,康宁公司在全球已申请关于微晶玻璃的专利共1300余件,其中,在中国大陆的申请有约90件。而苹果公司关于微晶玻璃也有对应的专利,专利名称为“Controlled crystallization of glass ceramics for electronic devices”,公开号为“US10611666 B2”,该专利于2020年04月07日授权公告,可能就是这次和康宁合作的超瓷晶面板技术。

华为MatePro40采取88°超曲面环幕屏设计,相较于全面屏,超曲面环幕屏更具视觉冲击力。相比于其他手机,曲率有大幅上升,如此高的曲率视觉上直观表现为无边框感受,原理如下图所示。屏幕材质为某种玻璃,但是具体的技术细节属于商业机密,仍未透露。同时,华为MatePro40对误触碰算法进行升级,可以有效解决误触问题。


图15 | 88°超曲面环幕屏设计与其他屏幕对比(图片来源花粉俱乐部)


屏幕刷新率对比

相比于11系列,这次iPhone 12系列均采用OLED全面屏,苹果称为超视网膜 XDR 屏。其屏幕对比度达 2000000:1,激发亮度可达1200尼特,可以完美体验拍摄 4K 杜比视界视频、精致细腻的 HDR 照片等新功能。华为Mate40全系也标配OLED屏幕,供应商有京东方,三星Display以及LG Display。

iPhone 12系列仍均采用60Hz刷新率屏幕,触控采样率在触发底部导航条时可至120Hz,其余操作为60Hz,而华为Mate 40全系均采用90Hz刷新率,全局触控采样率为240Hz,在视觉流畅性和精准操控等方面均有明显的优势。

随着近些年Soc内存控制器位宽的连连翻倍,内存带宽已经不再是限制高刷新率的瓶颈,因此当下支持120Hz甚至144Hz的手机比比皆是。手机屏幕的刷新率代表屏幕每秒画面被刷新的次数,当我们点亮手机屏幕时哪怕静止不动,其屏幕依旧在每秒不停地刷新着画面,但是需要注意的是,高刷新率虽然在静态页面感知不强,但只要动起来的话,那就差别就大了。举个例子,在60Hz屏幕和90Hz屏幕同时进行同一项操作时,由于90Hz屏幕在同一时间内显示的画面更多,所以视觉连贯性上要更强一些。尤其针对一些大型游戏的游玩来说,刷新率越高,图像就越稳定,图像显示就越自然清晰,对眼睛的影响也越小;刷新频率越低,图像闪烁和抖动的就越厉害甚至于图像会撕裂,眼睛疲劳得就越快。但是有利必有弊,相应的高屏幕刷新率带来的会是更为严重的耗电问题和更短的屏幕寿命,所以华为Mate 40系列为了平衡两者采用了90Hz的屏幕刷新率。 


图16 | 不同屏幕刷新率下的拖影现象对比


屏幕子像素排列方式的比较

对于手机屏幕来说,三个自发光单元(次像素)组成一个像素,这是像素的基本排列,即“RGB”排列;R代表Red,红色,G代表Green,绿色,B代表Blue,蓝色。红绿蓝这三种颜色也称为“三基色”。RGB排列方式是最优排列方式,由于OLED屏幕特性,蓝色自发光像素寿命太差,采用RGB排列方式的OLED屏幕早期都遇到了“烧屏”的麻烦,因此,三星电子研究出了既能延长OLED屏幕的使用寿命,避免烧屏,又能保证良好的屏幕素质,画质体验,研发出了钻石排列方式“PenTile”,简称P排,并申请了专利。国内OLED厂商,如京东方,天马等要生产手机用的OLED屏幕,则需要绕开三星专利,开发新的排列方式 “Delta”,简称D排。为了避免烧屏,延长OLED使用寿命而放弃使用RGB排列的方式,导致最终的像素清晰度会有一定的折损,三星自研的钻石排列的折损率为81%,国产京东方使用的周冬雨排列的折损率则高达66%,所以周冬雨排列的屏幕画质会更不清晰,文字边缘会有毛边,色彩鲜艳度不够等缺陷。


图17 | RGB排列,钻石排列与D排的像素效果比较

(图片来自于百家号/HOTO数码)


目前已经发售的iPhone 12和iPhone12 Pro屏幕均采用公认最好的“钻石排列”方式。这是目前为止,OLED屏幕面板显示效果最佳的子像素排列方式。由于华为在屏幕上坚持“多供应商”的策略,因此屏幕子像素的排列方式基本覆盖了当前的主流方案。来自京东方(BOE)的屏幕采用的是被戏称为“周冬雨”排列的delta RGB排列;而来自LG的屏幕则采用的是“钻石”排列。虽然都是“钻石”排列,但是由于三星屏幕面板的支持“次像素渲染技术”,而且有机发光材料均是由顶级上游厂商提供,所以显示效果要比LG的“钻石排列”更好。而“周冬雨排列”的显示精细度相较于“钻石排列”打个八折,在日常使用中会出现文字边缘模糊,彩边等情况。本次Mate40系列在Mate40 Pro采用的是“钻石排列”,供应商不详,Mate40版本为京东方的“周冬雨”排列屏幕。假设两者的图像处理性能站在同一起跑线上,那么iPhone 12的显示效果则会略胜一筹。


图18 |  iPhone12 Pro 屏幕次像素以“钻石”排列方式进行排布


Part 05

结语

在华为Mate40 Pro与iPhone12 Pro角逐的背后,不仅仅是在软件层面AI算法的较量,也是在硬件层面AI芯片的比拼。在智能手机方兴未艾的今天,AI算法如何更加有效地在移动端上运行,将在未来一段时间内始终是业界的热点问题。也正是AI在软、硬件这两种层面上的协同发展,将推动人类更快地向真正的人工智能时代迈进。


参考资料

[1]2020年10月22日,华为产品发布会

[2]深兰科技:AI人工智能应用技术将成为未来零售业的超级大脑http://www.hatdot.com/keji/2004524.html

[3]华为官网https://www.huawei.com/cn/?ic_medium=direct&ic_source=surlent

[4]详解三星Exynos9820:这一次它真的能称王https://www.sohu.com/a/275595454_184641

[5]苹果A14 Bionic处理器发布:首发台积电5nm工艺,118亿晶体管,NPU核心翻倍https://finance.sina.com.cn/stock/relnews/us/2020-09-16/doc-iivhuipp4625117.shtml

[6]都是拼AI性能,为何苹果/海思集成NPU,高通和联发科却选择优化?https://www.ednchina.com/news/201812181013.html

[7]华人科学家造全球首个存算一体通用AI芯片,类脑计算关键元件再获验证http://tech.ifeng.com/c/7pakDYRyO8x

[8]苹果官网https://www.apple.com.cn/iphone-12/

[8]Patent Material Analysis公众号:iphone12的超瓷晶面板,有什么对应的专利吗?https://mp.weixin.qq.com/s/zhXtnk8Vb8_T9mo0L35ABA

[9]百度百科.微晶玻璃.

[10]华为麒麟9000处理器发布:采用5nm工艺!https://baijiahao.baidu.com/s?id=1681306469660725470&wfr=spider&for=pc

[11]华为Mate40和苹果iPhone 12,谁更能打?

https://www.huxiu.com/article/389182.html








特别鸣谢 | 研会学术部

文稿|许凌辉 李 浩 季静远 张少杰

编辑|赵若时 高松龄 周圣钧 邱雨浩

审核|赵 鑫 张可人



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存