永不失忆的计算机芯片
━━ ━━
1945年,数学家约翰•冯•诺伊曼为计算机开具出一份极其简单的配方。它只需要两个关键组成部分:用来执行计算和逻辑操作的中央处理器(CPU)和用来存储指令和数据的内存条。
时至今日,我们所使用的计算机和配有微处理器的电子设备都依然遵循着这个基本配方。当然,外表之下的构造要复杂得多。目前还没有任何一种内存形式能够满足所有的需求。所以,为了尽可能快地转移指令和数据,工程人员们必须作出一定妥协。当前计算机所使用的内存技术可谓五花八门,每一种都力求将其最大优点发挥到极致。
数十年来,这种大杂烩形式的解决方案一直发挥着很大的作用,但仍远非理想之选。最大的能量消耗之一源自数据在CPU和其周围各层内存之间的传递。此外,存储速度快的内存在电力供应无法持续的情况下会丢失数据;而紧凑的内存(即可以在很小的区域内存储大量数据的内存)则处理速度很慢,这也正是我们使用的小型电子设备和计算机需要很长时间才能从休眠中醒来的主要原因。
长时间以来,研究替代内存的科研人员们都在寻找一种能够摆脱这些限制的途径。我们一直都梦想着制作出一款能够胜任各种任务、从而可以替代目前各类内存的单一“通用”内存。这种内存必须具备较快的处理速度,将读写数据方面的延迟降到最低,并且在每次使用的时候只消耗很少的电力。这类内存还应可以被安装在配有CPU的相同芯片上,从而可令其位置靠近计算单元。此外,我们还应该能够确保较高的内存密度,令其足以在成本方面与现有的内存相抗衡。与此同时,我们还希望这种内存具备非易失性,即在无需持续供电的情况下仍能保存数据,从而可以在不需要的情况下将其关闭。
开发出这种内存还需要若干年的时间,但这一愿景已经足以启发出有关各类替代内存的创意和构想,而其中某一项替代内存的方案或许终能实现上述诉求。我们在加州大学洛杉矶分校的研究团队便一直在研究一款我们认为最具前景的替代方案:一种被称为磁电随机存取存储器(MeRAM)的磁性内存形式。我们已经制造出这种内存的小型阵列,并且已有一些芯片制造商对其产生兴趣。
与此同时,我们与其他研究人员还一直在探索如何利用在MeRAM中写入数据的物理过程完成一项更为激进的工作:通过消除逻辑器件和内存之间长久以来存在的差别,彻底颠覆冯•诺伊曼提出的计算机蓝图。借助MeRAM技术,有可能制造出自身即是一种内存的逻辑器件——既能够执行计算操作,又可以记忆数据的转换器。即使在断电状态下,这种转换器仍能够维持其存储状态。
这种“非易失性逻辑器件”也许会在将来的某一天引发微处理器的全面变革,使得我们制造出的芯片可以快速关闭一些当前不被使用的组件,从而节省能源。此外,这类芯片还可以在失去电力供应的情况下冻结当前状态,并且在重新启动后立即明确地回忆起关闭之前正在执行的任务。在我们的实验室里,科研人员们喜欢将这种新的瞬时启动电子器件称为“瞬时通(Instantonics)”。我们认为它可以极大地提高计算机、平板电脑和智能手机的数据处理速度和电池寿命。除此之外,它还能给某些具有很高内存密度的计算任务带来明显的加速,例如视频和多媒体信号处理、模式识别、虚拟现实和机器学习。
━━ ━━
就计算机内存的结构体系而言,首先最为基本的是静态RAM。它的处理速度最快,往往位于计算核心旁边的微处理器芯片上。其次是通常置于单独一块芯片或芯片组上的动态RAM,这种内存的处理速度要略慢于SRAM,但成本却相当低廉。与晶体管逻辑器件类似的是,这两种内存都需要电力供应才能保留数据。实际上,DRAM比特需要不断地刷新或重新写入,以防止数据丢失。由于这种限制的存在,计算机中的长期存储都是由两种无需电力即可保留信息的内存完成的:传统磁性硬盘和NAND闪存。
这些非易失性数据存储设备也存在不足之处。闪存的工作原理是在晶体管结构充入或释放电荷的过程中存储信息。由于可以实现较高的存储密度,因此闪存的成本相对较低。但是这种内存向每个比特写入信息的过程却非常缓慢,其速度甚至只有DRAM的百分之一。此外,闪存还需要较高的电压,而且只能进行大约10万次擦写。与之相比,硬盘驱动具有更强的耐用性。其原理是将数据存储为铁磁圆盘上不同区域的磁定向形式。但是由于硬盘只能依靠机械地移动相应组件来读写比特,因此它们的数据处理速度比闪存还要慢。
这些缺点的存在促使内存研究人员们考虑存储设备的另一种选择,即基于自旋原理的非易失性内存。自旋是电子等亚原子粒子具备的一种基本量子力学属性。对于铁、钴、镍等磁性材料而言,它们的磁属性(也就是它们的南北两极)完全源于电子的自旋。粒子的自旋与其自身固有的角动量密切相关,角动量这种属性会令粒子以特定的方式与磁场发生相互作用。自旋的真正含义并不能从字面理解,它与真实的物理旋转其实没有任何关系。是的,自旋的概念非常深奥难懂,但是就这篇文章而言,我们只需要了解两点。其一,自旋是有方向的;换言之,如果一个粒子具有自旋属性,那么它的自旋是指向某个方位的。另外一个重要的概念便是,在经过磁化的材料中,大部分单个电子的自旋均指向同一个方向。正是如此,材料才得以磁化。
实际上,常用的硬盘驱动就是一种自旋存储器。在磁盘上,每个比特的数据均被存储为一个微小的磁材料区块,其中所有的电子都拥有相同的自旋方向。在读写比特时,磁盘会在读/写头下方高速旋转,同时,读/写头自身也会移动。为了使数位从1变成0,读/写头会反转这块微小磁材料区块的两极,从而使该区块内电子的自旋指向相反的方向。
“自旋电子内存”一词是指一种特定类型的内存,这种内存具有若干种变体,亦被称为磁性RAM(MRAM)。这种内存没有可移动的部件。MRAM中的基本存储元件是一个磁隧道结,这是一个纳米级的夹层装置,两边的磁性层被一层极薄的绝缘电介屏障隔开。(在实际应用中,还会在磁隧道结上增加其他一些材料层,以提高性能并且提供与外界的接触点。)
在磁隧道结中,其中一层的磁性层是旋转着的,这意味着其磁化方向也是固定的,以用作参照。另外一层磁性层则被称为自由层,主要用于储存信息。自由层的磁化方向可以转换,要么指向与固定层相同的方向,要么偏转180度指向完全相反的方向。自由层的定向会影响电流以量子力学方式通过绝缘屏障穿过整个装置的难易。因此,装置的电阻值便代表自由层磁化的方向,从而也反映了数位是0还是1。
总体而言,布线和其他组件所需要的空间使得自旋电子内存的密度比硬盘驱动略低。但由于其运行过程中不牵涉机械运动,因此自旋电子内存的数据处理速度要比硬盘驱动快很多,能量消耗也相对较少,同时可靠性也更高。
事实证明,通过改变自由层方向在内存比特中写入信息的过程成为大部分MRAM技术的区别所在。大约在10年前开始投入商用的最早的MRAM变体之一是利用近旁的载流导线生成的磁场写入数据。这种类型的MRAM的写入速度相对较快,可达到数十纳秒级别,比闪存的写入速度要快数百倍,与DRAM旗鼓相当,因此被率先投入大规模商用生产。但是其缺点在于需要向导线注入强大的电流才能生成磁向转换所需的磁场。这一要求妨碍了人们将内存单元缩小为适合现代芯片的尺寸。由于将充足的电流注入规模更小的导线会更加困难,而且内存单元也越来越紧凑,因此很难确保磁场只对目标比特产生影响。
当前受到许多大型存储设备制造商和芯片制造商追捧的第二种MRAM变体利用一种完全不同的物理现象——自旋转移矩效应(STT)——来写入信息。STT-MRAM通过直接向磁隧道结通入电流而非利用附近的导线产生的磁场来向磁比特写入信息。如果通过STT-MRAM比特的电流足够大,其中的电子便会对自由层的自旋产生拖拽作用,并将其扭转到需要的方向,或与固定参考层的自旋方向相同,或与之相反。
在过去几年里,包括我们加州大学洛杉矶分校的团队在内的众多科研团体已经能够证明,STT-MRAM可在短短100皮秒内完成信息写入,且只需要消耗几百飞焦耳的能量。这比最初的MRAM已经好很多,甚至已经能够与SRAM相媲美,但却仍无法与位于CPU核心的逻辑交换器抗衡。时下的标准CMOS晶体管每开关一次消耗的能量只有1飞焦耳左右。此外,STT-MRAM在能效方面已经没有太大的提升空间。其基本原因在于:磁隧道结装置本身就是一条导线。在电流通过磁隧道结的过程中,能量会转化为热量浪费掉。而且作为导线而言,装置越窄小,电阻便越大。而且STT-MRAM中的每个内存单元都需要一枚晶体管将写入电流导入磁隧道结。由于晶体管需要提供相对较强的电流,因此便很难轻易缩小。所以,尽管STT-MRAM的势头正劲,但它的内存单元却只能保留着较大的尺寸,约为DRAM内存单元的3到5倍。
然而,事实证明,只要设计一款使用电压代替电流实现磁化转换的装置便可以克服MRAM和STT-MRAM的众多限制。目前,包括我们在内的若干团队都在积极研究这种信息写入方式。这种写入方式所需要的转换能量有望降低到大约1飞焦耳左右甚至更低——还不到STT-MRAM所需能量的百分之一。
━━ ━━
使用外加电压属于半导体领域的标准操作;现代MOS晶体管正是依靠外加电压才能工作。毕竟,是电压为半导体通道中的电荷载流子流动打开或关闭栅极。
即便如此,采用一种基于电压的类似方式来控制自旋也并非是显而易见的选择。为了存储信息,自旋电子装置需要用到具有永久磁化或磁矩的材料。其中最佳选择通常是铁、钴等金属。但令人遗憾的是,这些导电材料同时也具备较强的阻隔电场的能力,会阻止电场深入金属内部。其原因在于此类导电材料中电子的自然移动会轻易地扰乱进入材料的电场,就像一条快速流动的河流会淹没注入其中的溪流一样,外加电压的效应也会被“屏蔽”掉。
因此,在自旋电子内存中使用外加电压的一些最初尝试都是尽量采用最少的金属材质制造存储设备。其中一种方式便是采用硅或锗等半导体材料,并在其中掺入一些磁原子,从而形成稀磁半导体。如果对这种材料施以一定电压,随之产生的电场并不会像在金属材料中一样被轻易屏蔽。相反,电场会对电压栅附近的电荷产生推拉作用,从而可以相应地改变位元的磁属性。
这种方式的困难之处在于很难获得可在室温下工作的铁磁半导体。原因是铁磁半导体的磁属性太弱,以至于无法在热波动的影响下依然保证一致的自旋方向。
幸运的是,我们还有另外一种备选方案。大约在10年之前,理论家们便开始探索,如果尝试使用一种极薄的金属磁性材料的电场控制结构(其厚度约为1纳米左右,不到10个原子的厚度)会得到何种结果。实际上,这一厚度仍然要比电场在被大规模扰乱之前渗入金属材料内部的距离要大。但是它已经薄到使得材料表面的微小变化可以对薄膜的整体属性(包括统一自旋到某个特定方向的自然倾向)产生较大的影响。这一构想引起了人们的强烈兴趣,在它的启发下,来自日本大阪大学、日本东北大学、约翰•霍普金斯大学、加州大学洛杉矶分校我们的团队以及其他各地的科研人员们都在研究制造基于这一方案的存储设备。
我们一直都在研究的磁电RAM(MeRAM)就属于一种薄膜自旋电子内存。这种内存与STT-MRAM有诸多相似之处。例如,它也可以采用相同的钴铁合金制成。主要的区别在于设备的结构及其表面的工程原理。在薄膜自旋电子内存中,存储比特所使用的磁性层非常薄。同时,在STT-MRAM中可允许电流通过的绝缘层在这里却被打造得更厚,因此,几乎没有电流可以从中通过。这种结构上的变化将磁隧道结变成了一种电容性(而非电阻性)装置。当对该电容器施加电压时,随之产生的电场会改变磁隧道结自由层的磁属性。而这将改变存储比特自旋在上下方向上的锁定强度。自旋方向将开始摇摆,如果电压脉冲在适当的时刻切断,那么存储比特的自旋方向将会发生180度的转变,与最初的自旋方向恰恰相反。此外,依靠一个强度较小的磁场或电流也可以促使自旋转换到所期望的最终状态。
这种设置的优点是非常明显的。由于MeRAM无需大强度电流转换自旋方向,它所使用的晶体管尺寸便可以比STT-MRAM所使用的小很多,从而可以极大地提高阵列密度。而且我们已经证明,MeRAM的数据写入速度只有不到1纳秒,消耗的能量也只有STT-MRAM的十分之一。随着设备体积越来越小,材料性能逐渐改善,我们期待能够将能量消耗进一步降至原来的百分之一。
我们团队已经制作出一款容量为1千比特的MeRAM内存阵列。相比当下容量已扩展到以吉比特甚至太比特计的传统内存而言,这只是迈出了极小的一步。这款内存阵列由美国国家科学基金会支持研发,是一个极为重要的概念验证设计。并且我们已经看到一些商业兴趣的迹象,包括应用材料公司、佳能-安内华和新格拉斯科技集团在内的一些生产半导体制造设备的厂商都在研究特殊的溅镀和蚀刻机器,以用于铺列和定型制造高密度MeRAM内存阵列所需要的磁化合物薄层。
接下来要做的便是证明此类内存阵列能够集成到现有的CMOS芯片上面。该集成程序将在相对较低的温度下,在芯片制造的后段过程中完成,即用金属导线层连接不同芯片元件以及外接设备的阶段。这一基本的“后段制造”工艺已经运用在MRAM和STT-MRAM的制造过程中,亦可适用于MeRAM的制造。(顺便提一下,另外一种截然不同的内存——电阻式RAM——亦是利用这些金属层存储信息;这种内存似乎更适用于低成本、高密度存储。)
如果MeRAM能够集成到传统处理器中,那么便有望替代芯片上面除速度最快的SRAM之外的所有内存。此外,由于可以轻松实现紧凑阵列,这种内存将能够装配在有充足可用空间的金属层中。这样一来,依靠这种工艺便可以将DRAM目前只能在芯片外实现的内存功能放到处理器上完成。内存单元与CPU之间的距离也可以从若干厘米缩短到若干毫米甚至是微米,从而极大地缩短延迟时间,并解决热散逸问题。
━━ ━━
此外,我们还可以采用MeRAM所使用的电压切换法去实现更为激进的目标:制造非易失性的、自身可作为内存使用的逻辑器件。这一构想在2010年时获得鼓励和支持,当时,美国国防高级研究计划局(DARPA)为我们的团队提供了援助,以研究这一构想的可操作性。
我们设计的自旋电子逻辑器件基于一个物理原理,即材料的自旋运动会在发生相互作用后趋于同一个方向。利用电场或磁场打破一个或多个自旋运动的平衡状态将引发一波在材料中移动的自旋扰动(或称“自旋波”),就像波纹会从池塘中溅起水花的地方向外扩散开来。
这些自旋扰动可以像控制MeRAM那样利用电压制造出来。但在这种情况下,电压脉冲的强度要弱一些,只对自旋运动产生干扰,而不是将其方向扭转180度。我们制造的实验逻辑器件便是依靠这些自旋波发挥作用。在此类器件中,0和1并不是通过存在或缺少电流的形式来呈现。相反,它们是通过自旋波的两种不同相位来体现的——在既定位置和时间内,波峰代表0,那么波谷就代表1(或是反过来,波峰代表1,波谷代表0)。
为了帮助读者了解自旋波如何用于执行计算过程,我们可以用多数决定门的例子来说明。多数决定门通过呈现多数输入端的数值来发挥作用;通常情况下,多数决定门有3个输入端。包括输出端在内,多数决定门共有4个终端。
在自旋电子逻辑器件中,3个电压控制输入终端用于制造相位为0或180度的自旋波。采用这种设计的器件,其内部自旋波相遇后,或会彼此干扰,或会彼此强化。在输出端口探测到的信号将是来自不同输入端的自旋波的汇总。如果3股自旋波拥有相同的相位,输出自旋波也会具备该相位。而如果两股自旋波的相位完全相反,它们便会相互抵消,输出端的相位则由剩余一股自旋波决定。这样一来,胜出的比例便可达到三分之二。为了使这一逻辑运算过程具备非易失性,可以将MeRAM磁内存位元集成在每个输入和输出终端;它们便可以用来输入和存储数据。
我们与加州大学河滨分校和马萨诸塞大学阿默斯特分校的合作者们一起模拟了这些多数决定门装置,并发现完全可以使用此类装置制造出仅带有一种额外类型的逻辑门(即反相器)的通用计算机。
与自旋波逻辑器件在利用相位方面的能力相比,传统逻辑器件并不具备类似的功能。但模拟操作已经显示,利用该技术制造的逻辑器件的频率可达到千兆赫级别,基本上可与现在的芯片频率相媲美。同时,自旋逻辑器件每次运算所消耗的能量也更少,只有CMOS能量消耗的百分之几。
除此之外,研究人员们现在还在探索其他实现非易失性逻辑的方法。其中一种得到DARPA非易失性逻辑项目组支持的方法便是通过排列紧密的独立纳米磁体之间的磁扰动传输信息。另外一种方法则主要研究磁块间畴壁的移动情况。在这两种方法中,似乎能效最高的运算均源自外加电压的使用。
一旦某一种方法取得成功,我们便可以开始考虑对微处理器进行大变革。我们可以彻底颠覆传统的冯•诺伊曼构造,制造出新型逻辑电路——无需单独内存执行计算任务,且不必为了确保数据不丢失而将其输送到一些外置芯片中。
其实,成功的意义并不仅仅限于延长个人电子设备的电池寿命。对于那些现实中很难接触因此无法轻易充电的设备而言,仅靠极低的电量便可运行的芯片具有非常重要的意义。这包括那些医用植入芯片和安装在高海拔地区、太空、地下、水下等难以到达的位置或极其危险的环境中的传感器。借助大量芯片集成内存,这些装置还能够更好地完成一些特殊的内存密集型计算任务,例如模式识别和机器学习。国防和太空应用均能够从瞬时启动系统中获益,瞬时启动意味着电源故障、辐射和其他干扰导致关键信息丢失的可能性将有可能大幅降低。
除此之外,还有一些更加新奇的逻辑电路即将问世。拓扑绝缘体,一种只能沿表面传输电流的物质,将有望用于制作新型内存,其切换所需的能量仅为金属自旋电子设备所需能量的千分之一。但是,研究人员们目前仍在探索此类材料的基本属性。与此同时,近期在自旋电子领域取得的成果已经明确证明,在大幅提高计算性能方面,我们仍大有可为。
然而,若要充分利用这些先进技术,我们还需要具备相应的意愿,愿意超越我们已经依赖了数十年的这种奇特且略显丑陋的逻辑器件与内存混合存在的形式。在我们经历过摆脱现状束缚所带来的阵痛之后,我们将会发现,其实我们可以完成许多伟大壮举。
作者:Pedram Khalili,王康龙
>>>本文为原创,转载请回复。<<<