研究人员全力发掘可逆计算,将其投入使用的时机已经到来
■■■
50多年以来,计算机以迅雷不及掩耳之势发展着,这都要归功于摩尔定律——在指定尺寸的集成电路上可容纳的晶体管数量随时间呈指数增长。摩尔定律的成功归结于这样一个事实:随着晶体管变小,其价格更便宜、速度更快、更节能。这种三赢的局面带来的回报使半导体制造技术再投资得以实现,从而制造出更小、更密集的晶体管。因此,这一良性循环持续了数十年。●但当下,产业界、学术界和政府研究部门专家预计,半导体微型化不会持续太久了——或许5年,或许10年。通过缩小晶体管来实现发展的时代已经一去不回。十多年前,小型晶体管的物理特性导致时钟速度陷入停滞,行业便开始制造多核芯片。但即便是多核架构也必须应对越来越多的暗硅。所谓暗硅,是为避免芯片过热而处于关闭状态的区域。
半导体行业正全力以赴地试图保持微型化的发展,但无论如何都无法改变物理定律。在不远的将来,终会有那么一个时刻,使用较小芯片的新计算机绝不会比上一代计算机更便宜、运转更快、更节能。到那时,传统半导体技术的发展就停止了。
那么非传统半导体技术,比如碳纳米管晶体管、隧穿晶体管或自旋电子器件会怎样呢?不幸的是,妨碍今天互补金属氧化物半导体(CMOS)技术进步的很多根本性物理障碍经过改良后仍应用于那些器件。未来几年可能还会有一定发展,但要想继续维持数十年,新器件是不够的:我们仍需要重新思考最根本的计算概念。
可以这样理解。纵观整个计算发展历史,计算机在执行计算的过程中,在某种程度上故意丢失一些信息(破坏性地覆盖信息)。但几十年来,我们已经知道,原则上是可以在不损失信息的前提下执行任何计算的,也就是说,计算可以被逆转,恢复其之前的状态。这种可逆计算的观点深入热力学和信息理论的核心。事实上,从目前乃至未来来看,它是物理定律中唯一可能持续降低通用计算成本、提高其能效的途径。
过去,很少有人关注可逆计算。这是因为可逆计算难以执行,而且传统技术一直在发展,人们自然不会舍易求难。但现在来看,世界上最好的物理学家和工程师准备着手全力发掘可逆计算,将其投入使用的时机已经到来。
■■■
可逆计算的历史始于IBM的物理学家罗尔夫•兰道尔(Rolf Landauer),他于1961年发表了一篇题为《计算过程中的不可逆性和热生成》(Irreversibilityand Heat Generation in the Computing Process)的论文,认为传统计算操作逻辑上的不可逆性直接影响操作设备的热力学行为。
了解“最基本的物理定律是可逆的”这一点,就不难理解兰道尔的推理。这就是说,如果你对封闭的系统状态完全了解,你就可以(至少原则上可以)逆向使用物理定律,准确确定系统之前的状态。
为更好地理解这一点,我们以零摩擦的理想型台球为例。如果你要拍摄一段影片,记录台球撞到其他球或挡板后被反弹,那么无论是正着看还是倒着看,影片看起来都很正常:碰撞物理学也是一样的道理。你可以根据球体过去的位形推算出以后的位形,反之亦然。
这种基本的可逆性同样适用于量子物理学。因此,物理系统两种不同的具体状态不能演化为一种完全相同的状态,否则就无法通过后来的状态判断出之前的状态。换言之,物理学最低层次的信息不能毁灭。
物理学的可逆性意味着我们永远无法彻底消除计算机中的信息。当1比特信息被新的值覆盖时,此前的信息可能丧失了实际用途,但不会真正在物理意义上被销毁或消失,而是被推入机器的热环境中,成为信息熵,其本质是一种随机信息,以热的形式表现出来。
再回到台球上。假设球体、挡板和毛毡存在摩擦力。那么必然,两种不同的初始位形可能最终回归同一种状态——球都停留在一边。信息的摩擦损耗会产生热量,不过热量很少。
今天的计算机无时无刻不在擦除信息,导致以传统方式设计的每一个活跃的逻辑门都在破坏性地覆盖其此前输出的信息,浪费了能量。传统的计算机本质上是一台昂贵的电热器,少量的计算只是它的副业。
它产生了多少热量呢?兰道尔推断(后经实验证实),室温环境下,每1比特的信息擦除必须要消耗至少17‰电子伏特。这一数字很不起眼,但所有操作产生的热量累加后得出的数字就很惊人了。实际上,当下CMOS技术的热量消耗比兰道尔所计算的热量消耗要多得多,每1比特的信息擦除要消耗约5000电子伏特。在这方面,标准CMOS设计能有所改进,但也不会低于500电子伏特,依然远远高于兰道尔说的下限值。
是否有更好的办法?兰道尔在1961年出版的论文中就已经考虑了这个问题。他列举了逻辑上可逆运行的示例,说明计算状态的转换,原则上,每一个可能的初始状态都将产生某种唯一的最终状态。这种运行原则上可以按照热力学上可逆的方式执行,在这种情况下,任何与系统中承载信息的信号相关的能量都不必以热量的形式消耗,而是可以在后续操作中重复使用。
为了证明这一方法可执行的操作无异于传统计算机,兰道尔还指出,任何逻辑上不可逆的计算运行都可被嵌入可逆运行中,只要将不需要的信息搁置一旁即可,无须删除。
但最初兰道尔这种想法仅仅是延缓了不可避免的事情发生,因为可用内存空间占满后,仍需将信息清除。
1973年,兰道尔年轻的同事查尔斯•班尼特(Charles Bennett)向我们展示了,构建能够执行任何计算而不会迅速被暂存数据占满内存的完全可逆式计算机是有可能的,其关键是取消产生中间结果的操作。这就允许后续计算中重复使用临时内存,而不必擦除或覆盖它。这样,如果可逆计算在适用的硬件上执行,那么原则上可以突破兰道尔的局限。
遗憾的是,班尼特使用可逆计算大大提高计算能效的观点多年来未取得任何进展,处于学术停滞的状态。问题在于,我们很难设计出在计算方面引人入胜,而又不会在每次运行过程中无故增加大量信息熵的系统。但是随着技术的进步,最大程度减少能源使用的问题变得尖锐起来。因此,一些研究人员再次将目光投向可逆计算,以求节约能源。
■■■
可逆式计算机的外观是什么样的?20世纪70年代末至80年代初,爱德华•弗雷德金(Edward Fredkin)和他的同事托马索•托弗里(Tommaso Toffoli)在麻省理工学院的信息力学研究小组中首次尝试详细描述可逆计算的有效物理机制。
作为概念验证,弗雷德金和托弗里提出,原则上,可以在理想化电子电路中利用电感器使电荷包在电容器之间来回穿梭,进而实现可逆计算。如果没有电阻器阻碍能量流动,这些电路理论上没有能量损失。在机械领域,弗雷德金和托弗里设想了互相碰撞的刚性球和狭窄约束空间内的固定障碍,与我此前描述的无摩擦的台球游戏不无相似。
很遗憾,这些理想化的系统无法在实际中创建。但是这些研究引出了两种抽象的计算基元,即如今的弗雷德金门和托弗里门,它们后来成为可逆计算中许多后续理论工作的基础。任何计算都可以使用这两种门来执行——操作3个输入位,将其转换为3个输出位的唯一最终位型。
与此同时,加州理工学院、罗格斯大学、南加州大学和施乐帕克研究中心的研究人员继续探索可能的电子学实现方式。他们以理想的热力学状态——“绝热”来称呼他们的电路,在“绝热”状态下,能量被禁止以热量的形式离开系统。
这些想法随后在麻省理工学院有了广阔的发展空间。1933年,汤姆•奈特(Tom Knight)团队中一位名叫希德•尤尼斯(Saed Younis)的研究生首次证明了绝热电路可以用于实现完全可逆逻辑。后来团队中的学生,包括卡林•维埃里(Carlin Vieri)和我,在此基础上设计并制造了CMOS使用的各种类型的完全可逆处理器,以此作为简单的概念验证。这项工作证实,没有根本性障碍能够阻挡整个计算机架构迈入可逆领域。
与此同时,其他研究人员也在探索其他方法来实现可逆计算,而这完全脱离了半导体电子学。20世纪90年代初,纳米技术设想者K•埃里克•德雷克斯勒(K. Eric Drexler)设计出了一种由类金刚石材料制成的可逆纳米机械逻辑设备。几十年来,俄罗斯和日本的研究人员一直在开发可逆的超导电子设备,比如名称类似(但仍有区别)的变参量子管或量子流变参管。圣母大学的一个小组正在研究如何在量子点阵列中使用相互作用的单电子。对于我们这些在20世纪90年代研究可逆计算的人来说,从已经提出的各种可能的硬件来看,一些可逆计算技术的实现可能不会太遥远。
然而,这一想法仍然领先于其时代。传统的半导体技术在20世纪90年代和21世纪初迅速发展,因此可逆计算领域几乎停滞不前。尽管如此,我们还是取得了一些进展。例如,2004年,克里希纳•纳塔拉杨(Krishna Natarajan,我在佛罗里达大学辅导过的学生)和我详细展示了模拟结果:一种简化的新型可逆计算电路系列——名为两级绝热逻辑(2LAL),每个晶体管每周期消耗的能量可低至1电子伏特,约为当时的CMOS逻辑信号所消耗能量的0.001%。尽管如此,实用的可逆计算机还有待通过这种方法或其他方法构建。
传统半导体技术的发展很可能趋于停滞,开发可逆机器的时间所剩不多。如果真是这样,行业可能停滞不前,再要取得进步将更加困难。因此,现在追求这项技术的时机已经成熟,因此可逆计算机投入实际应用可能需要至少10年的时间。
迫在眉睫的需求是全新可逆器件技术。传统的CMOS晶体管——尤其是最小、最先进的晶体管——泄漏电流过多,无法搭建有效的绝热电路。以传统技术制造的较大晶体管电流泄漏较少,但运行速度慢,这意味着需要使用许多器件通过并行操作加速计算。将晶体管层层堆叠可以产生紧凑型节能绝热电路,但目前这种3D制造工艺仍然相当昂贵。无论如何,CMOS都可能走入死胡同。
幸运的是,还有一些有希望的替代方案。其中一种方法是使用快速超导电子来制造可逆电路,已经证实,在可逆操作过程中,每台这种设备的能耗都要低于兰道尔极限值。在这一领域,横滨国立大学、石溪大学和诺斯罗普•格鲁曼公司的研究人员已经取得了进展。与此同时,加州帕洛阿尔托分子制造研究所的拉尔夫•默克尔(Ralph Merkle)团队设计了可逆的纳米级分子机器,理论上它的能耗可低至当今计算技术的千亿分之一,同时还能达到纳秒级的开关速度。问题是,制造这种精确度达到原子级的设备的技术尚未问世。
不管这些方法能否成功,致力于开发新器件理念的物理学家们都需要牢记可逆运行的目标。毕竟,这是新计算基元超越最终的CMOS技术实际能力很多个数量级(而不仅是一点点)的唯一方法。
■■■
要明确的是,可逆计算绝非易事,工程方面的障碍不容小觑。要通过任何技术实现高效的可逆计算,都可能需要对整个芯片设计基础架构进行全面改革。我们还需要就新设计方法的使用对从事数字工程的大部分人员进行再培训。我认为,未来几十年,在教育、研究和开发方面的新增投资很可能会达到数十亿美元。这是计算领域的一次“登月计划”。
但我认为,这些困难重重的挑战并不是我们回避的借口。我们正处在计算技术发展的历史性时刻,必须尽快选择一条道路。
如果我们继续墨守成规,那便意味着放弃计算机的未来,接受硬件能效的发展很快将趋于停滞的事实。即便是像模拟神经元计算和尖峰神经元计算这样的非传统概念,如果不对其进行可逆设计,最终也会道尽途穷。即使量子计算取得了突破性进展,也只会显著加快一些高度专业化的计算,而对一般性的计算毫无助益。
但是,如果我们决定在可逆计算领域开辟一条新路,就可能对我们未来持久地改进计算技术产生深远的影响。在物理学中,通过消耗一定能量来执行的可逆计算量没有上限。因此,如果我们能大胆抓住机遇,迎接挑战,那么计算的未来将无可限量。
作者:Michael P. Frank
>>>本文为原创,转载请回复。<<<
往期推荐