其他
大数据需要一场硬件革命
光子盒研究院
计算领域的进步往往集中在软件上:华丽的应用程序和软件可以跟踪人和生态系统的健康状况、分析大数据,并在智力竞赛中击败人类冠军。与此同时,对支撑所有这些创新的硬件进行全面改革的努力相对来说,略显小众。
自2020年以来,全球科技巨头谷歌、微软、IBM等纷纷扩大其人工智能(AI)的硬件研究;主要的芯片制造商们也正在采取行动,以在这一领域的竞赛中拔取头筹。当他们这样做的时候,意味着他们正盯着一个重大的转变——可以说是自计算诞生以来架构的第一次重大转变。
这对科学很重要:从天文学和粒子物理学到神经科学、基因组学和药物发现等领域的研究都希望使用人工智能来分析和寻找巨大的数据集;但是,这些却对传统计算机硬件提出了新的要求。
传统的冯·诺依曼架构将计算机内的数据存储单元与数据处理单元分开,这使得它们之间来回传递信息需要时间和能量,并在性能上造成瓶颈。
为了利用技术发展的优势,硬件工程师正在寻求建立超越冯·诺依曼设计限制的计算机:这将是向前迈出的一大步。几十年来,计算领域的进步一直是由缩小组件的尺寸驱动的,戈登·摩尔的预测是,芯片上的晶体管数量大约每两年翻一番——这通常意味着处理能力也会翻一番。
现代计算机与早期使用打孔卡(punch card)存储信息和使用机械式继电器进行计算的机器没有什么相似之处。现在的集成电路包含的晶体管非常小、超过1亿个晶体管可以装在针头上。然而,记忆和处理分离的基本设计仍然存在,这对它们可以实现的目标造成了限制。
一个解决方案可能是合并内存和处理单元,但在内存单元内执行计算任务是一个重大的技术挑战。
早在2018年,谷歌的AlphaGo研究就显示了一种可能的、不同的前进方式。该公司已经生产了名为张量处理单元的新硬件,其架构能够同时进行更多的操作。这种并行处理的方法大大提高了计算密集型计算的速度和能源效率,而放宽对执行精确和无误差计算的严格需求的设计(一种被称为近似计算的策略变化)可以进一步增加这些好处。
因此,像AlphaGo这样的人工智能程序的功耗已经大大改善。但是,提高这种硬件的能源效率对于人工智能的广泛普及至关重要。
人脑是最节能的处理器,所以硬件开发者自然会试图模仿它。被称为神经形态计算的方法旨在做到这一点,其技术可以模拟生物神经系统的通信和处理;现在,一些神经形态系统已经展示了在模式识别等任务上模拟神经元集合的能力。
目前,一场技术革命正在进行中,机器每年都在变得更加复杂。
超级计算机使用具有众多处理器的传统计算策略,快速处理大量数据以提供单一结果。这些计算机在原始计算速度方面是最强大的,但它们一次只能做一个任务,而且摩尔定律对它们能处理的数据量设置了上限(计算机处理器速度每两年翻一番的原则)。
另一方面,量子计算机利用量子力学定律,以普通计算机无法做到的方式处理信息,从而使处理速度大大增加。它们可以同时管理几个活动,并处理那些需要超级计算机几个月才能解决的挑战性问题。然而,由于它们对温度波动非常敏感、需要与外界影响隔离,量子计算机比传统的同类计算机需要更多的维护。
量子计算这一短语首次出现在英国物理学家David Deutsch 1985年写的一篇论文中,但这个想法可能早在1981年就已经起源了:当时已故的理查德·费曼提出了这个问题:在麻省理工学院的一次物理学和计算会议上,我们能在计算机上模拟物理学吗?
在公众和大众科学界,对量子计算机的真正性能存在着很多误解。在这之中的一个笨拙解释是,它们只是比超级计算机快,但这是不正确的。
尽管我们现在处于含噪声的中等规模量子计算(NISQ)时代,量子计算机和量子启发的算法也有可能对组合问题有帮助(如预测交通模式,以及对网络安全和密码学的关注)。
然而,要真正看到量子计算机脱离NISQ时代、走向“量子优势”,在药物设计、计算化学、金融建模和天气预报等垂直领域取得更好的结果,仍然将需要改进技术:这些包括但不限于系统内逻辑量子比特的数量、大幅减少退相干时间,以及增强纠错能力。
2021年,127量子比特的IBM量子计算机和Eagle处理器向公众揭开了面纱;Osprey是迄今为止最强大的量子计算机,它比谷歌和欧洲、亚洲各国创造的机器大一倍多。
到2022年5月,Frontier超级计算机将能够进行每秒两万亿次的计算:开启了百亿亿级计算时代;彼时,根据IBM研究院的数据,IBM的127量子比特的Eagle处理器在猎鹰r5处理器上每秒可以进行2400次电路层操作,在猎鹰r4和r5处理器上的量子量高达128。我们不能从中推断出什么,但这些数据意味着一个30量子比特的系统可以每秒进行数万亿次的浮点运算。
现在,IBM已经成功证明了Eagle R3 处理器在二维横向场伊辛模型的时间演化问题上,击败了超级计算机;不过,这并不是说今天的量子计算机超过了经典计算机的能力。从2022年起,超级计算机仍然有着明显的计算优势——至少对于任何有商业价值的东西来说。
那么,在量子计算机与超级计算机的比较中,我们应该使用什么计算机呢?
尽管它们都有可能改变计算技术,但它们的速度和能力差别很大。现在,更多机构/组织的思考并非聚焦在量子计算机与超级计算机的较量中谁会获胜,而是这两者如何结合、形成一个单一的最高计算单元。
众多机构与组织已经介入,试图鼓励这种硬件的发展与融合。例如,欧洲正建立HPC-量子资源联盟:EuroHPC JU指定了6个量子计算“托管”站点:IT4I-捷克、GENCI-CEA-法国、LRZ-德国、CINECA-意大利、PSNC-波兰和BSC-CNS-西班牙。不同的中心正在探索不同的量子比特模态(光子、中性原子、超导等),并致力于将量子设备带入传统HPC环境中。
6月4日,上海超级计算中心与合肥知名量子初创企业合作,成立了长三角“量超协同”创新中心。该中心成立是国内首个“量超协同”计算基地,承担着试点量子、经典计算设施协同运行的重要使命。
超级计算机无法与量子计算机的速度和功率相比。因为它们可以同时处理几个计算,所以它们非常适合处理需要有效处理大量数据的挑战性问题;超级计算机可以处理更多种类的工作,但它们一次只能处理一个。
但是,当我们明确对比它们时,量子计算机可以被称为超级计算机的一个“子集”,这就成为一个语义上的争论。与超级计算机类似,量子计算机预计将在单一活动中表现出色,而不是取代传统的台式电脑和笔记本电脑。
——它们可能还需要大量的维护和适当监管的数据中心。
完全有可能的是,在未来,我们甚至无法再区分量子计算机和超级计算机:我们可能会简单地把这个市场称为“超级计算或混合环境下的高性能计算”,在这个环境中,我们结合CPU、GPU和QPU来解决极其复杂问题的各个部分。
微软近日发布的量子超级计算机战略或许应证了这一猜想,不过,超级计算机和量子计算机之间冲突的最终结果只有随着时间的推移才会知道。
随着相关科技研究发展,从早期的电子数字计算机到今天复杂的 HPC 系统,高性能计算的突破一直以不断创新和对更高性能的不懈追求为标志。毫无疑问的是,我们正不断突破算力可能性界限,相关技术将在塑造我们对世界的理解和推进人类知识发展方面发挥越来越重要的作用。
现在,我们期待着更多报道进展和发表成果。许多领域的科学家们也都在等待结果:强大的计算机足以筛选他们所有新发现的数据——或许他们将不得不等待一段时间,但这种等待应该是值得的。
展望未来,计算硬件的持续发展有望释放新的可能性并推动各个领域的创新。
参考链接:[1]https://www.nature.com/articles/d41586-018-01683-1[2]https://www.analyticsinsight.net/quantum-computers-vs-supercomputers-what-is-the-difference/[3]https://mp.weixin.qq.com/s/Pf_I3dN9-HyT-QJ30kL9-Q