查看原文
其他

浙大团队开发存算一体新硬件,同时具备高精度编程和快速写入能力,在阵列级应用获成功验证

刘雅坤 DeepTech深科技 2024-02-01



如何来理解在线学习芯片、电化学存储器器件和线性三者之间的关系呢?如果说在线学习芯片是一座“房子”,那么,电化学存储器器件就是构成这座房子的“砖块”,而线性就是“砖块”中最重要的特性,即器件电阻的改变量与外加电压脉冲的数量,或脉宽具有准线性的数值关系。
         

 

近期,浙江大学团队开发出一种新型电化学人工突触器件,利用氧离子在空间可逆运动实现器件权重在标准刺激脉冲下线性改变(以下简称为“线性更新”)的重要特性,仅通过单次开环形式的写入过程,便能够实现较高的权值精度。
         

 

该研究展示了阵列级的精确阻值更新能力和神经网络训练能力,突破了以往存算一体器件无法直接实现高精度权重更新的难题,为面向在线学习的存算一体系统设计提供了全新的硬件解决方案。
         

 

值得关注的是,该器件通过单脉冲能够实现从一个阻态到另一个阻态的精确调控,可以用单个脉宽调制的电压脉冲,比较准确地更新器件的电阻值。“这种独特的能力是以往其他非易失存储器中无法实现的,也为存算一体和类脑计算芯片设计带来新的可能。”该论文共同通讯作者、浙江大学研究员表示。

图丨林芃(来源:)
         

 

神经网络训练的特点是权重更新频繁。在器件层面,需要频繁地改变器件阻态,而每次权重更新的开销,可直接影响到在线学习系统的整体性能。为解决上述问题,研究人员在两个方面进行了创新。
         

 

一方面,利用离子晶体管自身的离子迁移特性实现线性更新,离子晶体管的阻变过程,归结于整个晶体管沟道离子浓度的平滑改变。相比于忆阻器的局部导电细丝型阻变特点,其阻变过程更容易实现线性变化。
         

 

另一方面,在实现阵列级集成的问题方面,该课题组进行了器件及阵列加工集成方面的系列改进,使器件线性更新的性能在阵列中复现,最终实现多个原型应用。

从本质上来看,人们赖以生存的物质世界是非线性易得、线性难求的。该研究中的电化学存储器器件依赖于电场驱动下的离子运动工作,通过对器件材料选择和结构设计方面的系统性调控,最终实现了线性阻变特性,并完成了阵列级的应用验证。
         

 

    
图丨相关论文(来源:Nature Communications
         

 

近日,相关论文以《开环模拟可编程电化学存储器阵列》()为题发表在 Nature Communications[1]。浙江大学博士后陈鹏为论文第一作者,浙江大学教授、研究员为该论文共同通讯作者。
      
由问题驱动的课题
         

 

、课题组的研究方向涉及类脑计算的多个领域,在基于新型电子器件的存算一体技术方向,已经开展了多年的研究工作。在此前的工作中,他们主要研究一种称为“忆阻器”的新型阻变存储器,可以简单理解为具有“记忆”的电阻元件。

忆阻器不仅是一种可编程电子元器件,而且具备很高的集成密度,人们还可以将神经网络直接部署到忆阻器阵列中,从而有效解决冯·诺依曼架构计算机中处理器与内存间的大量数据搬运问题。
 

同时,忆阻器阵列在外加电压输入的情况下,通过电流传递电压和电阻间的乘加结果,用这种很自然的方式完成矩阵运算,这样集存储与计算一体的新型硬件计算方式称为“存算一体”。   
         

 

此前,运用忆阻器实现了卷积神经网络的硬件加速演示,展示了世界首个三维忆阻器阵列计算系统,并首创了具有生物相似性的忆阻器阵列拓扑结构[2]。 


(来源:Nature Electronics
         

 

   

另一方面,他们与麻省理工学院、清华大学合作,开发了感存算一体的可重构类脑计算系统,并首次实现异质异构集成的感存算一体可重构计算系统等应用[3]等(此前 报道:MIT、浙大及清华团队研发感存算一体架构的 AI 芯片,通过类似“乐高”的堆叠方式为电子设备按需升级换代)。 

         

 

(来源:Nature Electronics)
         

 

经过多年的研究,忆阻器技术逐渐成熟,已经能够实现芯片级的阵列集成。然而,忆阻器存在一个天然的技术瓶颈,即器件编程精度不够,很难通过一次编程达到准确的阻态,而往往需要几十个读写周期的调整,这导致神经网络在忆阻器阵列中部署的开销较大。   
         

 

另一方面,存算一体技术在神经网络训练加速方面,还存在技术路径不清晰、缺乏实验验证等方面的问题。存算一体技术更有意义的任务之一,是直接训练已经部署在阵列中的神经网络权值,以实现对神经网络训练的加速。但是,如果器件阻态调控精度不够,训练效率便无法提升。对于该领域来说,这仍是一个长期的“悬而未决”的难题。
         

 

图丨一种具有良好的开环可编程性的电化学存储器阵列(来源:Nature Communications
         

 

在问题的驱动下,他们开始寻求底层器件和工艺方面的创新,试图通过这种方式突破以上技术瓶颈。他们关注到一种新型离子晶体管器件,也称“电化学随机存储器”(electrochemical memory,ECRAM),其工作原理类似于电池的充放电过程。受此启发,研究人员对展示这种器件精确阻态调控的特点的相关文献进行查阅。
         

 

   
他们注意到,这种器件的研究停留在单个器件层面,并没有真正地运用到在线学习任务中。“于是,我在 2021 年回国后,和教授(课题组组长)及博士后陈鹏,一起开始了这项研究,以构建一个真正具备在线学习优势的存算一体系统。”表示。
         

 

有望应用在人工智能算法加速、脑机接口等领域

         

 

在研究伊始阶段,研究人员首先遇到的问题是设计器件的结构和选择相应的材料体系。参考已有文献报道,他们很快得到 1.0 版本的原型器件。都说“万事开头难”,最初的器件性能与他们的预期相差甚远。
         

 

“经过数月反复的讨论和实验,我们更换了器件的栅极结构设计、沟道材料及其制备方法,进而发现二者对于器件线性阻变特性具有显著的影响。”该团队回忆道。基于此,能够很好地控制器件与器件之间的性能差异,也为后续阵列集成打下了基础。
         

 

受限于当时的测试电路规模,要想在有限规模(10x10)的无源电化学存储器件阵列上,验证它在神经网络训练上的优势并非易事。因此,研究人员反复讨论和探索如何增加研究的说服力。并且,还从多个角度论证了芯片系统在在线学习任务的可行性和优势。   
         

 

解释道:“由于测试电路规模受限,我们在构建小型神经网络在线训练系统的基础上,想到可以通过周期性向阵列内写入梯度图案的方式,来模拟其在神经网络训练中的高频次权值更新过程。” 
         

 

图丨ECRAM 阵列可以通过单次开环形式实现不同权值图的快速交替写入(来源:Nature Communications
         

 

一般来说,新型存储器阵列可以用图片写入的准确性,作为评估与展示其编程性能的手段之一。但是,10x10 阵列的显示内容比较有限,复杂图案压缩到这个像素密度后会难以辨认。最后,他们用几个卡通像素图进行图像存储,并获得理想的展示效果。
         

 

        

 

在器件更新的方式方面,研究人员通过器件内在阻变与刺激脉冲宽度的线性关系,直接获得线性更新,实现单个脉冲相对精确地调整器件阻态的调控能力。忆阻器等其他器件普遍需要几十个以上读写周期,与之相比,该器件的更新效率显著提升,更适合神经网络在线学习的任务。   
         

 

在器件的功能验证方面,研究人员实现了阵列级的性能演示,这是首次展示出在阵列中单脉冲精确写入图片的能力。“这从一定程度上说明了该器件的可用性,相比于以往单器件层面的实验结果,具有更强的说服力和技术成熟度。”说。
         

 

该论文也得到了审稿人的高度认可。其中一位审稿人对该论文评价称,该研究肯定会引起人们对这类非易失性存储元素的进一步兴趣,以及人工智能中更可持续和可扩展的计算应用。另一位审稿人则认为,该研究对改进电化学随机存储器技术具有很好的示范作用。
         

 

图丨ECRAM 在线学习功能展示与性能评估(来源:Nature Communications
         

 

该研究中的离子晶体管器件特点鲜明,研究人员希望以这项研究为契机,将存算一体技术拓展到高效在线学习任务上。一方面,他们期望通过该研究吸引更多的同行关注,并加入到离子晶体管和在线学习硬件的研究;另一方面,也希望进一步提高系统的各项参数,从器件、电路与系统多个角度将该项技术做得更加实用,为大型神经网络的训练提供一套独特的解决方案。
         

 

   
目前,该器件处于原型验证功能的阶段。该研究是一个“好的开端”,其“终极目标”是构建一个完整的计算系统。接下来,他们计划提升器件的性能。通常来说,系统规模越大,对器件的要求越苛刻;另一方面,系统集成中也蕴含着大量的工程技术问题。
         

 

因此,这项技术如果想从科学研究走到技术落地,还有许多要解决的问题。表示,“我们将力争在短期内打造出功能更加完善的在线学习系统,以实现在人工智能算法加速、脑机接口等领域的应用。”
         

 

现阶段,AI 算法的规模在不断地扩大,而芯片集成规模由于摩尔定律的失效变得越来越难。利用新器件、新系统来进一步提高计算芯片的算力与效率是必然的发展趋势,但也需要在芯片设计与制造的各个层面持续创新,进一步扩展器件功能、完善器件性能、优化系统设计等。
         

 

近年来,忆阻器系统的快速发展为新器件在计算芯片领域的应用,提供了宝贵的经验。研究团队希望能将这些经验与新器件相结合,设计支持在线学习的高性能芯片,弥补存算一体芯片在神经网络训练方面的不足。

         

 

参考资料:
1.Chen, P., Liu, F., Lin, P., Li, P., Xiao, Y., Zhang, B., Pan, G., Open-loop analog programmable electrochemical memory array. Nature Communications 14, 6184 (2023). https://doi.org/10.1038/s41467-023-41958-4
2.Lin, P., Li, C., Wang, Z. et al. Three-dimensional memristor circuits as complex neural networks. Nature Electronics  3, 225–232 (2020). https://doi.org/10.1038/s41928-020-0397-9    
3.Choi, C., Kim, H., Kang, JH. et al. Reconfigurable heterogeneous integration using stackable chips with embedded artificial intelligence. Nature Electronics 5,386-393(2022). https://doi.org/10.1038/s41928-022-00778-y

运营/排版:何晨龙





01 / 复旦团队提出多温度控制方案,从单区域保温拓至多区域保温,将显著提升物流运输控温效果

02 / 科学家破解“不老神兽”长寿基因,并成功迁移用于家鼠,将后者寿命延长约4.4%

03 / 科学家提出化学合成新路线,拓宽经典有机反应的应用范围,为烯烃臭氧化合成提供新模式

04 / 科学家揭示肿瘤免疫逃逸新机制,鉴定三个癌症生存相关因子,为肿瘤免疫治疗注入新动力

05 / 清华团队研发光电融合芯片,算力是商用GPU的3000余倍,推动构建生态友好的AI计算框架


继续滑动看下一个

浙大团队开发存算一体新硬件,同时具备高精度编程和快速写入能力,在阵列级应用获成功验证

刘雅坤 DeepTech深科技
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存