其他
一作+通讯,Science!
研究背景
研究问题
要点:1.本研究通过交替使用模拟可编程单元MVM操作的序列来建立一个混合PNN。PNN的参数是由可编程的相移η→∈[0,2π)D,其中D代表PNN相移器的数量。在数学上,以下的“推理”函数序列转换了输入x=x(1),并且以“前馈”方式进行到输出zˆ:=x(L+1)(图1A至D)。
要点:1.每个MZI都由热光学移相器进行参数化,该移相器利用来自独立控制驱动板的电流对波导进行局部加热(图2A和B)。移相器被放置在所有MZI的输入(ϕ,电压V ϕ)和内部(θ,电压Vθ)臂上,以控制红外C波段(1530至1565纳米)光的传播模式,从而实现任意的单元矩阵乘法。2.本研究将一个任意的4×4单元矩阵乘法嵌入到一个6×6的三角形MZIs网络中。这种配置在4×4 “矩阵单元”的两端加入了两个1×5的光子网,能够发送任何输入矢量x并测量公式1和2的任何输出矢量y。这些“发生器”和 “分析器”的光学输入/输出(I/O)电路(图1E和2B)需要校准的电压映射θ(Vθ), ϕ(V ϕ)来控制光学相位。3.本研究在实验中通过对光功率测量的数字处理来估计矩阵优化问题的模拟梯度测量的准确性(图2D)。本研究将一连串的输入编程到我们芯片的发生器单元中,并记录下在pη,+和pη,-之间振荡的方波响应,然后分别减去这两个测量值,从而找到相对于η的梯度。
要点:1.为了测试整体的片上训练,本研究评估了原位反向传播的准确性,使用Python软件的数字减法协议训练多层PNN(图3A)。通过训练芯片来实现L=3层,N=4个端口,以根据数据点的空间位置,将使用Scikit-Learn(33)在2D空间中生成的标记噪声合成数据分配给0或1标签(图1A;图3E和H)。本研究进行了80%:20%的训练-测试分割(200个训练点,50个测试点),只对训练点进行训练,以避免过度拟合。2.在数据集的训练过程中,在准确梯度计算所需的所有波导段中,光栅抽头到相机监视器测量的预测和测量功率显示出极好的一致性(图3B)。图3C中的训练曲线表明,随机梯度下降对预测和测量的曲线来说都是一个高噪音的训练过程,这是因为关于边界的合成数据集有噪音,而且本研究选择的是单例训练,而不是批量训练。3.这些大的波动在模拟和测量的训练曲线之间显得大致相关(图3E),本研究成功地达到了93%的训练和96%的测试模型准确率(图3D)。然后对卫星数据集进行了训练,应用同样的程序,达到了87%的训练和94%的测试模型准确率(图3F,绿色对红色)。当使用预测的相位和测量的振幅时,本研究将梯度误差平均减少了大约一个数量级,从而获得了95%的训练和98%的测试模型准确性,这与数字训练一致(图3F至H)。这一改进强调了准确的相位测量对提高训练效率的重要性。通过使用集成雪崩光电二极管、无创光监测或基于移相器的功率监测来提高信噪比,可以进一步减少监测误差。
要点:1.鉴于本研究对N=4个PNN的实验结果显示了硬件错误影响训练的证据,本研究在MNIST手写数字数据集上评估了N=64的PNN在存在错误的情况下的可扩展性,以更好地了解规模上的相对贡献。本研究在Simphox中使用JAX和Haiku实现了一个PNN模拟框架,以模拟给定系统和噪声误差的网格搜索的原位反向传播训练。在使用M=600的100个小时后,在理想的情况下,实现了大约97.2%的最大测试精度,平均精度大约为95%(图4B和C)。由光电探测器噪声和相移量化及校准误差引起的相位和振幅误差对误差收敛的影响最大。总的来说,本研究的MNIST模拟结果表明,原位反向传播在规模上对噪声和硬件错误是相对稳健的,而这些在目前的模拟计算系统中很难完全消除。2.本研究还考虑了优化的模拟梯度更新方案的能量和延迟与精度的权衡,假设目前最先进的电子元件与有源光子元件共融。总的来说,本研究的模拟结果(图4)和能量计算轮廓表明MNIST训练的性能下降最小,同时反向传播的能效提高了三倍。
结语
原文链接:https://www.science.org/doi/10.1126/science.ade8450
相关推荐1. 仪器表征基础知识汇总2. SCI论文写作专题汇总3. Origin/3D绘图等科学可视化汇总4. 理论化学基础知识汇总5. 催化板块汇总6. 电化学-电池相关内容汇总贴7. 研之成理名师志汇总更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。