查看原文
其他

人工智能时代,看好硅光子!

光子盒研究院 光子盒 2024-03-26
光子盒研究院


硅光子学是一种用于制备光子集成电路(PIC)的技术,通常用于产生、检测、传输和处理光。这种方法使用半导体绝缘体上硅(SOI)晶片作为衬底材料,并采用标准的互补金属氧化物半导体(CMOS)半导体技术来制造。
对快速有效的通信技术的需求日益增长,促使硅光子学的研究不断增加。自诞生以来,硅光子学一直在快速发展,并被许多制造调制器、光电探测器和激光器等设备的代工厂采用为一项强大的技术。
与传统方法相比,基于光子技术的计算能耗更低,数据传输速度更快,但制造嵌入光子元件的硅集成电路的成本阻碍了这一技术的发展

FormFactor的开创性Cascade CM300xi-SiPh光子功能系统全面集成了PI的快速多通道光子对准引擎,能够对晶圆上的硅光子器件进行高通量、纳米级精度的光学探测,而无需进一步的客户开发或工程资源

现在,在社交网络和流媒体、基因组学驱动的医学以及“物联网”中联网设备激增等各种应用的推动下,全球对数据的需求正呈指数级增长。
移动计算的增长尤为明显。根据联合国电信机构的数据,到2013年,移动电话用户数量已经接近地球上的人口数量。相比之下,固定电话用户从未超过全球人口的25%。
这些技术和服务所提供的大量机会、以及它们之后所提供的任何机会,将确保人们将继续寻找新的方式,让数据为我们提供连接、娱乐、信息和帮助。但是,数据使用的增加是有代价的。
2009年,谷歌公司曾透露,一次互联网搜索会消耗约1千焦耳的能量。据行业专家估计,到2016年,全球数据中心(由服务器和交换机组成的巨大整体)的耗电量几乎比整个英国高出40%。
此后,由于数据量的增长远远超过了效率的提高,这一数字很可能还会增长。
数据密集型世界面临的另一个挑战是,即使在消费设备层面,数据传输速率也开始超过传统互连技术的能力。例如,最新高清电视的超高像素密度和高帧频使得传统的铜质HDMI电缆越来越难以发挥作用。即使在家庭娱乐系统中相对较短的距离内,此类电缆的信号衰减程度也非常明显。
问题的核心在于,传统的电子数据系统需要对电线进行充放电,才能将数据从A点发送到B点。即使是CPU和RAM芯片内部的微小电线,这种充放电循环也需要能量和时间。
正如美国斯坦福大学应用物理学家和电气工程师戴维·米勒(David Miller)曾指出的,信息处理中使用的大部分能量都用于通信,而不是逻辑。即使在栅极级,能量耗散的主要驱动因素也是充放电导线的电容,每微米导线的电容约为200阿托法拉(10^-18F)。在数据中心一级,最大的服务器群可能消耗整个发电厂的电力,因此,服务器到服务器互连的效率带来了严重的可持续发展问题。
如果将电缆和交换机配置为使用光子而不是电子进行通信,许多问题就会大大缓解
光子学在计算和通信领域的应用前景实际上远不止于此,还包括逻辑和处理的新可能性以及量子计算的某些方法。这些应用都是近期到中期内的事情,但光子互联技术如今已经出现,其优势包括可扩展性、容量、并行性、更长的链路长度和速度。甚至消费应用也能从中受益。
现在,光HDMI电缆可在商业实用电缆长度上支持宽度为4000或8000像素(甚至更宽)的显示器的高帧频,而光USB和Thunderbolt实现的数据传输速率正在达到40Gbps及以上。
快速解决方案:PI公司的“并行数字梯度搜索”固件使硅光子系统设计人员能够快速调整光学元件,从而实现最大功率传输。优化过程所需的时间仅为老式顺序技术的 1%
然而,制造这些光子设备并非易事。
当然,制造过程的起点与几十年来在微电子领域无处不在的硅晶圆相同,它使用标准半导体工厂中的许多制造工具,将光学元件和电路与微电子元件一起(或代替微电子元件)印制到晶圆上。
从根本上说,光子并不像电子那样遵循相同的物理学原理。将光子从封装“芯片”内的一个元件引导到另一个元件,并不像将两者焊接在一起那么简单。
首先,对准公差要严格得多;将导线连接到芯片上的接触垫,需要将元件对准到正确位置的几十微米之内,而将光纤连接到光子芯片则需要高出三个数量级的精度。幸运的是,得益于巧妙的设备工程和一些突破性的微型机器人工业自动化技术,科学家们正在克服这些挑战,将高吞吐量光子互连技术带入主流。

制造利用光子传输信息的系统所面临的挑战并不新鲜。
事实上,这些挑战至少可以追溯到20世纪90年代末,当时光子技术首次被大规模应用于取代长途电信中的卫星链路。当时,要将光从(那时)新颖的激光二极管传送到单模光纤中,需要费力地调整两个元件的位置,然后才能将激光的光有效地耦合到光纤中。
一种名为梯度搜索(gradient search)的模拟技术是部分解决方案,它能使定位系统快速达到最佳传输值(至少对于模态轮廓平滑的光纤而言)。
然而,定位系统本身也有很大的局限性。它们通常比较脆弱,移动范围有限,而且容易偏离准线——这对于部署在工业环境中的系统来说可不是什么好品质。通过开发梯度搜索的数字版本,并将其部署在工业级运动硬件上,最终解决了这一问题。两者的结合为制造坚固耐用的光纤互连硬件提供了前进的道路。

如今的光子数据设备更加精密和复杂。在一个晶圆上可以制造数千个光子集成电路 (IC),为同时处理多个光通道提供了诱人的潜力,从而提高了容量和速度。光子集成电路通常集成了多通道和多波长结构,输入和输出排列成阵列,使每个器件都能处理和传输多通道信息。
如今,以光速移动数据意味着使用特种材料。其中包括磷化铟 (InP)(激光器和其他可在光纤上推动光子的技术的黄金标准)和硅锗 (SiGe)(广泛用于高速混合信号电子器件中,使光受到控制) 。但将所有这些构建模块放入可大规模生产的廉价硅片中是一项巨大的挑战,与在CPU上塞满更多晶体管相比,它会带来一系列独特的问题。
在某些方面,让这些电路相互“对话”所面临的挑战与电信光纤相同。所有芯片级光子输入和输出都需要与其他元件耦合,包括光纤、光纤阵列、基于波导的结构、激光二极管、透镜和光栅等块状元件以及其他芯片。其中许多耦合不仅需要在敏感的横向平面(习惯上称为“XY”平面)上进行细致的对准,还需要在其他自由度上进行对准。重要的是,光子器件阵列不仅必须在XY平面上精确定位,还必须在Z轴方向上精确定位,通常还必须在其他自由度 (DOF) 上精确定位。
另一个复杂问题是,只有通过测量光与光纤的实际耦合,才能主动进行必要的对准。这是因为在组装过程中,通常用于确定器件位置的机器视觉方法无法解决数十纳米的空间公差问题,而被动对准方法(如将光纤粘在适当位置的精密V形槽)通常需要不切实际的器件复制公差。
原则上,20世纪90年代的数字梯度搜索仍可用于硅光子学中光学元件的对准。但在实践中,由于涉及的阵列元件数量较多,再加上需要进行多多维度优化,因此寻找全局最优对准的过程并不简单。例如,在θ-Z轴上移动某个元件,由于机械旋转轴与光轴不完全重合,将不可避免地导致其在XY平面上失准。
这个问题通常采用“循环”(loop)方法来解决:在XY轴上对齐元件;在Theta-Z轴上进行微小改进;返回XY轴并重新对齐;然后反复进行,直到结果令人满意为止。循环法还可用于优化器件(如硅光子学中常见的短多模波导结构),这些器件在通道之间以及输入和输出之间存在相互作用。
在这种情况下,首先要优化输入,然后再优化输出:只不过现在输入已不再优化,所以要循环进行,直到达到一致的最佳值。优化过程完成后,数字梯度搜索技术可以跟踪元件的排列,确保元件在热变化和固化胶合元件的应力作用下保持优化。
但有一个问题:循环的速度太慢,对于测试和随后从每个晶圆上组装成千上万个器件来说不切实际。要了解其中的原因,请考虑晶圆制造的早期阶段。

与传统的微电子制造一样,硅光子晶片的制造成本只占封装芯片成品价格的一小部分。由于硅片的产量绝非100%,因此在进入封装阶段之前丢弃有问题的器件具有良好的经济效益,因为封装阶段的成本要高得多。
在微电子制造过程中,这种质量控制流程是使用称为晶圆探测仪的专用工具来完成的,这种探测仪通常通过架子上的精密仪器,让每个芯片与精确的针状电极接触,刺激芯片并观察其反应。
然而,要在光子芯片上进行同样的测试,仅仅进行电接触是不够的。还必须将光耦合进和耦合出芯片的嵌入式光子电路,并通过光学手段测量芯片的性能。阵列元件带来了特殊的挑战,因为这些器件必须旋转到精确匹配的方向,并转换成紧密的横向排列。传统上,此类优化需要逐步进行,角度调整与横向重新对齐交错进行,以补偿光轴与旋转轴之间的任何不匹配。这可能需要数分钟的时间,考虑到每个晶片可能包含数千个硅光子芯片,这个时间长度是不可接受的(也是不经济的)。
最近,一种新的数字梯度搜索方法出现了,它使工业定位器能够同时在多个通道、输入和DOF上进行梯度搜索。这种技术无需在数分钟内反复进行θ-Z与XY修正交错的小运动,而是可以同时进行XY和θ-Z对齐,并行使用两个梯度搜索过程。这种并行数字梯度搜索(PDGS)方法可以扩展到每个设备的全部六个自由度,即使输入、输出和通道之间存在相互作用,多个定位器也可以在设备的多个输入和输出上协同工作。
有了PDGS,循环(例如)阵列设备的XY和theta-Z对齐的长达数分钟的串行过程只需一秒钟左右,节省了99%的时间。
该技术的并行性还意味着整个过程的时间几乎与所执行的调整次数无关。这一点意义重大,因为在制造过程中(和许多事情一样),时间就是金钱。毫不奇怪,晶圆探测仪的制造商和用户率先采用了使用PDGS的微型定位机器人,并于2016年首次实施。微型机器人还被应用于制造商装配流程的其他领域,例如将芯片和其他元件对齐封装在一起。一些制造商甚至采用了专门的测试工具,在封装流程的中间步骤重新验证芯片的健康状况。
硅光子设备制造过程中使用的工业级六DOF六足微型机器人和其他精密机械的固件中也采用了这种并行流程,从而改变了硅光子行业不利的经济状况。

硅光子学是一种利用硅基材料操纵和传输光的技术,用于创建低延迟计算和互连解决方案。其主要优势之一是能够将光学元件与电子元件集成到一个封装中;这样就可以创建高度集成的系统:既能处理电子信号,又能处理光信号,从而有可能制造出更高效、更紧凑的设备。
关于如何使用光子学来改进当今的设计,存在着许多误解。人们了解光子学的潜力,但它是否已准备就绪,可以投入使用?
总的来说,硅光子技术的价值在于它有潜力实现传统电子电路无法实现的新技术和新应用,以及提高现有技术的效率和性能。那么,出现了哪些“谣言”呢?我们将探讨其中的11项,并提出证据予以揭穿。
1)不错的研究项目,但目前在商业上不可行
近年来,硅光子技术因其提供高速数据传输、增加内存带宽和低功耗的潜力而备受关注。虽然硅光子技术的实施仍面临一些挑战,但它已在各种应用中显示出良好的商业可行性。
Lightelligence的“蜂鸟”(Hummingbird)oNOC平台通过硅光子技术实现了创新的互连拓扑结构,从而提高了计算性能。其波导以光速传播信号,并利用全对全数据广播网将信号传输到64核特定领域人工智能处理器芯片上的每个内核

其中一种应用是数据中心互连,它可以提供高带宽、低延迟、低功耗和机架到机架的连接。如果不使用中继器,高速铜缆连接会受到长度限制。硅光子技术可在服务器、图形处理器和内存池之间提供延迟更低的计算高速链路(CXL)连接,从而改善数据中心互连。
硅光子技术采用标准CMOS制造工艺,可降低制造成本和复杂性,使其成为更可行的商业解决方案。
2)CMOS将根据摩尔定律继续扩展
自半导体工业诞生以来,计算能力的提高可以用摩尔定律来描述:晶体管密度每18个月翻一番,使CMOS芯片在保持恒定能耗和面积消耗的同时,不断提高计算能力。
随着芯片制造工艺向5纳米和3纳米发展,晶体管密度已接近其物理极限。摩尔定律正在放缓,传统的单芯片计算能力提升途径已难以为继。
硅光子技术将允许继续扩展,超越摩尔定律的极限。目前,数字芯片受限于底层元件:CMOS晶体管的物理极限。
光信号和器件遵循不同的物理原理:光信号的相互作用通常是线性的,可以映射为线性计算。随着时间的推移,它们将使光学计算加速器的性能超过CPU和GPU。
3)硅光子学的用例非常狭窄
硅光子学是一种以硅为平台进行光的产生、操纵和检测的技术。在通过光纤连接传输信息的电信和数据中心应用中,这是一项成熟的技术。
现在,它已被应用于其他计算需求,在这些需求中,系统扩展需要高带宽和低延迟,并有可能给各行各业带来革命性的变化。
一些应用包括:
- 数据中心互连,用于长距离高速传输大量数据。- 高性能计算,将多个处理器连接在一起,实现更快的数据传输,减少大内存池的I/O带宽。- 提高数据传输容量和速度的电信网络。- 用于自动驾驶汽车和其他自动驾驶车辆的激光雷达系统,实现精确的距离测量。- 量子计算,用于控制和操纵量子比特,为更快、更高效的量子计算打开大门。
4)光子学需要方法上的重大转变
利用硅光子学需要将现有方法从传统电子学扩展到光子学。在电子学中,信息是通过电子传输和处理的。而在光子学中,信息是用光来传输和处理的:制造光子集成电路需要一套不同的设计规则、制造工艺和测试方法。
在系统中使用光子集成电路可充分利用现有的方法和设计规则。许多光子集成电路采用共同封装配置的电子集成电路,将电信号转换为光信号,再将光信号转换为电信号。由于光信号是器件内部的信号,因此这种应用对系统设计者来说是透明的。
5)硅光子技术应用需要很高的学习曲线
制造硅光子设备的学习曲线不像其他新兴技术那样陡峭。硅光子技术涉及多个学科的整合,包括电子学、光学、材料科学和制造技术。
采用硅光子集成电路与电子集成电路类似,因为光子集成电路通常与电子集成电路共同封装。这些集成电路通常具有电气接口,在系统设计中的表现与其他集成电路类似。
6)数字集成电路和光子集成电路很难集成
数字集成电路和光子集成电路是可以集成的,一些公司在生产光子集成电路时采用了混合集成方法,以确保其可靠性和性能。
混合集成方法通常用于集成电子和光子集成电路,方法是分别制造数字电路和光子电路,然后将它们粘合在一起。这可以通过倒装芯片键合、导线键合或焊接键合等各种技术来实现。
混合集成电路的设计和制造需要仔细考虑多个因素,包括热管理、电气和光学耦合以及封装。由于数字电路会产生大量热量,从而影响光子电路的性能,因此热管理对于确保集成电路的可靠性和稳定性至关重要。
7)人工智能/机器学习(AI/ML)工作负载将继续在GPU上扩展
人工智能/机器学习(AI/ML)工作负载无需使用光子技术即可在GPU上进行扩展,由于GPU能够处理并行处理任务,因此是人工智能/机器学习(AI/ML)训练的主力军,这对训练大型模型至关重要。由于最近GPU性能的提高,它们可以处理日益复杂的AI/ML工作负载。
然而,随着AI/ML工作负载的复杂性和规模不断增长,GPU和其他处理单元之间需要更快、更高效的数据传输。这正是光子学可以发挥作用的地方,它可以在GPU、CPU和其他处理单元之间实现高速、低延迟的互连,从而提高效率和数据传输速度。
随着人工智能/ML模型变得越来越复杂,将需要专门的硬件加速器,如张量处理单元 (TPU) 和现场可编程门阵列 (FPGA)。这些加速器可以使用硅光子技术,通过低延迟 CXL 连接实现高效互连和数据传输。
此外,新型光子加速器使用低延迟光NoC(片上光网络或 oNoC)来提高人工智能工作负载的性能和吞吐量。就特定功能而言,这些加速器比最先进的GPU快达800倍。
8)3纳米的数字芯片性能更好
很难直接比较3纳米数字芯片和硅光子芯片的性能,因为它们是针对不同的应用设计的,使用不同的指标来衡量性能。选择取决于具体的应用要求和设计考虑。
3纳米数字芯片设计用于处理数字信息,如执行算术运算、逻辑功能和内存操作。它们针对高速计算和低功耗进行了优化,这对移动设备、数据中心和高性能计算等应用至关重要。
硅光子芯片主要用于传输和处理光信号。它们针对高速数据传输和低功耗进行了优化,这对数据通信、传感和医学成像等应用至关重要。
虽然在数字处理任务方面,3纳米数字芯片的性能可能优于硅光子芯片,但硅光子芯片有可能为长距离数据传输提供更高的带宽和更低的延迟。例如,光子技术可用于改善数字芯片对内存的访问,大大减少内存I/O瓶颈。此外,硅光子芯片还能为某些对降低功耗至关重要的应用提供更高的能效。
9)光学NoC太小,不实用
光学NoC有可能在片上处理单元之间提供高带宽、低延迟的通信。实用性取决于各种因素,如成本、功耗、可靠性和可扩展性。
实现光学NoC的成本需要专门的组件,如激光器、调制器和检测器,这些组件的制造和集成成本可能很高。虽然与电子通信相比,光通信的功耗较低,但激光器和调制器等光学元件的功耗仍然很高。
与数字芯片相比,光学NoC具有几个关键优势。由于数字芯片之间的连接使用的是光,因此光学NoC的延迟极低,可以同时与整个设备的所有节点进行通信。这就解决了数字集成电路的近邻问题,使新的拓扑结构得以考虑。
与数字NoC不同,光学NoC并不局限于单个网罩。通过晶圆拼接,光学NoC在使用通用芯片互连快车(UCIe)等用于芯片间数字接口的标准时,可提供晶圆级密度。
10)CXL适合铜互连,不适合光互连
CXL是一种高速互连标准,旨在实现CPU、GPU、内存和其他处理单元之间的通信。虽然最初版本的CXL使用的是电气互连,但人们对利用光互连实现一米以上的CXL越来越感兴趣。
与电气互连相比,光学互连可提供更高的带宽、更低的延迟和更低的功耗,尤其是在更远的距离上。在一米以上的 CXL 中使用光互连还能实现更灵活的系统设计和部署。利用光互连,可以将处理单元放置得更远,从而实现更灵活的系统配置,并减少对复杂布线的需求。
11)其他技术更有前途
硅光子技术正被用于计算系统中的高速互连,包括处理器、内存和其他组件之间的互连。另一项应用是开发与电子集成电路共同封装的光子集成电路。这些封装为计算系统组件之间的数据传输提供了更紧凑、更高效的解决方案,减少了对复杂布线的需求,提高了系统的整体性能和功耗。

总之,近年来,硅光子已成为数据中心的关键构建模块之一。它利用光子的力量长距离快速有效地连接交换机、服务器和其他设备。
但随着带宽需求的不断上升,硅光子学必将变得更加重要。随着摩尔定律的衰落对科技行业造成影响,业界公司正试图将硅光子学更深入地推向数据中心。
例如,英伟达(NVIDIA)表示,该公司正在一些“前沿”数据中心系统中设计基于GF Fotonix的高带宽、低延迟、高能效光互连,以处理日益繁重的人工智能工作负载。
GF Fotonix的一个优势是单片架构降低了数据传输中的错误发生率,将延迟降低了10倍,这反过来又为人工智能工作负载带来了更高的吞吐量。
为了让自己的工作更轻松,英伟达与Ayar Labs合作,后者是一家设计光学互连的初创公司,可以将其捆绑到各种处理器和加速器中。这种互联以芯片组的形式出现,可以封装到从CPU到GPU的各种设备中,提供比电气I/O高1000倍的带宽,而功耗仅为后者的十分之一。
依靠硅光子技术实现量子计算的初创公司Xanadu也获得了GF Fotonix的支持

随着每年制造出更多更先进的光学设备,硅光子应用范围将继续扩大。例如,通过为微型机器人配备纳米级的眼睛,这项技术可以优化硅光子学和其他制造领域中多个光学元件的位置,从而使精确定位与计算、成像和许多其他光子学技术领域的新篇章保持同步。
硅光子技术具有更高的带宽,支持更快的通信,因此在各个领域都具有吸引力。此外,机器学习(ML)和人工智能(AI)应用的激增也进一步加强了对硅光子技术的需求。
2022年,硅光子技术市场价值为16亿美元,预计到2032年将增至194亿美元,2023-2032年复合年增长率(CAGR)为25.4%。2022年,北美在硅光子市场占据了37%的市场份额,占据了突出的地位。专家预计,从2023年到2032年,亚太地区硅光子市场的复合年均增长率将超过28%。
总之,硅光子技术是计算和数据通信领域的创新灯塔,为实现更快的通信提供了具有成本效益和高能效的解决方案。随着硅光子学新兴趋势的发展,该领域在未来几年有望取得前所未有的进步。
参考链接:[1]https://www.electronicdesign.com/technologies/industrial/article/21267392/lightelligence-11-myths-about-silicon-photonics[2]https://www.electronicdesign.com/technologies/embedded/article/21270649/electronic-design-silicon-photonics-will-shine-in-the-age-of-ai[3]https://physicsworld.com/a/the-promise-of-silicon-photonics/[4]https://www.electronicdesign.com/technologies/embedded/article/21239005/electronic-design-globalfoundries-its-time-for-silicon-photonics-to-shine[5]https://www.azooptics.com/Article.aspx?ArticleID=2510


相关阅读:
出售硅光子收发器产品线!英特尔再次剥离光模块业务
“硅光子温度传感器”!用小型光子芯片制造功能强大的温度传感器
硅光子,缘何打造量子科技的下一个十年?
Nat. Electron.:一种集成CMOS的硅光子发射器
硅光子学是释放人工智能全部潜力的关键

#光子盒视频号开通啦!你要的,这里全都有#

每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!


|qu|cryovac>
你可能会错过:|qu|cryovac>
|qu|cryovac>

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存