查看原文
其他

英特尔全新晶体管性能提升可媲美节点升级!计算架构新黄金十年开启?

包永刚 芯基建 2021-01-16

经过多年对FinFET晶体管技术的改进,英特尔10nm SuperFin技术带来的性能提升可与完全节点转换相媲美。

 作者 | 包永刚 

雷锋网消息,英特尔首席架构师Raja Koduri和多位英特尔院士、架构师在英特尔2020年架构日上详细介绍了英特尔在六大技术支柱方面的最新进展。首次展示了英特尔全新的10nm SuperFin技术,并首次介绍了可实现全扩展的Xe图形架构,还有Willow Cove微架构和用于移动客户端的Tiger Lake SoC架构细节,先进封装技术、混合架构等。
英特尔在架构日上展示的制程&封装、XPU架构、内存&存储、互联、安全、软件的进展,是否表明了英特尔开启了计算架构创新的黄金十年?

全新10nm SuperFin技术可媲美节点转换

智能化时代快速增长的算力需求与先进制程提升的速度之间的差距越来越大,晶体管的微缩也面临着越来越多的物理极限挑战,业界正通过技术创新去解决挑战。Raja Koduri表示,经过多年对FinFET晶体管技术的改进,英特尔正在重新定义该技术,以实现其历史上最强大的单节点内性能增强,带来的性能提升可与完全节点转换相媲美。

英特尔推出的全新晶体管技术10nm SuperFin技术实现了英特尔增强型FinFET晶体管与Super MIM(Metal-Insulator-Metal)电容器的结合。

SuperFin技术能够提供增强的外延源极/漏极、改进的栅极工艺和额外的栅极间距,并通过以下方式实现更高的性能:
  • 增强源极和漏极上晶体结构的外延长度,从而增加应变并减小电阻,以允许更多电流通过通道。
  • 改进栅极工艺以实现更高的通道迁移率,从而使电荷载流子更快地移动。
  • 提供额外的栅极间距选项可为需要最高性能的芯片功能提供更高的驱动电流。
  • 使用新型薄壁阻隔将过孔电阻降低了30%,从而提升了互连性能表现。
  • 与行业标准相比,在同等的占位面积内电容增加了5倍,从而减少了电压下降,显著提高了产品性能。该技术由一类新型的“高K”( Hi-K)电介质材料实现,该材料可以堆叠在厚度仅为几埃厚的超薄层中,从而形成重复的“超晶格”结构。

Raja说:“这是一项行业内领先的技术,领先于其他芯片制造商的现有能力。”
据悉,10nm SuperFin技术将运用于代号为“ Tiger Lake”的英特尔下一代移动处理器中。搭载Tiger Lake移动处理器的产品将在今年假日季上市。

晶体管技术创新的同时,更为重要的可能是架构创新。去年2017 年图灵奖的两位得主 John L. Hennessy 和 David A. Patterson发表了一篇长报告《A New Golden Age for Computer Architecture》,详细描述了引发计算机架构新时代到来的种种变化,并且展望未来的十年将是计算机体系架构领域的“新的黄金十年”。
英特尔在2020年架构日上展示了从CPU到GPU的多个架构的最新进展。

Tiger Lake与最新Willow Cove CPU及Xe GPU微架构

Tiger Lake是英特尔第一个在SoC架构中采用全新 Xe-LP图形微架构。Tiger Lake基于全新的Willow Cove CPU核,有显著的频率。GPU采用全新的Xe图形架构,每瓦性能效率有显著提升。加上电源管理、结构和内存、I/O、显示灯方面的提升,Tiger Lake的性能超越上一代CPU,并实现大规模的AI性能和图形性能的飞跃。

Tiger Lake SoC架构提升具体如下:
  • 全新Willow Cove CPU核心——基于10nm SuperFin技术进步,显著提升频率。
  • 新Xe图形架构 – 具有高达96个执行单元(EUs),每瓦性能效率显著提高。
  • 电源管理——一致性结构中的自主动态电压频率调整(DVFS),提高了全集成电压稳压器(FIVR)效率。
  • 结构和内存——一致性结构带宽增加2倍,约86GB/s内存带宽,经验证的LP4x-4267、DDR4-3200;LP5-5400架构功能 。
  • 高斯网络加速器GNA 2.0专用IP,用于低功耗神经推理计算,减轻CPU处理。运行音频噪音抑制工作负载情况下,采用GNA推理计算的CPU利用率比不采用GNA的CPU低20%。
  • IO——集成TB4/USB4,CPU上集成PCIe Gen 4,用于低延迟、高带宽设备对内存的访问。
  • 显示——高达 64GB/s的同步传输带宽用于支持多个高分辨率显示器。到内存的专用结构路径,以保持服务质量。
  • IPU6 ——多达6个传感器,具有4K 30帧视频、27MP像素图像;最高4K90帧和42MP像素图像架构功能。

Willow Cove

Willow Cove基于最新的处理器技术和10nm的SuperFin技术的英特尔最新一代CPU微架构。Willow Cove在Sunny Cove架构的基础上,极大地提升了频率以及功率效率,实现超越代间CPU的性能提高。

另外,Willow Cove还将重新设计的缓存架构引入到更大的非相容1.25MB MLC中,并通过英特尔控制流强制技术(Control Flow Enforcement Technology)增强了安全性。

Xe 图形架构

关注英特尔的人对Xe架构并不陌生,英特尔在CES上也透露了首款针对PC的独立图形显卡DG1。在今天的架构日上,英特尔首次详细介绍了可实现全扩展的Xe图形架构。Xe图形架构有Xe-LP、Xe-HP、Xe-HPC三个系列,加上今天新推出的Xe微架构变体Xe-HPG,目前已有四个系列Xe微架构。

  • Xe-LP是针对PC和移动计算平台的最高效架构。最高配置EU单元多达96组,并具有新架构设计,包括异步计算、视图实例化 (view instancing)、采样器反馈(sampler feedback)、带有AV1的更新版媒体引擎以及更新版显示引擎等。
  • Xe-LP将使新的终端用户功能具备即时游戏调整(Instant Game Tuning)、捕捉与流媒体及图像锐化。软件优化方面,Xe-LP将通过新的DX11路径和优化的编译器对驱动进行改进。
  • Xe-HP是业界首个多区块(multi-tiled)、高度可扩展的高性能架构,可提供数据中心级、机架级媒体性能,具有可扩展性和AI优化。Xe-HP涵盖了从一个区块(tile)到两个和四个区块的动态范围的计算,其功能类似于多核GPU。

架构日上,英特尔展示了Xe-HP在单个区块上以60 FPS的速率对10个完整的高质量4K视频流进行转码。还展示了Xe-HP在多个区块上的计算可扩展性。
雷锋网了解到,首款Xe-HP芯片已于实验室完成启动测试。目前,英特尔现在正在与关键客户一起测试Xe-HP,并计划通过Intel  DevCloud使开发者可以使用Xe HP。Xe-HP产品将于明年推出。
Xe-HPG是英特尔推出的最新Xe微架构变体,是为游戏优化的微架构。这个全新的微架构结合了Xe-LP的良好的效能功耗比的构建模块,利用Xe-HP的可扩展性对Xe-HPC进行更强的配置和计算频率的优化。
同时,Xe-HPG添加了基于GDDR6的新内存子系统以提高性价比,且将具有加速的光线跟踪支持。据悉,Xe-HPG预计将于2021年开始发货。

Xe架构的产品将于今明两年陆续推出。英特尔表示,首款Xe架构产品DG1已投产,并有望按计划于2020年开始交付。DG1现在可在英特尔DevCloud上供早期访问用户使用。
除了DG1,将很快投产,并于今年晚些时候发货的Xe产品还有针对数据中心的Server GPU(SG1)独立图形显卡。SG1将4个DG1聚合,可以很小的尺寸将性能提升至数据中心级别,实现低延迟、高密度的安卓云游戏和视频流。

数据中心架构

Ice Lake

英特尔还有一款预期将于今年底推出的产品Ice Lake。Ice Lake是首款基于10nm的英特尔至强可扩展处理器,它将带来一系列技术,包括全内存加密、PCIe Gen 4、8个内存通道等,以及可加快密码运算速度的增强指令集,在跨工作负载的吞吐量和响应能力方面提供强劲性能。
英特尔透露,Ice Lak系列中也会推出针对网络存储和物联网的变体。

Sapphire Rapids

当然,英特尔也会基于增强型SuperFin技术推出下一代至强可扩展处理器Sapphire Rapids,它将是美国阿贡国家实验室“极光”超级计算机系统(Aurora Exascale)中使用的CPU。
Sapphire Rapids提供领先的行业标准技术,包括DDR5、PCIe Gen 5、Compute Express Link 1.1等。另外,它也将延续英特尔的内置人工智能加速策略,使用一种名为先进的矩阵扩展(AMX)的新加速器。
英特尔预计Sapphire Rapids将于2021年下半年开始首批生产发货。
除了CPU和GPU,英特尔的FPGA也在持续演进。


混合架构

特别值得一提的是,架构日上英特尔还介绍了下一代采用混合架构可客户端产品Alder Lake。

Alder Lake将结合英特尔即将推出的两种架构——Golden Cove和Gracemont,并将进行优化,以提供出色的效能功耗比。
要开启计算架构的黄金新十年,除了需要晶体管技术以及架构创新,也需要更先进的封装技术和统一的软件平台与之匹配。

封装与软件等进展

封装技术方面,英特尔使用“混合结合(Hybrid bonding)”技术的测试芯片已在2020年第二季度流片。

当今,大多数封装技术中使用的是传统的“热压结合(thermocompression bonding)”技术,混合结合是这一技术的替代品。混合结合这项新技术能够加速实现10微米及以下的凸点间距,提供更高的互连密度、带宽和更低的功率。
存储技术方面,英特尔也有全面的产品能够满足不同的需求。

传输产品,英特尔有世界上第一台下一代224G-PAM4 TX收发器。

软件方面,今年7月,英特尔发布了其第八版的oneAPI Beta,为分布式数据分析带来了新的功能和提升,包括渲染性能、性能分析以及视频和线程文库。

架构日上,英特尔宣布oneAPI Gold版本将于今年晚些时候推出。oneAPI Gold版是为开发人员提供在标量、矢量、距阵和空间体系结构上保证产品级别的质量和性能的解决方案。

雷锋网小结

近来,关于英特尔的消息引发担忧,包括7nm工艺延期,市值被英伟达超越等。作为一家以技术为核心竞争力的公司,英特尔在2020年架构日上公布的晶体管到架构,再到软件和安全等的最新技术进展和详细解读。不仅英特尔让外界看到其技术实力的一个好机会,更是回应外界质疑最好的方式。
Raja去年接受雷锋网采访时说:“我百分之百认同未来十年是计算架构的新黄金十年的观点。在未来10年,我们将看到比过去50年多得多的架构优化和提升。通过软件和硬件的结合,我们可以让摩尔定律的提升变成十倍。”
芯片行业的竞争已经升级,英特尔能否继续引领?                                                      


往期推荐

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存