鸿信电子商务有限公司
 
 
英特尔推进面向数据中心、HPC-AI 和客户端计算的架构
时间:2022-09-21 人气:91

OIP-C.jpg

拉贾·科杜里
高级副总裁
加速计算系统和图形集团总经理

作者:拉贾·科杜里

建筑是硬件和软件的炼金术。它融合了给定引擎的最佳晶体管,通过高级封装将它们连接起来,集成了高带宽、低功耗缓存,并为它们配备了高容量、高带宽存储器和低延迟可扩展互连,用于封装中的混合计算集群,同时确保所有软件无缝加速。英特尔架构师每年在英特尔架构日上都期待英特尔架构师为即将推出的产品披露他们一直在研究的架构创新,而今年的活动(我们的第三次)是迄今为止最激动人心的活动。

今天,我们公布了英特尔®架构在一代人中最大的转变。这包括对 Alder Lake 的首次深入研究,这是我们的第一个性能混合架构,具有两个新一代 x86 内核和智能英特尔®线程控制器工作负载调度程序;蓝宝石急流,英特尔新的标准设定数据中心架构,具有我们新的性能核心和各种加速器引擎;我们新的独立游戏图形处理单元(GPU)架构;新的基础设施处理单位;和老桥,我们的远程数据中心 GPU 架构,具有英特尔有史以来最高的计算密度。

这些建筑突破为我们的下一个领导力产品时代奠定了基础,即将从桤木湖开始。我们今天披露的突破还展示了架构将如何满足对更高计算性能的迫切需求,因为从桌面到数据中心的工作负载变得比以往更大、更复杂、更多样化。

更多: 2021 年英特尔架构日(新闻套件)|英特尔公布了 CPU、GPU 和 IPO 一代产品中最大的架构转变(架构日情况说明书)|扩大英特尔的代工厂合作伙伴关系:IDM 2.0 的关键部分(斯图尔特·潘恩社论)

我们的架构师正在努力工作,结合英特尔独特而丰富的标量、矢量、矩阵和空间计算引擎选择,创建混合计算架构,为客户要求最苛刻的工作负载提供非线性收益。

您应该访问我们的新闻编辑室新闻资料包来观看演示文稿,但让我带您了解一下亮点:

高效核心:高度可扩展的 x86 微架构,用于满足从低功耗移动应用程序到众核微服务的整个客户需求范围的计算需求。与英特尔最多产的 CPU 微架构 Skylake 相比,高效内核在相同功耗下的单线程性能提高了 40%,在功耗低于 40% 的情况下提供了相同的性能。1对于吞吐量性能,与运行四个线程的两个 Skylake 内核相比,四个高效内核的性能提高了 80%,同时功耗更低,或者与运行四个线程的 Skylake 内核相比,性能相同,功耗降低了 80%。1

性能核心: 这款 x86 内核不仅是英特尔有史以来构建的最高性能 CPU 内核,而且还在 CPU 架构性能方面提供了阶跃函数,将推动未来十年的计算。它被设计为一个更广泛,更深入和更智能的架构,以公开更多的并行性,增加执行并行性,减少延迟并提高通用性能。它还有助于支持大数据和大型代码占用空间应用程序。性能核心在相同频率下,在各种工作负载中提供了约 19% 的 Geomean 改进,而我们当前的第 11 代英特尔®酷睿™架构(Cypress Cove 内核)也是如此。1  

针对数据中心处理器和机器学习的不断发展趋势,Performance-core 带来了专用硬件,包括英特尔新的高级矩阵扩展 (AMX),以执行矩阵乘法运算,从而实现一个数量级的性能 - 人工智能加速速度提高了近 8 倍。1这是利用 x86 编程模型为软件易用性而设计的。

英特尔线程控制器:英特尔独特的调度方法旨在确保高效内核和性能内核无缝地协同工作,从一开始就动态、智能地分配工作负载,并优化系统,以实现最大的实际性能和效率。通过将智能直接内置到内核中,英特尔线程控制器可与操作系统无缝协作,在正确的时间将正确的线程放置在正确的内核上。

赤杨湖:Alder Lake将重塑多核架构,成为英特尔首个采用全新英特尔线程控制器的高性能混合架构。这是英特尔最智能的客户端片上系统 (SoC) 架构,具有高效内核和性能内核的组合,可从超移动扩展到台式机,并通过多个行业领先的 I/O 和内存引领行业转型。基于桤木湖的产品将于今年开始发货。

X 惠普和炼金术士索化:新的独立显卡微架构旨在扩展到游戏和创作工作负载的发烧友级性能。十HPG 微架构采用全新 X-core,一个以计算为中心的可编程和可扩展元素,并完全支持 DirectX 12 旗舰版。X内部的新矩阵引擎-内核(称为 X矩阵扩展,XMX)加速人工智能工作负载,如XSS,一种新颖的升级技术,可实现高性能和高保真度游戏。X基于 HPG 的炼金术士 SoC(以前代号为 DG2)将于 2022 年第一季度以新的英特尔® Arc™ 品牌上市。

蓝宝石急流:将英特尔的性能内核与新的加速器引擎相结合,Sapphire Rapids 为下一代数据中心处理器设定了标准。Sapphire Rapids 的核心是一个平铺的模块化 SoC 架构,它提供显著的可扩展性,同时仍保持单片 CPU 接口的优势,这要归功于英特尔的 EMIB 多芯片互连封装技术和先进的网状架构。

基础设施处理单元:埃文斯山是英特尔第一个专用的基于ASIC的IPU,以及一个新的基于FPGA的IPU参考平台橡树泉峡谷。借助基于英特尔 IPU 的架构,云服务提供商 (CSP) 可以通过将基础设施任务从 CPU 卸载到 IPU 来最大限度地提高数据中心收入。将基础设施任务卸载到 IPU 允许 CSP 将 100% 的服务器 CPU 出租给客户。

XHPC, Ponte Vecchio:作为英特尔有史以来最复杂的 SoC,也是我们 IDM 2.0 战略得以实现的一个很好的例子,老桥利用了多种先进的半导体工艺、我们革命性的 EMIB 技术和我们的 Foveros 3D 封装。借助这款产品,我们将实现我们的登月项目,这是一个拥有 1000 亿个晶体管的设备,可提供业界领先的 FLOP 和计算密度,以加速人工智能、高性能计算和高级分析工作负载。在建筑日上,我们展示了我们早期的老桥芯片已经展示了领先的表现,在流行的AI基准测试中,在推理和训练吞吐量方面都创下了行业纪录。1我们的 A0 芯片已经提供大于 45 TFLOPS 的 FP32 吞吐量、大于 5 TBps 的内存结构带宽和大于 2 TBps 的连接带宽。老桥,和我们的X一样架构将由oneAPI实现,这是我们开放的,基于标准的,跨架构和跨供应商的统一软件堆栈。

回顾过去的一年,技术是我们所有人在大流行期间沟通、工作、娱乐和应对的核心。事实证明,巨大的计算能力至关重要。展望未来,我们面临着巨大的计算需求 - 到2025年可能需要1,000倍的需求。四年内1000倍的提升是摩尔定律的五次方。

正如我们的首席执行官、架构师 Pat Gelsinger 在架构日上所说:“我们面临着令人生畏的计算挑战,这些挑战只能通过革命性的架构和平台来解决......我们才华横溢的建筑师和工程师使所有这些技术魔力成为可能。

世界指望建筑师和工程师来解决最困难的计算问题,丰富人们的生活。我们的战略和执行正在加速以满足这些需求 - 以迅猛的速度。

Raja M. Koduri 是英特尔公司加速计算系统和图形事业部的高级副总裁兼总经理。


联系我们

18915339688 仅限中国 9:00-20:00
微信二维码
Copyright © 2023 鸿信电商 All Rights Reserved.苏ICP备16034642号-1