分享

从基础设施、HPC 到数据中心,英特尔全新架构开创数字时代未来标准

 张问骅 2021-08-27

数据,无处不在;数据的产生,无休无止;数据的潜力,无穷无尽。IDC 预测:接下来三年新增数据量将超过过去 30 年总和。[1] 数字时代的未来,需要全新的计算架构,处理人类前所未见的数据洪流,数据中心的计算、网络和存储软硬件尤其如此。

不久前的英特尔架构日,从下一代至强可扩展处理器 Sapphire Rapids,到基础设施处理器 IPU,再到面向高性能计算的 Xe HPC和Ponte Vecchio,英特尔以强大的技术实力、创新的产品设计,开创了未来数据中心的标准。接下来,就让我们一窥其中堂奥。

,时长

01:01:30

“1

Sapphire Rapids:三大加速引擎,

实现数据中心弹性计算速度飞跃

IT 咨询公司 O’reilly 2020 年调查报告指出:77%的企业已经采用了微服务架构,其中 92%的企业都得益于此。[2] 究其原因,在于微服务架构使应用程序更易于扩展和更快地开发,从而加速创新并缩短新功能的上市时间。

以容器化为主的微服务架构,属于弹性计算模型。此次英特尔推出的 Sapphire Rapids 下一代至强可扩展处理器,已经在前代至强的基础上完成全面优化,就是要为弹性计算模型提供突破性性能,包括卓越的节点级性能和数据中心级性能。

图片

Sapphire Rapids 的核心是分区块、模块化的SoC架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,有强大的可扩展能力。同时,Sapphire Rapids 有单一、平衡的统一内存访问架构,实现一致的低时延和高带宽。基于Intel 7制程工艺技术,Sapphire Rapids 采用英特尔全新的性能核微架构,从而提高速度,突破低时延和单线程应用性能的极限。

处理器内置专用加速器,是前几代至强的秘密武器。Sapphire Rapids 内置三种加速器引擎:

图片

英特尔® 高级矩阵扩展(AMX)加速引擎,大幅加速深度学习算法核心的Tensor处理。

图片

英特尔® 加速器接口架构指令集(AIA),支持对加速器和设备的调度、同步和信号传递。

图片

英特尔® 数据流加速器(DSA),加速最常见的数据移动任务,减少数据中心规模部署中的开销,提供更高的整体工作负载性能。

上述架构改进,让 Sapphire Rapids 轻松应对云、数据中心、网络和智能边缘中广泛的工作负载,提供开箱即用的高性能。

“2

基础设施处理器,释放云计算更多性能

云计算等全新资源分配模式,分离了基础设施的所有权和使用权,让数据中心身处变革之中。英特尔此次推出的基础设施处理器(IPU),以 Mount Evans 为代表,可以帮助云和服务商进一步释放更多性能,带来更广泛的价值。

图片

基于 Mount Evans IPU 的架构有三大主要优势:

图片

让云计算租户可完全掌控 CPU;

图片

云运营商用 IPU 处理基础设施损耗,提升 CPU 利用率和收益;

图片

IPU 让无磁盘服务器架构成为可能,可编程的资源管理更高效、更安全、更稳定。

英特尔的首个 ASIC IPU Mount Evans 由英特尔和一家一流云服务商联合设计开发,可直接用于超大规模环境,同时具备可编程数据包处理引擎,支持现有 DPDK、SPDK 等软件开发包以及多种现有场景,例如 vSwitch卸载、防火墙和虚拟路由,并为未来使用场景留出显著空间。Mount Evans 使用硬件加速的 NVMe 存储接口,可模拟 NVMe 设备。在实际应用中,该 IPU 可达到最高每秒2亿个数据包的性能。

此次还发布了 IPU 参考平台 Oak Springs Canyon,基于英特尔® 至强D处理器和英特尔® AgilexFPGA构建,是一款可扩展、开源软件和硬件基础设施,为英特尔合作伙伴和客户提供定制能力。

“3

全新“登月”范式,

Ponte Vecchio为高性能计算树立标杆

在高性能计算领域,英特尔此次架构日推出了 Ponte Vecchio,它基于 Xe HPC 微架构,是英特尔迄今为止最复杂的SoC,包含 1000 亿个晶体管,以英特尔公司高级副总裁兼加速计算系统和图形事业部总经理 Raja Koduri 的话说:这是一个登月级别难度的创新产品。采用 3D 堆叠封装技术的 Ponte Vecchio ,开启了全新的处理器开发范式,其中包含了:

 新的SOC架构 

 新的IP 架构

● 新的内存架构 

● 新的I/O架构 

● 新的封装技术 

● 新的供电技术 

● 新的互连 

● 新的信号完整性技术 

● 新的可靠性方法 

 全新的软件 

● 新的验证方法

图片

Ponte Vecchio 芯片的领先性能,提供了高于 45 TFLOPS 的 FP32 吞吐量,高于 5 TBps 的内存结构带宽,以及高于 2 TBps 的连接带宽,在 AI 基准测试中创造了推理和训练吞吐量的行业记录,ResNet推理性能超过 43,000 张图像/秒,ResNet训练超过每秒 3400 张图像/秒,并为英特尔赢得了“极光”(Aurora) 百亿亿次级级超级计算机订单。

“4

领先未来,直面挑战

Sapphire Rapids、Mount Evans IPU、基于Xe HPC 微架构的 Ponte Vecchio 处理器,所有这些硬件都可以凭借英特尔的开放统一软件栈  oneAPI 得到集成,用于类似“极光”这样的项目中,应对日益增长的高计算能力需求。这也正是英特尔架构日的初衷:以领先时代的产品和技术,推动数据中心迈入下一个计算时代,直面未来的挑战。

图片

[1]《IDC:未来计算的十大特征(附链接)》

https://www./mp/a44175.html 

[2]《Microservices Adoption in 2020》

https://www./radar/microservices-adoption-in-2020/ 

向上滑动阅览

①工作负载和配置见www.intel.com/ArchDay21claims。结果可能不同。

前瞻性声明

性能因使用、配置和其他因素而异。如需了解更多信息,请访问http://www.Intel.com/PerformanceIndex。 基于测试的性能结果基于配置中显示的日期,可能无法反映所有公开的更新信息。有关配置的详细信息,请访问www.Intel.com/ArchDay21claims。任何产品或组件都不是绝对安全的。

所有产品和服务计划、路线图和性能数据如有更改,恕不另行通知。基于试产系统和组件得出的结果以及所有使用英特尔参考平台(英特尔内部实例新平台)、内部英特尔分析或架构仿真或建模进行预估或模拟得出的结果均仅供参考。未来任何系统、组件、规格或配置的更改均可能导致结果发生变化。英特尔技术可能需要启用硬件、软件或激活服务。

英特尔所使用的代号表示正在开发和没有公开上市的产品、技术或服务。这些代号不是“商用”名称,并不用作商标。

本文中涉及未来规划和预期的陈述,均为前瞻性陈述,包含许多风险和不确定性。诸如“预期”、“期望”、“意图”、“目标”、“计划”、“相信”、“寻求”、“估计”、“持续”、“可能”、“将”、“应”之类的语句或与之类似的表述均代表前瞻性陈述。提及或基于估测、预测、推算、不确定事件或假设的陈述也为前瞻性陈述,包括有关未来产品和技术以及此类产品和技术的预期可用性和效益、市场机会以及我们业务或相关市场的预期趋势。此类声明基于管理层当前预期,涉及若干风险和不确定性,可能会导致实际结果与这些前瞻性陈述出现根本性不同。英特尔提交给美国证券交易委员会的文件中说明了可能导致实际结果与公司预期出现极大差异的重大因素,包括公司最近的 10-Q 和 10-K 报告。欲获取英特尔的 10-K、10-Q 和 8-K 报告,请访问我们的投资者关系网站 www.intc.com 或证券交易委员会的网站www.sec.gov。英特尔不承诺也明确表示不承担更新本文中的任何陈述的责任,无论是由于新信息、新发展或其他原因,除非法律可能要求披露。

英特尔不控制或审核第三方数据。您应该咨询其他来源以评估准确性。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多