分享

针对数据中心、高性能计算领域、AI领域等场景的全新数据设备互联协议,CXL和CCIX、OpenCAPI、Gen-Z

 HIBEST鲁普明 2021-04-28

英特尔牵头成立了名为CXL(Compute Express Link)标准组织,以实现CPU与诸如GPU、FPGA等(数据中心)专用加速芯片间的快速互联,推动下一代数据中心的性能。与CXL相似的标准组织有CCIX、OpenCAPI、Gen-Z Consortium(Gen-Z),这些标准组织也早在2016年已相继成立,其中CCIX与CXL同为以PCIe标准为底层连接协议。就各协议现有成员来看,包括AMD、IBM、Xilinx、华为均有参与到各协议中,英伟达也有自家的NVLink,在CXL联盟快速发展的同时,与之存在最大竞争关系的Gen-Z联盟也在推动Gen-Z协议的成熟,点击查看:<关于GEN Z>

物联网需要更高的算力和互联;自进入互联网时代,信息被视为较物质、能源更为重要的社会资源;自进入物联网时代,数据被视为较物质、能源,甚至信息更为重要的社会资源。

因此,各国都极为重视物联网相关网络建设、平台建设等。其中,协议标准由于拥有特殊的地位,成为国内外巨头厂商争夺的又一高地,每年我们给各大协会缴纳的各种授权认证及使用费用都在千亿以上,可惜目前国内还没有主导平台建设的大公司,无论此前的CCIX、OpenCAPI、Gen-Z Consortium,还是近期的CXL,这些协议都是为了助力现在机器学习、云计算等相关应用实现跨CPU与数据中心实现高速互联、“共享”内存,降低软件堆栈复杂性和整体系统的成本,从而使开发人员无需考虑加速器中的内存管理硬件。

CXL同样是一个开源的协议标准,除了英特尔之外,目前超级豪华的阵容还包括微软、阿里、思科、戴尔EMC、Facebook、谷歌、惠普、华为,CXL也一直在积极扩编,预计将在2021年推出支持CXL标准的数据中心平台,包括英特尔至强处理器、FPGA、GPU和SmartNIC。

CXL和Gen-Z是目前在数据中心、高性能计算领域、AI领域等场景的全新数据设备互联协议的领导者,CXL和Gen-Z两大联盟在上周签署的合作备忘录,为这两种协议之间的融合提供了基础,也解决了广大厂商在两种协议间如何选择的问题;基于PCIe物理层的CXL协议更适合于服务器节点内部应用,从PCIe Gen5速率起步,可以解决服务器内部CPU、GPU、加速模块和存储部件之间内存一致性访问的问题。这是目前能够看到的CXL协议最大的应用场景

而在服务器节点外部的机架层级,能够支持远距离传输和大规模拓扑互联的Gen-Z协议具有更好的适用性。这就好比Infiniband和Ethernet,适用于不同的场景。

对于很多超大规模数据中心用户,比如微软,正是看到了CXL和Gen-Z不同的特点,因此同时支持了这两个联盟。当前的云数据中心里,内存资源分散在各个服务器节点里,很难像存储、GPU等资源一样被池化。如果能够基于Gen-Z和CXL协议,将持久内存(Persistent Memory)从计算节点中解耦出来,就可以将其按需分配给各类xPU。计算节点可以是Intel Xeon CPU,也可以是AMD EPYC CPU,甚至是ARM或Power CPU,xPU的变化将不再对内存的分配和利用带来影响,这将极大地提高内存这类基础架构设备的利用率,从而提高企业的收益

不久前,Intel 出货了支持 PCIe 5.0 的新款 Agilex FPGA(英特尔预计客户将使用Agilex FPGA开发网络,5G,人工智能和加速数据分析解决方案,称该芯片可提供更快的网络吞吐量和更低的延迟,此外,微软表示,它计划利用FPGA在Azure云服务,必应和其他数据中心服务中加速实时人工智能,网络和其他应用或基础设施),并采用 10nm 工艺,最近Gen-Z 联盟又更新发布了这一高速互连标准的最新 1.1 版本,也加入了 PCIe 5.0,随着各大高速互联协议的签署,各大协议之间的转换方式,都需要对应的协议转换芯片。

从Intel方面来看,首款具有CXL协议功能的样片应该会在今年内开发出来。考虑到从样片到批量成品的时间周期,具有CXL功能的处理器应该会在2023年推向市场。

在Gen-Z方面,我们已经看到使用FPGA芯片实现Gen-Z协议的Demo单板和样机,但硬核化的芯片估计也要到2022年之后才会出现。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多