分享

EPYC,AMD重回企业级市场的探路石

 CHIP中文版 2020-08-12

美国得克萨斯州奥斯汀,AMD总部所在地,EPYC(霄龙)到来了。全新的品牌、全新的产品、全新的架构,趁着上半年Zen架构消费级处理器Ryzen大热,AMD再次向企业级市场进军,这是其皓龙(Opteron)系列CPU中断之后的回归。在AMD官网上,产品介绍仍停留在5年前Piledriver架构的6300系列,然而对于近年蓬勃发展的x86高性能计算领域,5年无异于另一个世代。

当地时间6月20日下午,AMD正式发布了EPYC,这款产品采用了Zen架构,此前已经泄露很多,硬件规格可谓非常豪华:32核64线程、8通道DDR4内存、128个PCI-E 3.0 lanes……在Ryzen光环下,EPYC可谓吊足了消费者的胃口,那个能与英特尔一争高下的CPU厂商AMD又回来了。

2017年,AMD的各类产品可谓全面升级和四处开花,先有消费级的CPU和GPU:Ryzen和Vega架构Radeon显示卡,后有微软在E3上推出基于AMD半定制芯片的Xbox One X游戏主机。如今EPYC发布,稍后还有Ryzen Pro——面向商业应用的处理器平台和Radeon Instinct计算加速卡。这些产品全部以新技术为支撑,围绕着CPU和GPU这两个AMD强势产品展开,当然,年底的第8代APU仍将赚足眼球。

EPYC可谓AMD励精图治推出的产品,当年Opteron曾经占据1/3的市场份额。但它和英特尔进军移动处理器一样,都不顺利,即使AMD看到了云计算的机会,跟进推出ARM架构的Opteron X,在面对整体业务收缩时,企业级市场首先被放弃。而就在这几年,x86在高性能计算领域蓬勃发展,如今已经从小众产品成为市场的绝对主流,这个过程中AMD早已被边缘化。在技术出身的Lisa Su领导下,AMD重新走上了技术主导型的发展道路,Zen架构年初首秀以来,已经赢得相当不错的消费者口碑,而回归企业级市场,也早在其计划之内。

和英特尔的技术策略一样,EPYC和Ryzen有着相同的核心架构,这有利于最大化微架构设计优势,经过不同层面的加强和优化,又能满足不同定位市场的需求。

今天AMD所推出的初代EPYC产品选用了7000作为产品编号,不仅有延续Opteron 6000的显性含义,也有压竞争对手英特尔Xeon E5一头的小心思。不过,Xeon E5的产品线跨度更大,编号首位数字代表系统最大处理器配置数量,因此分别为1P、2P和4P几条产品线,而EPYC 7000主要对标2P平台的E5-2600 v4,目前最高规格产品为E5-2699A v4,22核心44线程、代号Broadwell-EP,去年4月间发布。相比之下,Xeon E3系列已经更新到Kaby Lake架构(7代酷睿),而E5-2600系列的更新则初步定于今年Q3,代号Skylake-SP。不要被Skylake-SP的代号迷惑了,它并非6代酷睿架构的延伸,而已经采用了Kaby Lake的14nm++的制程工艺。之所以一年多没有更新,E5-2600 v5酝酿着大变革,也将成为已经发布的EPYC 7000能否在企业级市场立足的最大变量,它才是EPYC 7000真正的对手,而E5-2600 v4并不对位。

不过,无论如何,Ryzen 7以8核技惊四座,已经让市场注意到AMD的声音,截止发稿时,AMD发布会尚未开始,其股价当天上涨8%,而英特尔则下跌1%。

除了我们已经熟知的Zen核心,对于拥有众多处理器核心的企业级产品,核心互联技术则更为关键,在CCX(集成4核心及共用L3 Cache)模块上,崭露头角的Infinity Fabric就是这位关键先生。按照AMD的定义,Infinity Fabric包括数据和指令两个可扩展的Fabric,分别称为SDF和SCF,从核心到CCX、从CCX到DIE、从DIE到Socket、从Socket到Socket/GPU等4级架构全部采用Infinity Fabric连接,而不同链路的速度有所差异。

SCF和SDF的控制方式。

 单颗CPU上4个CCX两两间直接连接,单连接双向带宽为42GB/s。

2P系统中,每颗CPU中的每个CCX将以16个PCI-E 3.0lanes作为互联Infinity Fabric通道,连接到另一颗CPU中对应ID的CCX、38GB/s的双向带宽,即各CPU各以64个lanes的性能带来总计152GB/s的CPU间互联带宽。

根据此前Ryzen发布时的信息,DIE上两个CCX采用43GB/s(配备DDR4-2666规格内存)的Infinity Fabric互联,而CCX内核心互联速度为175GB/s——6条Infinity Fabric。

如此4级级联的设计,明显为成本和堆核进行优化,虽然显性的带宽指标不见得太差,但是各级延迟会非常严重,两个核心交换数据的最坏可能是经过多达7级不同速度组合的传输,性能劣化到千倍于CCX内数据交换。AMD显然注意到这样的问题,一方面没有公布任何有关延迟的数据,另一方面积极和微软等OS厂商合作进行相关优化,从OS层级优化数据传输路径,减少在如此大跨度的核心间调用数据。

无论如何,在高并行性的企业级应用中,EPYC核心数量及执行效率上的优势依旧诱人,在发布前一天进行的技术沟通会上,AMD着重展示了新产品在负载及计算性能方面的优势,以及能效比方面的变化。另外,凭借灵活的Infinity Fabric互联架构设计,EPYC 7000可以很灵活地搭配CPU和GPU组合,Infinity Fabric既可以连接起两颗CPU,也可以连接AMD最新推出的Radeon Instinct加速计算卡——另一款杀手产品。

AMD一口气推出3款Radeon Instinct异构计算架构产品,分别采用了Fiji核心的M18、Polar核心的M16和Vega核心的M125,甚至还有一款名叫Radeon Vega Frontier Edition旗舰产品即将发货。借用超级多的计算核心,Radeon Instinct可以实现强大的并行计算性能,可以为云计算、人工智能、深度学习等领域提供计算加速,AMD为此还提供了ROCm 1.6开放软件优化平台和MIOpen深度学习开发平台,方便用户充分调用EPYC和Radeon Instinct的优化特性。

在英特尔的Xeon+Xeon Phi/Nervana/FPGA、NVIDIA的Tesla之外,EPYC+Radeon Instinct成为通用人工智能平台的第三选项。

价格和端口扩展能力是EPYC的主要竞争优势,相比各有不同优化和用户需求的性能,唯有价格和端口优势不可破。虽然AMD一口气推出的产品多达12款,但是选择仍算不上丰富,因此集中精力主攻单路和入门双路市场是EPYC目前的定位,在此基础上进一步突出性价比优势,最后列出的价格相当有杀伤力。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多