分享

黄仁勋亲自交付首台DGX H200工作站;AMD超级APU Strix Halo坐实,16核配40CU

 AMP实验室 2024-04-26 发布于广东

3000¥以内岂不是无敌?

英伟达在2023年的GTC大会上发布了H200 GPU,并且基于此推出了DGX H200工作站,它拥有高达141GB的HBM3E高带宽内存,速度高达4.8TB/s,相比于H100,它几乎达到了两倍的性能。

25日,OpenAI总裁兼联合创始人Greg Brockman在推特动态中透露,英伟达终于开始为其交付目前最强大的产品,并且有意思的是,英伟达CEO黄仁勋亲自到场交付。

OpenAI是全球首个取得英伟达最强人工智能系统的公司,此次交付意味着公司之间的算力竞赛开始进入到新的阶段。而在上个月,英伟达宣布了Blakcwell GPU,并且公司确认今年即可出货Blackwell阵容产品。

各家涉足AI的企业间的竞争,并非他们在该领域的收入,而是他们所拥有的算力资源,而英伟达作为金矿边卖铲子的人,势必将在相当长的一段时间统治业界,因为如果想要走上AI赛道,每个公司都绕不开英伟达的产品,而英伟达也提供了极为庞大的生态系统。

另一则AMD消息,下一世代的超级APU消息得到了进一步披露,传推特流出一份多达144页的AMD资料,证实了明年将推出ZEN5内核的APU产品,而且这些超级APU将在CPU和GPU都带来非常强劲的配置。

根据文件截图,AMD计划为ZEN5架构中推出通常版本的Strix Point和超级APU Strix Halo。其中,Strix Point依然还是单芯片设计,CPU则略有进步,提升到最高12核ZEN5,此外,iGPU部分扩增到16个RDNA3.5,也因此其NPU可提供50TOPS算力。最关键的是,它的TDP仅有45~65W。

超级APU Strix Halo APU则暴力堆砌到16核心32线程,并且有意思的是,AMD将为其使用Chiplets 技术,也就是两个8核心ZEN5 CCD,更恐怖的是,AMD将为这颗APU塞入40CU的RDNA3.5 iGPU,这个规格已经超过了RX 7600XT。

除了以上老生常谈的指标,它提到其SoC Tile上将增加32MB 缓存,作用类似于Infinity Cache,这一设计可有效改善Strix Halo的GPU部分,有厂家透露,Strix Halo的iGPU性能可以达到RTX 4060移动端水平。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多