分享

AI如何改变数据中心设计

 yi321yi 2023-11-02 发布于四川

随着人工智能技术的飞速发展,全球对AI系统的投资预计在未来几年将呈现一触即发的增长势头。然而,这个繁荣的背后隐藏着一个令人意外的现象:近期许多数据中心运营商似乎放缓了新项目的推进步伐,这导致了伦敦等地的空置容量在2022-23年间下降了惊人的6.3%。

这一看似反常的趋势背后,究竟蕴含着怎样的原因呢?要解开这个谜题,我们必须深入了解围绕着AI计算以及支持它的基础设施所涉及的一系列重要问题。事实上,AI计算对数据中心基础设施带来了根本性的变革。

传统上,数据中心的架构主要围绕着CPU展开,以满足传统计算工作负载的需求。然而,随着AI计算崛起,数据中心的构建方式也随之发生了翻天覆地的变化——GPU驱动的机架逐渐取代了传统CPU的地位。相较于同等容量的CPU,GPU消耗更多电力,释放更多热量,占据更多空间。这意味着为了保障AI计算能力,数据中心需要提供更多的电源连接或改进冷却系统。而由于这些设施大多是嵌入式的,替换将变得十分昂贵,有时甚至经济上几乎难以承受。

在这种情况下,运营商们不得不在新数据中心的规划阶段慎之又慎,确保AI计算与传统计算之间的“分割”得当,避免过度承诺导致资源未充分利用和无法盈利的困境。AI市场尚处于初级阶段,这使得问题变得更为复杂,许多运营商选择暂缓承诺,以避免在新数据中心项目中过早承担AI计算的比例。

  1. 让更多利益相关者参与进来

在AI计算时代,具备AI计算能力的数据中心站点相较于传统设施显得更为复杂。复杂度的增加往往伴随着故障点的增多,特别是在AI计算需求远超传统计算的情况下。因此,为了保证数据中心的正常运行,并降低在站点生命周期内出现代价高昂问题的风险,团队需要在数据中心的规划阶段加倍用心。

设计阶段的全面考虑至关重要。除了寻求电力和冷却方面的专业知识外,设计团队应早早地与运营、布线和安全团队取得联系,了解潜在的瓶颈或故障来源。通过将更多利益相关者纳入规划流程,可以有效地降低后期维护和运营中可能出现的问题,保证了数据中心的稳定运行。

  1. 将AI融入数据中心运营

运营商在现场进行AI计算,他们应该主动利用这一能力来提升运营的效率。AI技术在数据中心中的运用已经得到了长足的发展,其高精度和高质量的工作流能力让其成为不可或缺的一环。例如,AI可以通过温度和湿度监测,确保数据中心的环境保持在最佳状态。安全系统运营也可以通过AI技术得到优化,提升安全水平。此外,AI还可以在用电监控和分配、硬件故障检测以及预测性维护等方面发挥重要作用。

通过在数据中心的生命周期的每个阶段主动运用AI技术,运营商可以显著提升其运营的效率和稳健性。AI技术特别适用于解决新一代数据中心布局所带来的新挑战,比如通过故障检测和预测性维护,提高了数据中心的可靠性。

  1. 避免虚假的节约

在AI计算高峰期,例如在模型训练或企业级模型的生产运行阶段,数据中心将承受更大的负载压力。在这些时期,AI计算在功耗、冷却需求和数据吞吐量方面往往会远超出传统预期。

这意味着数据中心的底层材料面临更大的压力测试。如果这些材料或部件质量不高,它们更容易出现故障。而随着AI计算引入,一个站点的组件和连接数量将急剧增加,这也就意味着那些在传统站点表现良好的低成本、低质量材料可能会导致运行AI计算的数据中心发生故障。

因此,运营商应避免通过购买质量较低的材料来追求短期的经济节约,比如使用不合格的电缆。虽然这样做可能会在短期内看似节省了开支,但在长期来看,这些材料更容易失效,需要更频繁地更换,甚至可能导致数据中心的停机,对盈利能力造成严重影响。

通过解决这些基础设施难题,运营商们将能够为数据中心在AI计算时代的高效运营奠定坚实基础。尽管AI计算的基础设施要求可能是运营商拖延投资的主要原因,但随着市场逐渐明朗,他们将能够在数据中心的传统计算和AI计算之间取得平衡,确保在竞争激烈的市场中保持领先地位。

综上所述,解决基础设施难题并不是一项简单的任务,但它是确保数据中心在AI计算时代高效运营的基础。随着市场的逐渐明朗,公司将在数据中心的传统计算和AI计算之间取得平衡,同时保证自身在竞争激烈的市场中保持竞争优势。

因此,从一开始就进行整体设计,利用AI技术发现新的运营效率,投资于能够满足更大规模AI计算需求的高质量组件,将是未来运营商们必须要考虑的重要方向。只有这样,他们才能在激烈的市场竞争中脱颖而出,为数据中心的未来发展奠定坚实基础。

福利

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多