分享

聊聊数据中心的能耗 | 编译点滴

 看见就非常 2012-05-12

聊聊数据中心的能耗

这年头,不扯点数据中心、云计算、大数据,就觉得自己不是搞IT的。
碰巧今天听了来自IBM Research Austin的John Carter所做的报告–Building better server and network.
所以就借着消化这个报告的机会,写下所见所闻。文中的数据大部分来自《量化》第5版,部分来自于John Carter的报告。

感兴趣的朋友可以从这里找到John Carter近期发表的论文(http://www.informatik./~ley/db/indices/a-tree/c/Carter:John_B=.html )。
这里面包含了他报告的几乎所有内容。

1 数据中心能耗分布

咱们先从整个数据中心的能耗开始。
先来看看电力传输的能耗,从发电厂,一直到各种服务器、空调上的电源线。这其中,变电站的能效是99.7%, UPS(不间断电源)的能效94%,
数据中心内部的PDU(Power Distribution Unit,电源分配器)的能效98%,进入机房后还需要一级电压转换(能效98%),
还有各种开关、各种连接装置等等能效大概是99%.

也就是说,实际从电厂到服务器,整个环节能效: 99.7%x94%x98%x98%x99%=89% .
11%的电力消耗在传输上。

数据中心的内部的能耗分布中:各种IT设备的能耗占55%,空调等冷却设备占45%.
发热的确是个大问题。

2 服务器内的能耗分布

服务器内部包括处理器、内存、硬盘、网络,所占的能耗比例分别是33%、30%、10%、5%。剩下的22%是其他一些设备的能耗(《量化》5版数据).
来自IBM的数据凸显了Power处理器的高能耗。在Power 7服务器中处理器的能耗比例是41%,内存46%(内存也不低), 其他13%.
可以看到处理器和内存是耗能大户。也是这两者发热最厉害,需要能耗非常高的冷却设备。

3 降低能耗怎么降?

先来看看普通数据中心应用的特点。如下图,是《编译点滴》使用的Xen虚拟机最近24小时内CPU使用情况。这属于负载很高的一天。平时的负载都比这个少50%左右。
可以看到尖峰很多,也就是说偶尔需要很高性能,大部分时间都是空闲的。
虽然《编译点滴》是个小站,不过应该能够代表一小撮VPS用户的典型特征。

 

来自IBM的数据也显示,一般情况下平均95%的CPU内部功能部件都是空闲的。
比如Power 7处理器中每个核中2个定点运算单元、2个访存部件、4个双精度浮点运算部件、1个向量运算部件、1个十进制浮点运算部件、1个分支预测部件还有若干cache,基本上某一时刻只有一两个功能部件在工作。另一方面,所有的存储器操作基本都是处理器发起的。所以擒贼先擒王,降低能耗就从处理器开始。

以Power 7处理器为例,该处理器有8个核,每个核中都有5个温度传感器、芯片其他部分还有4个,总共44个温度传感器。这些传感器会将数据传送到片外的一个单独的能耗/温度检测和管理芯片上。该芯片可以根据CPU内的温度、负载情况调节CPU中每个core的频率,进而起到控制能耗的作用。精确控制芯片频率的功能是通过测量每个核中的关键路径实现,结合温度情况实现的。每个核中的5个传感器通过检测不同种类的功能部件中的指令队列,实现对关键路径的测量。能耗控制芯片对Power处理器的检测、控制可以精确到10几个cycle的量级。通过这套机制在不损耗性能的情况下,能降低20%左右的功耗。效果挺不错的。

访存方面的节能通过关闭不经常访问的存储区间来实现。这个John Carter没细讲,所以也不太明白。

3.1 数据中心能耗怎么量化

数据中心的能耗可以使用PUE(Power Usage Effectiveness)量化。

PUE=(Total Facility Power)/(IT Equipment Power)

一般数据中心的PUE都在1.69~2.0左右。当前,最绿色的数据中心,恐怕还是来自Google的,PUE达到1.19.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多