数据中心效率(PUE)计算指南

在数据中心基础设施的效率能够使用PUE使用或其他指标进行基准测试之前,必须就哪些能源消耗是由IT负载产生的、哪些能源消耗是由物理基础设施产生的、以及什么负载不应该被计算在内等一系列问题达成精准的共识。但不幸的是,通常公布的效率数据并没有使用标准的方法进行计算,而当采用不同的方法计算时,同一家数据中心将获得不同的效率评分。在本文中,我们将为广大读者诸君解释这一问题,并介绍进行数据中心负载效率计算的标准的分类方法。

现如今,将对于数据中心基础设施效率的确定作为有效的能源管理计划的一部分所带来的好处已然获得了业界的广泛认可。电源使用效率(PUE)及其倒数:数据中心基础设施效率(DCIE)的标准度量已成为业界公认的标准。

在为数据中心提供能源审计过程中,施耐德电气公司已经通过建立特定的数据中心PUE,确定了一系列的实际问题。如下,是造成功率消耗子系统作为IT负载、物理基础设施分类困难的一些问题:

在数据中心的设备会消耗功率,但他们的功率数据如何(或者是否应该)被计算在对于数据中心效率的计算中尚不明确。

某些数据中心的子系统并不存在于数据中心中(例如,室外照明系统或NOC系统)。

某些子系统支持混合使用的设施,并被其他非数据中心功能所共享(例如,冷却塔和制冷机组),所以归属于数据中心的功率部分不能直接测量。

某些子系统极为不切实际或仪器功耗相当昂贵(例如,由于大量的输出连接,或配电柜所需的PDU电源分配单元)

某些实际的功率测量点包括了与数据中心不相关的负载,但在测量过程中又无法将其分离。

在一家典型的数据中心,经常存在上述的一个或多个实际问题,而且在那类共享使用设施(例如一幢办公大楼)的数据中心几乎总会存在。由于大多试图确定PUE值的数据中心运营人员都会遇到上述的一个或多个问题,故而需要界定一套标准的方式以便对这些问题加以处理。而这也就是本文的目的所在了。

本文定义了一套标准的方法,以收集来自数据中心的数据,并为广大读者诸君进一步说明了如何使用这些数据来计算PUE值,介绍重点放在了如何处理混乱或不完整的数据方面。

企业用户们总是可以弥补自己收集和处理能耗数据的方法,但是,如若没有一套标准的方法,是无法对数据中心的能源效率进行测量的。重要的是要注意,各种不同的标准组织机构,如绿色网格组织及其他组织已经认识到这方面的问题了,并正在以研究指导方针和测量标准的形式提供相应的解决方案。其中的一套指导原则便是由ASHRAE和绿色网格组织所共同正式发布的题为《PUE:综合全面的检查度量标准(PUE: A Comprehensive Examination of the Metric)》。预计该标准将涉及到本文中所描述的许多问题。而鉴于该标准的制定,本文将在第一时间立即进行更新,进行适当的调整,以便与该标准保持一致。故而当在参考借鉴本文中所介绍的方法之前,我们建议您不妨先访问whitepapers.apc.com,以确保您所使用的是最新版本的标准。

一套分为三部分的方法

为了克服上述的这些问题,如下,我们将分三个部分,来为大家介绍这套分为三部分的方法:

1、建立一套标准的数据中心子系统分类,分别为:(a)IT负载、(b)的物理基础设施、(c)在能耗计算中不包括的数据中心子系统。

2、如果一个子系统的功耗由于与非数据中心负载共享的原因无法被直接测量,则可以为该子系统类型使用一种标准化的方法以估计其能耗情况。

3、如果一个子系统的功耗由于测量的技术壁垒的原因无法被直接测量,则可以为该子系统类型使用一种标准化的方法以估计其能耗情况。

如下,我们将为大家依次介绍三部分的方法每一部分。

第1部分:数据中心子系统的标准分类

为了进行数据中心效率计算,关键是要明确界定:哪部分的能耗是由IT负载产生的;哪部分的能耗是由物理基础设施产生的。很显然,服务器和存储设备是被作为IT负载而设计指定的;而UPS和冷却/空气处理单元则是作为物理基础设施而设计指定的,但在进行能源效率计算时,数据中心仍然有许多的功率消耗子系统并没有这样明显的分类,包括诸如人员空间、配电柜开关设备与网络运营中心(见下图1)。

对于这些子系统所消耗功率。如果不对所有的数据中心进行均匀一致的分类,那么,对不同的数据中心所计算得出的功率结果进行直接的比较是不可能的。企业客户、政府机构和公用事业提供商们对于数据中心能耗测量的基准研究正进行着不断的努力,故而建立一套关于什么应该被视为IT负载、什么应该被认为是物理基础设施(有时称现场基础设施)、以及什么不应该被包括在数据中心效率的计算范围内的规范准则是必不可少的。此外,当涉及到获取计算数据中心能源效率所需的关键数据时,经常会面临一些实际的问题。

在对数据中心能源效率计算的负载分配时,进行上述三种分类的目的,既有理论方面也有实践方面的考虑。关于不同类型的负载是否应该被纳入到数据中心PUE的度量,理性主义者们往往会得出不同的结论。而如果将其计算在内的话,其是否是属于IT负载。本文中,我们采用了以下的实践指导原则,来构建了本文的分类体系:

如果使用子系统来管理能源是数据中心能源管理的一个现实和理想的结果,那么系统负载就应该被包括在PUE度量之内。

如果在测量的过程中,通常对于某一特定的负载单独进行测量并不实际,那么就不应该规定对该特定负载的度量应该被单独列出了进行度量计算。

关于数据中心的各种类型的设备的一份综合列表应该是标准化的,其应该对 IT负载 、 物理基础设施 、及 不应该被包括在数据中心效率的计算范围内的设备 进行明确的分类界定。

下表是对建立一份通用的子系统列表及其各自应该被分配到三个类别中的哪一类所进行的一个初步尝试,分别以 IT负载 、 物理基础设施 或 不被包括(在数据中心能源效率计算范围之内) 。该表格与ASHRAE和绿色网格组织所发布的题为《PUE:综合全面的检查度量标准》是一致的:公制的全面检查。表1-4C提供了应该被纳入到数据中心PUE核算以及应被数据中心PUE核算排除的子系统的列表。这些子系统被分为设备类型的四个单独表:IT设备、电源设备、冷却设备及其他设备。

图1 功率消耗子系统的统一分类对于数据中心的效率基准是至关重要的

在表1中,各种不同的IT负载被确定并分类到IT负载类别中。某些类型的IT设备很明显是应该这样归类,但对其他某些类型的设备分类并不总是这样的。例如,当涉及到灾难恢复IT负载或网络运营中心(NOC)负载是否应该被归类为数据中心内的IT负载通常就存在着一定的混乱。

几乎所有的数据中心都拥有某种形式的网络运营中心,其可能是小如在机房内的一台桌面台式机,也可能是拥有十几台工作站和几面墙都是巨屏显示器的一个大房间。在某些情况下,一家企业组织可能具有一处监视多个数据中心的大型中央NOC,在这种情况下,一处数据中心可能背负着一处大型的NOC,同时其他类似的数据中心则仅仅只有一处小的NOC。有观点赞同将NOC纳入到数据中心的PUE计算,也有观点认为应该将其排除在PUE计算。然而,数据中心能耗管理可取的原则涉及到诸如一处NOC的负载,NOC应该被纳入到数据中心能源消耗报告中,故而也就在PUE中了。此外,与NOC相关的能源使用,包括诸如电源和冷却,想要从数据中心其它相关的能源使用中分离出来可能是相当困难的。这再次表明,将NOC纳入到能源报告和PUE计算中,是符合实际的。

表1 数据中心IT子系统的分类(参见图1的分类情况)

表2列出了可以在任何一家典型的数据中心找到的电源子系统,及其是如何在PUE计算中进行分配的。虽然这些分配中的大多数都是显而易见的,但这个图表的重要价值是其作为一份清单,有助于确保所有相关的数据均已经被发现并纳入PUE的计算中。特别是,许多报道PUE测量期间PUE计算,这可导致大的误差,特别是许多PUE测量报告在进行PUE计算时,错误地将PDU和静态转换开关(STS)单元作为IT负载的一部分,可能产生很大的误差,尤其是在部分负载的数据中心。尽管有人认为很难测量这些设备的功耗,但以较高的精确度来估计它们则是完全可能的。因此,在进行效率计算时忽略它们是无效的。

在PUE计算时的其他常见的错误包括:遗漏了配电柜开关和自动转换开关(ATS)设备。在许多情况下,测量这些设备的功耗是不切实际的或不符合成本效益的,但对它们进行估计则始终是较为实际的。尽管这种估计有一定的误差,但事实上,这些子系统仅仅只占到整个系统能量使用的一个非常小的百分比(约1%左右),导致估计其对于能量使用或PUE的最终计算的贡献只有一个非常小的误差。

可再生的新能源发电系统,如风力涡轮机和太阳能电池板在数据中心的采用,其对于供给数据中心运营能量所需的贡献不应被纳入PUE的计算,因为其掩盖了数据中心真实的性能和扭曲了度量的目的。同样,使用数据中心的废热来为办公楼供暖也不能纳入PUE的计算。

表2 数据中心电源子系统的建议分类(参见图1的分类情况)

表3列出了应被包括在PUE计算之列的各种冷却子系统。需要注意的是,当在进行数据中心的效率计算时,其中一些系统往往在不经意间被忽略,如空气补给系统、中央加湿器和供暖机组,导致数据中心的效率被高估。

表3 数据中心制冷子系统的建议分类(参见图1的分类情况)

表4 数据中心其他子系统的建议分类(参见图1的分类情况)

表4中列出了在任何一家数据中心内通常都会有的,但却没有出现在前面的表格中的照明设备及其它设备。在一般情况下,照明被包括在数据中心的能耗计算范围内,但由于每处具体数据中心的不同,有的数据中心则将室外照明排除在数据中心的能耗计算范围外。如果在能耗测量过程中,户外照明设备及其能源使用情况无法容易地从数据中心负载中排除,可以通过减去其估计值的方式被删除。

需要注意的是:人员/办公室载荷被特别从数据中心效率计算中排除掉了。这是因为,在许多情况下,分配人员负载到数据中心是极其困难的,因为绝大多数的数据中心设施都有非数据中心人员的功能在同一建筑内,而基于每处数据中心站点的不同,与非数据中心的工作人员相关的载荷量的范围又各有不同。而从数据中心负载从许多混合使用的设施的人员办公室载荷中分离出是非常具有挑战性的,但其实要真正做到这一点并不需要昂贵的投入或牵扯到太多的复杂性。接下来,我们将为广大读者介绍如何解决这类问题。

第2部分:共享资源的估计

如上文所述,正确和一致的数据中心负载分类,是确定数据中心PUE的一个重要部分。然而,正如在本文引言中所解释的,一些消耗功率的设备以及一些与数据中心运营相关的设备是与其他用途所共用的。例如,数据中心可能是与相邻的办公楼共享一个冷却装置;或者某家数据中心的UPS也可以为一处呼叫中心提供功率。即使对于这样共享设备的能耗情况的精确测量实际上也无助于数据中心效率的计算,因为该设备的能耗应该与负载相关,而不应该被包括在数据中心的PUE之内。

当一款设备是被共享时,所采取的一种常见的方法是简单地将该设备从PUE计算中省略。这可能会导致重大的错误,特别是如果该装置是一个主要的能源用户的话,如一台冷却机组。这种做法使得以基准为目的的PUE计算变得无效。一个更好的策略是估计(或间接测量)与数据中心相关的共享设备的功耗部分,然后将其纳入到PUE计算中。这种方法可以产生令人惊讶的准确结果。

例如,一款冷水机组与其他非数据中心负载共享的情况。目标是测量或估计冷水机组所消耗的功率与数据中心相关的部分。如下,有三种不同的方法来确定一款共享的冷水机组的能源使用情况:

1、在冷水机组上使用所有其它数据中心负载已知的电力消耗来测量/估计热负荷,测量/估计冷水机组的效率性能,然后使用此信息来计算正用于数据中心的负载的冷水机组的用电功率。

2、在数据中心和其它负载之间(使用水温度、压力、泵设置等)测量/估计热负荷的划分部分,测量冷水机组的输入功率,然后根据该划分的热负荷部分将冷却器功率分配到数据中心。

3、在冷水机组上关闭非数据中心负载,然后测量冷水机,以确定与数据中心相关的冷却功率。

在业界专家对数据中心能源审计期间,这类间接测量和估计的方法经常为他们所使用,但更复杂的数据中心运营商们也可以尝试。一旦为某一特定的数据中心确定了该技术,再次使用该技术来计算随着时间的推移效率的趋势就变得很容易了。

类似的技术可用于其它类型的共享资源。这些估计和建模技术可以在数据中心的软件管理工具中被形式化,以提供连续的效率报告。例如,来自施耐德电气公司的英飞(InfraStruXure)中央数据中心管理套件为在其能源管理工具中处理共享资源不断提供了增加的备选方案。

第3部分:不切实际的设备测量的估算

数据中心的每款功率消耗装置设备都可以有其能源使用测量方法。 但是,这些方法可能是相当复杂的、成本昂贵的,甚至对于一些装置的能源使用情况的测量是不切实际的。在许多情况下,在一个实际的和成本有效的PUE测定方式中,可以允许采用间接测量和设备能耗估计的方法。

例如,对于一款电源分配单元(PDU)的情况,这显然是一款功率装置。在数据中心的负载部分,PDU的能耗可以超过IT负载的10%,这无疑会对PUE的计算产生一个显著影响。然而,大多数的数据中心运营商在PUE计算时忽略了PDU能耗,因为它们被认为是难以确定的,故而造成了计算PUE的严重的错误。

PDU的功耗直接进行测量是非常难的有如下几个方面的原因:

PDU内的仪表不能直接提供功耗信息

PDU中的输入和输出仪表通常不提供瓦特值,只提供伏安或安培的电流单位

PDU中的输入和输出仪表不够准确,无法通过从输入减去输出的方法来确定功耗

在PDU有大量的输出,可能需要通过将其相加以得到输出功率

庆幸的是,一款PDU的功耗是相当确定的,因为如果提供了PDU的功能特点,其可以从IT负载直接计算得出。因此,一款PDU的功耗可以以高精准度被估计,无论该负载是以瓦特值、伏安或安培为电流单位提供的。事实上,以这种方法估计功耗通常比使用内置的PDU 仪表更准确。 一旦PDU的功耗被估计了,其就可以从UPS输出计量中减去,以获得IT负载,然后可以被算作基础设施的负载的一部分,以确定PUE。较之忽略PDU的功耗,这一简单的方法大大提高了PUE的计算。这一功能可以内置到能源审计过程中所使用的软件工具,或可以直接内置到实时的能源管理软件,如英飞中央能源管理软件系统。

结论

PUE被定义为数据中心输入功率与IT负载功率两个数据之比。虽然在最开始,想要简单的获得这两个数据的测量值,并计算它们的比例似乎是一大问题,但其实在数据中心的生产中这种简单性是很罕见的。

数据中心通常是一处具有多种用途的建筑物组成部分,因此,通过一个单一测量点就能找到数据中心的总输入功率或测量IT负载是不可能的。这就意味着,必须通过确定适当的测量点来捕获所有数据中心能源使用情况,并且典型地需要从不同的子系统的电源使用数据组合中找到数据中心的总输入功率。问题的进一步复杂化,想要通过测量获得其中一些子系统或与非数据中心应用程序共享的装置的功率可能是不切实际的。

在本文中,我们为广大读者朋友们列出了需要被纳入数据中心能源利用分析范围之内的不同的子系统的清单,以及这些子系统的能源使用情况应该如果被纳入到PUE计算中。此外,本文还为大家描述了确定数据中心共享的设备能源使用情况的较为实际的方法,及对哪些设备的能耗测量是不切实际的,以便于大家计算PUE。

数据中心运营商们需要了解:确定PUE并不需要大量,昂贵的仪器,因为在一处数据中心,许多功耗可以通过间接的测量和估计的方法来非常有效地估算。

对于典型的数据中心而言,虽然这些方法似乎很难实施,但低成本,易于使用的软件工具则可用来简化问题,并允许任何数据中心,无论其规模大小,新建或改造,都能拥有一个有效实时的能量管理系统。

关于作者

本文作者Victor Avelar是施耐德电气公司数据中心科学中心的主任兼高级研究分析师。他负责数据中心的设计和运营研究,并就风险评估和设计实践,以优化数据中心环境的可用性和效率等方面为客户提供咨询。Victor拥有美国伦斯勒理工学院机械工程学士学位和巴布森学院的MBA学位。他是AFCOM和美国质量协会的成员。