伴随着电价和IT能耗的持续上升,IT相关的能源成本正受到越来越严格的审查。在一处精心设计的数据中心,冷却耗电成本大约占到总的耗电量的37%。换言之,其实这在许多情况下,意味着通过提高冷却效率来降低IT能源成本带来了机会。
本文中,我们将为广大读者诸君介绍关于提高数据中心冷却效率的五大战略:
1、适当密封的数据中心环境
一款蒸汽密封在控制相对湿度,从而减少了不必要的加湿和除湿方面发挥了至关重要的作用。
2、优化气流
机架布置、机房空调布局和线缆管理都会影响到在关键设施内空气流通的能量消耗量。
3、在适当的地方使用节能器
在寒冷的季节,节能器允许使用外部空气以支持数据中心的冷却,从而创造了无需耗能实现冷却的机会。
4、提高冷却系统效率
诸如可变容量系统和改进的控制等新兴技术的使用,正推动室内空气调节系统效率的提升。
5、使冷却更接近热源
补充冷却系统使得冷却更靠近热源,从而减少了空气流动所需的能量。总之,上述这些方法有助于将冷却系统的能源成本减少30%至45%,并带来显著的、经常性的成本节约。再加上新兴技术的采用,如效率更高的处理器和新的基于芯片的冷却技术,这些措施可以有助于保持能源成本与服务器密度和能源价格的持续上涨步调一致。
直到最近,仍然很少有人注意到IT系统所耗费的能量成本。但是,随着能耗和电价的持续上涨,能源成本日渐受到来自企业高层管理人员们更加严格的审查,以便进行成本的管理。事实上,能源成本现在已成为了企业数据中心的选址和设计的决定因素之一。
最近,根据由Data Center Users’ Group所进行的一项调查显示,数据中心的能源效率正在迅速成为业内最为关注的优先事项。42%的调查受访者表示,他们所在企业已经对能源效率进行了分析或目前正在进行分析。受访者们普遍认为,显著的能源效率提升机会存在于冷却设备(49%)、服务器(46%)、电力设备(39%)和和存储(21%)的领域。
EYP Mission Critical Facilities Inc. 公司分析了数据中心的能源使用情况,并估计数据中心50%的能源消耗是由信息技术系统所消耗的。据了解,随着冷却和配电负载的降低,IT设备节省10%的能源消耗将带来一个额外的7%到10%的能耗减少。因此,在这方面的能源消耗减少对下游的节省影响或将达到两倍。
有一系列的策略可以用来评估IT系统能耗的降低,最值得注意的是服务器整合和虚拟化。使用虚拟化技术和数字控制技术,以提高数据中心的运行效率。
而在本文中,我们将把关注重点放在由必要的基本支持系统所消耗的剩余的50%能耗方面,如电源,制冷和照明(图1)的能耗。除技术系统本身之外,在数据中心消耗最多能源的就数冷却系统了,其能耗占到了数据中心用电量的37%。
最近几年,随着服务器密度上升到了前所未有的水平,数据中心对于冷却系统的需求大幅上升。这种变化不仅带来了制冷系统容量需求的增加,同时也暴露了数据中心现有冷却方法的效率低下。其结果是,冷却现在已然成为了许多数据中心(并也仅仅只是减少了IT设备负载)节省IT能源成本的第二大机会。
这方面的节省可以说是相当显著的。例如,假设支持系统所消耗的能源量与IT系统大约相同的话,那么一处3兆瓦的数据中心设施将需要6兆瓦的电力。而如果电力成本为每小时10美元,这一数据中心设施的年度总能源成本将达到525万美元(600美元/小时 8765小时)。而IT负载降低10%,就将会节省105万美元,而冷却系统效率提高30%会节省约58万美元的开支。
图1:数据中心能耗比重
1、适当密封的数据中心环境
冷却通过数据中心的地板、墙壁和天花板损失,或通过外部的关键设施所带来的湿度降低了冷却系统的效率。因此,数据中心应尽可能地与一般建筑和外部环境隔离开来。
在任何时候,保持门的关闭,并使用蒸气密封来隔离数据中心的空气。蒸汽密封是控制数据中心环境的最廉价且最重要的方法之一,同时对于保持适当的湿度水平是特别重要的。
如果数据中心的湿度太高,就可能出现导电性阳极故障(CAF)、吸湿性粉尘失败(HDF)、磁带介质错误和过度磨损和腐蚀。而如若相对湿度的增加超过55%以上,这些风险将成倍增加。
而如果湿度太低,则将增加静电放电(ESD)的幅度和倾向,其可能会损坏设备或对操作运营带来不利影响。此外,当暴露于相对湿度较低的环境下,磁带产品和介质可能会发生过多的错误。
ASHRAE已经将数据中心环境最佳的相对湿度定义为40%至55%。机房精密空调(CRAC)根据需求,通过加湿或除湿进行湿度控制,加湿或除湿两者均需要消耗能量。而采取有效的蒸汽密封可以在加湿或除湿过程中降低能量消耗的量。
蒸汽密封通常是通过结合使用塑料薄膜、汽阻涂料、乙烯基墙纸和乙烯基地板系统所打造的。所有门、窗和线缆的入口也应密封。
这是任何提高效率计划的第一步。如果操作房间没有被妥善密封,那么随后所采取的所有其他的提高效率的措施都将是事倍功半的。您企业可以通过各种工程咨询公司或您企业的冷却系统供应商来对数据中心进行评估,以帮助您查明和确定外部空气从何处进入您数据中心的控制环境,并就适当的密封策略提出建议。
2、优化气流
一旦操作环境的密封工作完成之后,下一步工作便是确保高效的空气流通。其目标是利用最小的能耗量将最大量的热量从设备移走。而优化空气流通需要评估和优化机架的配置、空调的布局和线缆的管理。
机架布局
目前所生产制造的大多数设备都是被设计为从正面吸入空气,并从后 面排出。这使得设备机架可以被安排为创造热通道和冷通道。这种机架安置方法,使一排排的机架面对面,每排机架的正面都能够从同一过道吸入冷空气( 冷 过道)。两排机架排出的热空气形成一个 热 通道,提高了返回CRAC的空气的温度,并使得CRAC得以更有效地运作(图2)。
图2:热通道/冷通道配置
冷、热空气不混合,这种方法是最有效的。因此,穿孔地板应该从热通道中移除,并只在冷通道使用。冲裁板应该被用来填补机架的开放空间,以防止热空气通过机架被吸入。
某些类型的电缆管也可用于防止冷空气通过电缆开口进入操作空间,其通常在机架后部。
其他额外的步骤,包括诸如使用返回天花板通风室以吸取空气返回机房空调,在冷通道尽头的物理窗帘对于减少冷空气和热空气的混合也被证明是非常有效的。
CRAC布局
使用热通道/冷通道的方法的时候,CRAC单元应始终垂直于热通道,以减少空气流动,并防止热空气因返回空调被拉到冷通道(图2)。 一个返回天花板通风室,可有效地减少热空气和冷空气的混合。
线缆管理
数据中心所必须支持的服务器数量的爆炸似增长已经为许多数据中心设施带来了线缆管理方面的挑战。如果管理不当,线缆可通过堵住穿孔地砖而阻碍空气流通,并妨碍热空气从机架后部排出。故而检查地板下的通风状况,以确定电缆或管道是否被阻塞,而妨碍了空气的流通。架空电缆正变得越来越流行,从而消除了阻塞的可能性。更深层次的机架现在可以增加的空气流动。有时现有的机架可以配备扩展通道,以增加电缆和空气流的深度。使用电缆管理的时候要谨慎,因为它们并不兼容所有IT设备的空气流动模式。
最后,但也许是最重要的,调查将高电压三相电源尽量靠近IT设备,并且增加IT设备的电压。这些步骤将最大限度地减少地板下的电源电缆的数量和大小。有时这可以通过在机架内使用高电压三相管理电源插排来完成,但也可能需要使用多极配电盘或IT设备机架行内的PDU。
可以添加风扇到机架的后部,以便从机架吸走热空气,但要知道,这些风扇也同样需要消耗能源,并产生额外的热量,必须从操作空间移除。
3、使用节能器以实现无需耗能的冷却
在许多地方,外界的冷空气可被用来补充数据中心的冷却,并能够在寒冷的季节提供 免费的冷却 。这是通过使用节能器系统来实现的。根据巴特尔实验室(Battelle Laboratories)的一项楼宇控制系统调研发现,平均而言,那些采用了节能器的数据中心建筑的加热和冷却的能源使用强度(EUI)要比那些没有的低13%。
节能器系统有两种基本类型:空气节能器和流体节能器。而为一个特定的项目选择一款合适的节能器类型应该是由气候、代码、性能和功能偏好综合考虑的结果。
空气节能器
空气节能器使用一款由传感器、管道和阻尼器所组成的系统,以允许适量的外部空气进入,以满足设备的冷却要求。空气节能有两种类型,即 干燥空气 系统和 蒸发式空调 空气系统。前者是最常见的,但是其使用被严格限制到极少的地理位置,因为当环境空气的露点温度(Dew point temperature)低于35 ̊F时,添加湿气到操作空间所需的能量成本会相当高。而蒸发条件解决方案则是用于在外部空气进入数据中心之前,进行有效调节的一种经济的方法,但其可靠性和高维护方面的要求通常也使得这种方法对于大多数数据中心运营商而言没有多大的吸引力。
这两种解决方案的关键在于适当的控制。控制应基于热含量(enthalpy)的比较,而不仅仅只是干球温度计(dry bulb
)的温度。同样,相关的这些方法还必须实施对于花粉、灰尘或其他外来污染物的检测,并有效地在发生这些情况时锁定节能器。
流体节能器
流体节能器系统一般被划归为一款冷冻水或基于乙二醇的冷却系统,并与一款由冷却塔或蒸发冷却器又或干冷器组成的散热环路配合工作。CRAC单元采用了传统的乙二醇冷却单元和一款辅助冷却线圈,控制阀和温度监控器。在寒冷的季节,乙二醇溶液从室外干式冷却器或冷却塔返回到辅助冷却线圈,成为操作空间主要的冷却来源。只要 免费的冷却流体 是8 ̊F ,低于CRAC返回的温度,运行 免费的冷却 就能够带来益处,因为其最大限度地减少了对于主要冷却方式的负载。
流体节能是大多数数据中心环境系统的首选,因为它们不会受到室外湿度水平的影响,故而对于较宽的温度/湿度范围都是有效的。他们也不会给数据中心增加任何额外的空气过滤要求。
4、提高操作空间空调的效率
对于优化CRAC单元的效率而言,有三大至关重要的因素:
部分负载的情况下运转效率如何。
当CRAC单元在移除显热(sensible heat)时,较之潜热(latent heat)的运转效率如何。
多单元一起工作的效率如何。
在部分负荷提高效率
数据中心均设计了某种程度的冷却系统冗余。此外,随着室外环境温度下降到低于设计的峰值条件(通常为 95 ̊ F),一个直接扩展的实际容量或空气冷却的CRAC单元将增加。
这意味着设备始终在低于100%的负载水平操作,由此带来了在正常操作条件下设计系统以更有效地操作运营的机会。因为操作条件是不稳定的,这需要能够根据操作条件变化而进行相应的容量变化的一些方法。
有几种方法可以在一款直接扩展的CRAC单元提供可变容量。而最常见的两种是四步压缩机卸载(four-step compressor unloading)和数字化涡旋压缩机技术(Digital Scroll compressor technology)。
四步压缩机卸载的概念适用于通过在系统内关闭一些气缸制冷剂;从而最小化循环压缩机开启和关闭的需要,以控制容量能力。因为卸载本质上改变了压缩机的操作点,使得冷却系统以更低的容量能力更有效地运作。例如,一款有着两个压缩机 卸载 的系统所消耗的能量大约为满载系统的50%,但将提供76%的容量,因为在冷凝器和蒸发器的规模为满负荷。下图3显示出了通过压缩机卸载所能够实现的效率改进。
数字涡旋式压缩机技术提供了一种新的方法,以便为所需的负荷精确地匹配容量和功率消耗,并且可以比标准的 固定容量 压缩机提供显著较低的能量消耗。
传统的调制技术(循环单位和关闭匹配的负载条件)往往消耗了接近满负荷的能量,而不是实际所需的容量。在一款高可靠性设计的系统中,压缩机不只是打开和关闭。在压缩机实际运行时,会有一个开启延迟期和关闭泵的停机时间,确保在断电之前适当的润滑油进入压缩机轴承。
数码涡旋技术让压缩机不会循环。其可以线性地降低功耗,因为其容量调节能力,从而带来了最佳的系统性能和控制。
图3:压缩机卸载启用的四个阶段的容量能力与能源消耗
这种技术是通过与艾默生环境优化技术公司的一项独家协议应用到数据中心的,后者研发了谷轮数码涡旋压缩机,而艾默生网络能源公司则开发了Liebert DS精密冷却系统。整合谷轮数码涡旋压缩机到Liebert DS系统使得Liebert DS系统的容量调制从10%达到100%。如图4所示,以一个简单、可靠的方式实现了精确的温度控制。
图4:数码涡旋压缩机消除了压缩机调制方式随着容量的变化,提高了效率
改善显热/潜热移除功能
IT设备产生显(干)热。潜热来自于人员及渗透室外湿度(可通过上文所讨论的蒸汽密封实现最小化)。
随着服务器的密度或容量的增加,带来了一个相应的显热负荷的增加。潜在热负荷不受影响。因此,使用冷却解决方案,可以在一个100%的显容量能力运行,除了当要求除湿时,将导致能源消耗的减少。在较低的容量下操作可变容量的压缩机,提高蒸发器盘管的温度。这意味着更少的潜在冷却发生。在绝大多数负载条件下,蒸发器盘管温度足够高,达到100%的显冷。因此,添加被意外去除的湿度无需消耗能源。
跨多个单位改善协调
随着较新的高密度服务器被部署在旧系统旁边,数据中心环境变得更加多样化了。由此所导致的一个结果便是,如果操作空间冷却单元之间没有进行适当的协调,空调可能会在不同的温度和湿度控制模式下运行。例如,在房间北侧的一台空调可能会感测到相对较低的湿度条件故而会增加湿度,而在房间南侧的一台空调则检测相对较高的湿度,因而会去除空气中的水分。 空气中的实际湿度是相等的,但由于这些测量都是一个相对的测量,温度越高,相对湿度越低。先进的控制系统可以在一个操作空间内跨所有的CRAC单元进行部署,使得各台空调设备能够进行沟通和协调,防止 战斗模式 。
5、部署补充冷却
补充冷却是一种相对较新的数据中心冷却方法,是由艾默生网络能源凭借其Liebert XD系统率先开发的方法(如图5)。其在2002年首次推出,而随着数据中心管理人员寻求解决方案,以帮助他们实现以下需求,使得这种方法获得了快速的普及。
克服高架地板系统在高密度应用中的冷却容量能力限制。
提高冷却系统的效率和灵活性。
高架地板冷却被证明是管理数据中心环境的一种有效的方式;然而,随着机架密度超过5千瓦,以及跨操作空间的多样性负载的增加,应当对补充冷却对冷却系统的性能和效率所造成的影响进行评估。
在更高的密度情况下,在机架底部的设备可能消耗了太多的冷空气,进而造成剩余的冷空气量不足以供给机架顶部的设备。活动地板的高度造成了被分配到整个操作房间的空气量的物理限制,所以,添加额外的空调可能无法解决上述问题。
国际正常运行时间协会(The Uptime Institute)的研究报告称,位于数据中心机架顶部的三分之一的设备发生故障失败的频率往往是同一机架底部的三分之二的设备的两倍。该组织还估计,当操作温度超过70 ̊ F时,每提升18 ̊ F,设备长期的可靠性将下降50%。
提升机架密度和高空间多样性的解决方案被证明是一种泵制冷的冷却基础设施,支持冷却模块直接放置在高密度机架的上面或旁边,以补充通过地板的空气。该解决方案具有许多优点,包括增加冷却系统的可扩展性,带来更大的灵活性和能源效率的改进。
有两个因素有助于提高能源效率:冷却模块的位置和所使用制冷剂。
高密度应用需要基于流体的冷却,以便能够有效地移除所产生的高热量。从效率的角度来看,对于高密度而言,制冷剂的冷却效果要比水更好。在Liebert XD 系统中所使用的R134制冷剂被泵以液体形式输送,但当它到达空气时转换为气体。这种改变有助于提高系统效率。 在传输热量的效率方面,R134比水大约高700%。巧合的是,700%比空气更有效。这也确保了昂贵的IT设备不会在制冷剂泄漏的情况下受损。
图5 :Liebert XD 系统
在Liebert XD系统中,制冷剂被输送到冷却模块尽可能地靠近热源。这减少了空气流通所需的能量,带来了额外的能源节约。
同时,较之仅仅靠高架地板冷却,制冷剂的效率和冷却模块的位置可以降低27%的冷却系统能源成本(如图6)。
图6:补充冷却优化效率
此外,制冷剂的使用减少了20%的制冷机的容量要求。进一步节约了能源,也带来了额外的冷却能力,无需添加额外的冷却器。
传统的地板安装的冷却系统在地板下的进行空气输送将继续在数据中心环境管理中发挥重要作用。我们建议,传统的系统被配置为提供第一个100瓦每平方英尺的热负荷所需的冷却,并解决操作空间的充分加湿和过滤的要求。补充冷却可以为超过150瓦每平方英尺的密度进行部署。
新兴技术
伴随着今天大多数企业组织的计算需求,能源成本在未来也将有可能继续上涨。而企业在采取措施以增加冷却系统的效率的同时还可以采用更新的、更高效率的技术,以抵消能源成本上升的影响。如下三种技术在提高数据中心能效方面特别有潜力:
多核处理器
嵌入式冷却
芯片级冷却
现在,新的服务器基于多核处理器,使一款单一的处理器能够同时执行多个单独的任务,在单个处理器上运行多个应用程序,或在较短的时间内完成更多的任务。芯片制造商声称多核处理器可以减少功率和散热高达40%。
嵌入式冷却使用 Liebert XD 冷却基础设施提供高效率的冷却直接进入机柜中。这种方法带来的冷却更接近热源,并允许冷却系统针对特定机架环境进行优化。使用此方法如何高效的一个例子来自Egenera公司和艾默生网络能源公司的CoolFrame系统。该系统能够通过热量离开机架前将其移除,从而防止20千瓦的热量从Egenera公司的BladeFrame系统进入操作空间。
芯片级的冷却通过将热量从芯片移除进一步将这种方法发展到下一个新的水平。随着嵌入式和芯片级的冷却解决方案的部署,一个高效的三层的方法来实现数据中心冷却将出现。在这种方法中,热量能够有效地远离芯片,然后在机架上冷却,使得空调能够保持操作空间稳定的温度和湿度。
这些发展预计将不会降低数据中心冷却要求。相反,它们将导致计算能耗的增加,而计算则需要由一个特定的设施来支持。其结果是,今天所取得的效率的提升将继续在未来产生效益,而未来更新的技术的发展又将达到今天现有设施所不可能支持的密度。
结论
冷却系统是数据中心提高效率的一个显著的机会。在许多情况下,进行相对简单和成本便宜的变化,如提高操作空间的密封,移动电缆或阻碍空气流动的其他对象或安装冲板,可以立即产生效益。此外,采用新的技术,诸如可变容量操作空间空调和复杂的控制系统时,应考虑其对效率的影响。最后,补充冷却系统能够增加设备密度的一个响应,可以提高现有的冷却系统的可扩展性和效率。