构建数据中心的基础设施容量能力以实现更高效的运营

您企业的数据中心应该有一套成功的基础设施容量能力方案,以便能够支持所有的日常运营。

在本文中,相关的业界专家将为我们广大读者诸君分析导致您企业数据中心高密度的原因,以及如何就您企业数据中心的重要工作负载所需要的空间、电力和冷却等进行有效的沟通。此外,文章还将为您推荐关于基础设施容量能力分析问题的四条指南,以帮助开发一套切实的、能够满足您企业未来需求的数据中心战略。

如何定义数据中心的规模大小、密度?

有大量的指标来衡量数据中心的占地面积、电力和冷却需求。而数据中心管理者协会AFCOM则认为现在是时候削减这些方面的需求了。

您会不停的听到有业内相关从业人员抱怨表示说 我们的数据中心非常密集 或’我们的数据中心规模太小’,但这其实并不真正意味着什么,或者他们的抱怨会涉及到任何具体的数据。 AFCOM的总裁汤姆 罗伯茨说。

该协会的数据中心研究所智囊团与数据中心的设计师、运营商和供应商们合作,对数据中心的规模大小和密度等相关术语条款进行了资格认证,提出了相应的数据中心标准。如下,是对其数据中心标准介绍文章的相关摘录。

AFCOM通过空间计算来描述数据中心的规模大小,并通过测量峰值千瓦(kW)负载来描述数据中心的密度。

达到极致

AFCOM将数据中心密度细分为四类:低密度(达到每机架4千瓦)、中密度(5千瓦到8千瓦)、高密度(8千瓦到15千瓦)和极端密度(平均每台机架超过16千瓦)。

对于数据中心密度的关注是非常及时的。较之五年前,今天的托管合同会更多的涉及到电力的问题,而彼时的合同谈判内容还大多聚焦在数据中心占地空间方面,美国的一家托管空间提供商Infomart Data Centers的总裁 John Sheputis表示说。

服务器整合 随着虚拟化和处理器的不断发展演化,数据中心每平方英尺的密度也在不断增加。所需管理的机柜和电源供应设备越来越少,保持日常运维的各种线缆也在减少 从一个IT运营的角度来看,所有这一切都是相当美好的。但这些趋势却改变了对于高密度和低密度的理解,Sheputis表示说。

Cosentry公司是一家总部设在内布拉斯加州奥马哈的一家托管服务提供商,该公司通过跟踪其基础设施每台机柜的平均功耗来为服务器空间的设计设置基准。 十年前,每台机柜的平均功耗大概是700〜800瓦。 Cosentry公司数据中心服务副总裁Jason Black表示说。 五年前,平均功耗大概是1.5千瓦。而现在则达到了3千瓦。按照目前的趋势发展下去,我们预计在未来五年内,将看到平均功耗达到5或6千瓦。

当Infomart数据中心将其达拉斯的操作运营与俄勒冈州希尔斯伯勒和圣何塞的Fortune数据中心合并,并收购Ashburn获得了前美国在线公司位于维吉尼亚州Ashburn的数据中心时,亲身经历了这种体验。

较之新的数据中心,旧数据中心的能量密度要低两到三倍。 Sheputis表示,并补充说在很短的时间内,能量密度的标准变化很大。

对比旧的Ashburn设施与达拉斯州的先进设施,这种密度的差异是相当明显的。在其于2015年再次投产运营前,Ashburn数据中心重新进行了改造,不仅仅只是针对数据中心运营操作空间的改造,同时还包括高密度的操作。

AFCOM计划汇总类似的跟踪基线,并通过规范化数据中心规模和密度的术语进行大量的数据比较。

关于数据中心密度的细节问题

虽然AFCOM对于数据中心的总密度进行了类别分类,但在空间规划过程中仍然存在一些细节问题。

以前,同样平方英尺的空间占地面积仅仅只承载2千瓦的混合机柜,现在则承载着一排8千瓦的服务器、每台消耗4千瓦的一组存储阵列、以及低功率网络和外设机柜。在数据中心中的一个部分处理大数据的超级计算岛(supercomputing island)每台机架为15千瓦,而其他的每台机架仅使用3千瓦或每4千瓦。设施规划不仅仅只是汇总电源和冷却需求,同时,对于空间占地面积的讨论仍然是相当有用的,Black表示说。但最重要的则是:在一处既定的占地空间,到底有多少可用的机架占地空间。因此,AFCOM对数据中心的规模大小进行了分类,从迷您型(可容纳多达10台机架)到兆级(空间超过9000台机架),结合了密度测量,以生成数据中心功率需求信息。 每平方英尺的瓦数对于当今的工作负载是一项重要的标准。 Cosentry公司的Black说。

由此,近年来所发展出的:机柜定位单元(Rack location unit)这一概念术语,便是为了帮助估计在一个给定的占地面积的利用率,或估算容量能力。前考虑到了机柜的占地面积和冷热通道。但并不是每一家IT企业组织均可以通过这个指标来讨论他们的数据中心的需求。

在许多情况下,数据中心物理空间的管理已经抛给了具备专业知识的其他领域的IT人员,如存储和网络专业人士。 Black说。 大多数人都只是在数据中心进行部分的优化,并不知道整体性的最佳实践做法。

在一处企业内部部署的数据中心,围绕功率和密度获得清晰的掌握也许没有什么大问题。毕竟,每月电费账单由设施的预算产生,只要持续对数据中心操作运营空间里最热的机柜实施冷却,您具体使用何种术语并不重要。但到了今天,企业内部部署的数据中心的设施大都面临着使用寿命的结束或需要进行重大的更新升级,电力使用效率来自于政府行政部门的审查,故而使得许多企业组织计划迁移到一处托管设施。突然间,企业组织的IT领导者们需要掌握如何就重要工作负载所需要的数据中心的占地空间、电力和冷却进行有效的沟通。

AFCOM的意图是能够让数据中心的经理们能够测量计算空间、设计密度和电流的功率,并清楚其数据中心的运行情况。例如,一处设计为低密度的小型数据中心,目前以52%机架产量在中等密度运行。

借助基础设施容量规划避免增长过程中的烦恼

预测未来的数据中心空间,电源和冷却要求是一个不可能完成的任务,但却必须做到。这从来都不容易,而随着云计算的出现,使得基础设施的容量规划变得更为困难。

建设、整治、更新、升级或扩大数据中心不仅成本昂贵,而且是具有破坏性和潜在的危险的。

数据中心占地空间始终是很难获得的,所以您企业肯定不会想要超出您所能证明真实需求的占地空间。这也同样适用于电源和冷却:相关的机电设备需要占地空间 有时甚至与计算领域一样多或更多 并且,对这一部分实施扩展的成本最昂贵。声称您需要比您以往任何时候所使用的瓦特数量都多可能是没有考虑到一个数据中心项目的价格因素,并或将导致失败的节约措施。而不准确的容量估计最坏的结果可能充其量是相关人员职业生涯的结束,而最好的结果也会对IT基础设施的性能带来负担。

没有人能100%精确地做到这一点,但借助基础设施容量能力问题分析指南,来开发切合实际的,可应对未来需求的预测方针。如果您企业采用一种合理的方法来规划产能的增长,就可以证明这些要求。

图1、一处数据中心的机柜占据了更多的地面空间,而不仅仅只是其本身的占地面积

IT人员往往倾向于只考虑机柜数量方面的问题,但他们其实更应该考虑数据中心的地板空间建筑面积。一台机柜到底占据了多少空间?有一些方法能够回答这个问题,所以企业选择一种切实有意义的方法,并持续使用该方法。

实际的机柜所占用的具体的数据中心空间面积都有一个特定的宽度和深度,但即使这种情况也正在改变。机柜正变得越来越大,以便能够适应更高的设备密度,更深的服务器形式因素和多电缆连接。30英尺宽 48英尺深(760毫米 1200毫米)外形尺寸的机柜不再是不寻常的了。

由ASHRAE TC 9.9定义的实际的机柜空间占地面积还包括了机柜周边的过道空间(参见图1)。涉及机柜的结构楼面荷载和热密度及其周围的区域。如果一款设计要求4英尺(1.2米)的过道两侧安置30英尺 48英尺的机柜,那么,此时的机柜占地面积的测量就应该是2.5英尺 8英尺或20平方英尺(1.83平方米)。您可以单独计算机柜柜和过道区域,但这种方法可以更容易。

空白空间

总的IT工作领域的空间占地面积应该是机柜的数量乘以机柜的占地面积。为了包含现代配电设备,每行增加另一个大型机柜。

然后考虑配套的冷却设备和行过道尽头所需的移动设备,提供服务并符合消防安全规范。主通道加上冷却设备可以很容易地从机柜占地面积空间增加75%至100%到计算出的地板空间。真正高效的设计需要更少的空间。 相反,糟糕的形状或充满柱子的房间会占用更多的空间面积。而借助这些数据,您就不会出现严重低估或过度估计的错误。对于更高的精度的估计,为新的空间需求提前选择一种电源和冷却的方法。然而,若是以估算为目的,选择不同的方法所带来的差异并不特别显著:行内冷却器就像额外的机柜,但要排除大部分的周边计算机房空调(CRAC)空间;后门热交换器增加约6英尺(150毫米)到机柜的深度,从而增加了机柜的占地面积,但消除了最标准的CRAC。

容量能力外包

若要试图预测有多少机柜的IT容量能力将选择去托管或租用的站点,或者将被云实例所取代。不妨从贵公司对于外部服务的倾向的一个现实的评估开始。让贵公司的管理层 包括财务管理 参与到制定估计的过程中来,以便让企业共享业务方向,并确保对最终产品的支持。

提出如下指导方针问题,以实现一个切实的容量估计:

您企业的客户流失率如何,以及所使用的系统是什么?频繁改变的设备不太可能部署到异地站点。托管站点会为基础设施要求的改变收取大量的费用,因此对稳定的运行采取外包更为经济有效。取决于正在发生变化,云服务可能是更适合选择,而不是选择内部硬件。列出您企业的系统,并注意每款系统离开数据中心的可能性。

您企业操作运营的风险承受能力如何?操作运营需要是高度安全的且需要规避风险的,故而不太可能考虑云服务的选项。托管网站的备用电源、冷却和连接可能不如贵公司现有的数据中心可靠。单独列出您企业的系统列表以便进行风险水平分析。

在运营处理大的存储需求时,无论是存档或镜像操作,备份存储是异地位置的一个很好的备选方案嘛?

本文中,我们使用了实际的能量消耗来描述机柜的密度。实际的功耗要比总的铭牌额定值的要少得多。铭牌额定值可能会误导数据中心设计人员配置比在现实消耗高40%至60%的电源可用性。请按照以下步骤配置合适的UPS系统。

电源、冷却和密度

IT基础设施的空间不包括设备的空间:不间断电源(UPS)、冷水机组、水泵、主电源中心、发电机等主要设备。作为一个经验法则,为您的数据中心的不间断的二级的设施至少多估计50%的总占地面积,为三级操作至少多估计75%,而至少为四级多估计100%。

压缩 数据中心设备将更多的功能打包进入了更小的外形尺寸 增加了每台机柜所需要的电力和冷却量。但其在实际空间需求方面所带来的差别并不大,因为虽然设备继续变得更小且更强大,我们总是希望获得更多。

密度并不是不断蔓延的。尽管预测的机柜将达到25千瓦到40千瓦,但只有一小部分的数据中心机架超过了8千瓦至10千瓦,大多数仍然是在5千瓦至8千瓦的范围内。因此,除非您企业是一家高性能计算的研究实体,否则装满整整一个机房的35千瓦的机柜是不现实的。而进行电力需求规划是切实的。如果您企业的机柜配备了计量配电盘,特别是如果您使用的是数据中心基础设施管理软件。来记录每台机柜随着时间的推移的功率情况,您就能准确地判断实际负荷。

表1:使用此图表来估计数据中心的功率消耗情况。

如果您不确定当前的功率消耗,有几种方法来进行估计:

1. 阅读您企业的UPS监控显示面板。用总的负荷除以机柜的数量来获得每台机柜的平均瓦数。如果您企业运行的是2N UPS配置,每台UPS承载一半的实际负载,所以读取两个系统,把它们相加,再除以机柜的总数。同时也需要考虑异常机柜,比如,高利用率的刀片服务器每台机柜可以运行12千瓦。

2. 看看分支电路板的断路器评级。断路器应加载到只有80%的评级一个连续的基础上。使用图表1以确定机柜电路的最大容量。如果您企业的机柜是双线路,具有功率来自两个不同的面板和断路器,最大负载只能基于其中之一。

3. 安排一名电工用钳式仪表来测量每个支路上的实际负荷。这些都是瞬时的测量,而没有考虑到一天内的波动,但其也有助于估计真实的机柜负载。对于双线路机柜,从断路器到每个机柜添加载荷。

4. 整合最高密度机柜以进行空间预测。不必为这个级别而进行整个数据中心的设计,将其划分为高密度和正常密度的要求,以降低成本和占地面积。为真正的高密度机柜添加25%至地板面积(15千瓦或以上),以考虑额外的功率和冷却要求。如果您企业利用完全冗余的2N 冷却系统,另加25%。

设计变革

良好的设计使您企业数据中心能够添加容量单元到基础设施,而不会对操作运营带来影响。这降低了初始资金预算,允许随着业务的发展而线性的增加容量,并提高了能源效率。

坚持为模块化、阶段化的设计进行成本估算。没有理由安装最大预测的UPS和冷却能力,以支持某一天的操作。这样会吞噬掉您的预算。

在新的空间开始运行之前,有些东西必须完全安装。管道和主接线必须到位,否则,当利用率增长时,您在数据中心内部的运行会有相当繁重的工作。在电气/机械支持区域扩建后的工作可能包括需要一次IT关闭,其会很快毁掉您企业在基础设施容量能力计划的任何成功。