数据中心世界网

   18611334022 [注册]

新闻

技术

您现在的位置是:首页 > > 技术 > 供配电 >正文

现代数据中心供电系统规划与方案的选择

来源:中国绿色数据中心       作者:      更新时间: 2019-11-22 18:46:00
为数据中心的关键负载配置供电系统,首先要有正确的科学的选用原则,并遵循科学规范的规划设计流程……
  为数据中心的关键负载配置供电系统,首先要有正确的科学的选用原则,并遵循科学规范的规划设计流程。长久以来,人们设计和建造供电系统时,把主要精力和关注的目标放在对优质设备(主要是UPS等关键设备)的选用上,却忽视对供电方案的分析研究,或者简单地套用已成型的供电系统方案,其结果是,系统选用的供电方案和设备可能是一流的,而建设结果却达不到设计预期的效果,甚至是一流的设备因系统设计的不完善而不能正常可靠地工作。陈旧的观念和对很多问题的误解,付出的代价的是高昂的成本、过长的建设周期,而系统的可用性、可扩展性、能源效率、可维护性等方面却不尽人意。

  3.1 选择配置供电系统方案的原则与规划

  在规划供电系统方案时首先要考虑的问题有:

  数据中心的定位和可用性要求;

  数据中心的规模和供电容量;

  电网环境和负载性质;

  数据中心基础设施的可持续发展规划,包括数据中心资源或能力的利用与扩充、可扩展能力和改造的可行性;

  投资成本与经济性;

  能源效率要求;

  规划设计供电系统时必须综合考虑以上要求,有的放矢地选用最佳的供电方案。

  3.1.1 数据中心业务定位和对供电系统可用性要求

  不同业务定位的数据中心在对可用性要求方面有着明显的差别,有些科研和教育系统的数据中心对供电系统可用性的要求不高,或者没有要求,因为这种类型的数据中心对业务的连续性没有苛刻的规定。而对可用性要求的另一个极端是诸如金融系统的数据中心,这类数据中心应该是24×7连续运行的,不允许有任何的中断(包括计划内的维护)。

  对数据中心可用性的一般性论述,概括起来就是指在整个数据中心的生命周期内,在外部资源能够充分得到满足的前提下,在保持业务连续性的同时,具有较高的灵活性,满足按需建设、后期升级扩容等要求。而在外部资源有限情况下,能够做到资源的合理使用。但是,具体到供电系统,可用性的概念就更具体,并且可以量化。这里讲的是可靠性科学范畴的可用性,见本文第二篇“2.2 对系统可靠性的研究向可用性研究变化”。

  规划供电系统可用性时,要考虑的条件和因素很多,但关键的因素是对成本的分析。

  数据中心宕机成本:确定供电系统应具备的相应的可用性等级;

  数据中心预算成本:制约供电系统可用性等级的提高。

  规划设计者必须在数据中心宕机成本和建设预算成本之间作出选择。宕机成本取决于风险承受能力,预算成本取决于建设投入能力。

  一个复杂的高可用级别的供电系统的成本可能是最简单的供电系统的几倍甚至是十几倍。表3.1是两种UPS供电系统配置的比较。表中以最简单的系统的设备量为基数。

\

  表3.1讲的都是数据中心供电系统建设的初期投入成本,而作为规划设计者来说,还应从经济性的角度对供电系统的成本做全面的考察。以最低的初期投入和运行维护费用获得最大的经济效益。这就需要针对生命周期内的经济效益进行评价,要考虑整体寿命周期中的建设、运行、扩容、管理和维护的总成本。在数据中心总体拥有成本中,运营成本占TCO的比重比建设成本大得多。如果运营期间的运营投入过高,可能会使数据中心入不敷出,最终导致失败。

  若想减少供电系统的建设投入成本,必须在方案选择设计、设备配置和设备选用过程中,本着经济、实用、合理的原则,进行多方面的反复调研和论证,使其在保证可靠性和先进性的同时具有良好的性价比。

  3.1.2 数据中心供电系统建设规模与容量

  对供电系统的容量做规划设计时,要考虑可扩展性、适应性、可改造性能(经济可能性和技术可行性)等,以保证数据中心的可持续发展能力。为了满足将来动态业务的需求,在规划设计阶段必须预测5年或10年之后的电力需求。在方案确定、产品选型和设计上都应具有一定的超前性并留有充裕的扩容空间,而且系统实施方案也应具有扩展性和灵活性。

  在数据中心规划设计初期,在数据中心规模、IT设备类型和数量、供电制冷方案和设备等重要因素还没有完全确定的情况下,就需要有一种正确的贴近实际情况的方法来估算用电容量。统计估算范围应包括:

  IT设备,包括消防、安全和监控系统;

  供电设备的损耗(由效率决定):包括发电机、变压器、各种转换开关、各级配电、传输线缆、UPS系统等;

  制冷系统,包括制冷、空调、温湿度调节、新风等设备;

  安全与照明;

  辅助设备。

  ① 对关键负载供电容量的统计估算

  关键负载是指构成IT业务架构的所有IT硬件组件,还包括相应的安全系统、消防和监控系统。首先需要列出所有这些设备的标称额定功率,然后必须调整标称数据以反映预期的真实负载。在绝大多数情况下,标称功率远远高于实际的运行功率水平。著名工程咨询公司和电源制造商的研究显示,大多数IT设备的标称额定值超出实际运行负载33%。

  数据中心的负载不是一成不变的。建成后,在数据中心的生命周期内,IT设备将几乎一直处于一种不断变化的状态。IT更新至少3年一次循环,到时候会更换或添加新的、功能更强大或效率更高的设备。应该由IT组织对将来变化和升级的范围和时间做出切实的评估,这样可以正确规划最初确定的功率需求。

  ② UPS供电系统消耗的功率

  对供电系统的能源消耗进行估算的前提是,首先要根据数据中心可用性要求,确定UPS供电系统可用性等级和相应的供电方案,然后对供电系统所有设备在实际运行时的工作效率做符合实际情况的估算。表3.2列出了一个现代数据中心常用的2N或2(N+1)UPS供电系统主要设备和整个系统的效率的范围。

  表3.2 供电系统各种设备的效率范围

\

  对于供配电系统的个个环节,可以根据目前和未来的负载情况进行扩展或调整,但是估算时必须充分考虑已确定的初始负载和未来可能扩容的负载,或者供电方案本身可以在不影响IT客户的期望可用性的前提下增加功率容量。

  ③ 照明设施负载

  照明设施负载包括数据中心的全部照明设施,是数据中心占地面积的函数。此类型负载的估算可采用下面的经验公式:每平方英尺2瓦或者每平方米21.5瓦。

  ④ 制冷负载

  制冷系统包括制冷、空调、温湿度调节。制冷在效率上有很大差别,不过可细分为冷冻水系统和直接膨胀系统。冷冻水系统的效率通常更高,功耗值通常为所支持总峰值负载(指IT设备用电和其它所有基础设施设备的效率损耗)的70%。直接膨胀系统需要大约所支持总峰值负载的100%。系数0.7和1.0是适用于气流组织较好的机房,如果气流组织不理想,冷热气流的混合会明显地增大制冷功率,此系数应改为1.0和1.3。

  ⑤ 估算电力电网系统的容量

  估算电力电网的容量时,要在所需的总电力线路容量基础上乘以125%,以满足国家电气标准的要求。数据中心内负载的稳态功耗决定了用于计算电力成本的功耗。但是,为数据中心供电的电网和发电机电源不能按稳定状态值估算。这些电源必须按负载峰值功耗估算,再加上标准或工程惯例所规定的降额系数或裕度,这样会导致供电馈线和发电机的设计容量高于上面估算的范围。

  ⑥ 估算发电机备用电力系统的容量

  首先要注意假设数据中心是柴油发电机的唯一的负载,主供电电网故障后上面估算总容量都要通过转换开关转移到发电机上。再者还必须考虑这些负载的电力特性,例如,制冷系统负载需要高启动电流,UPS可能会将超前(容性,由无源滤波引起)功率因数施加到发电机上,这些都会影响发电机提供所需电力容量的能力而且如果它,还可能导致发电机出故障。

  3.1.3 数据中心供电系统规划设计流程:

  数据中心出现近40年之后,对基础设施的设计建造很多还停留在手工行业阶段:将来自不同供应商的类型迥异的设备进行定制化设计,组合成一个数据中心需要的独特的大型供电系统。简单地定制连接和组建以便使之运转(鲁伯·哥德堡效应),其结果是增加系统复杂性和人为错误的发生率。就目前情况来看,不科学的非规范化的规划设计主要表现在:凭主观臆断确定数据中心规模、预算、建造进度;在没有对所建数据中心的功能、技术可行性做充分论证的情况下首先从工程细节和设备采购入手,例如,我们要选用传统的带变压器输出的UPS,我们要配备2小时的备用电池等。错误的开始给许多数据中心设计和建设项目带来巨大麻烦和高昂的代价,如何避免这些问题,关键是要严格遵守正确的规划设计程序。

  数据中心供电系统规划设计内容包括:

  需求目标:功率容量、预算范围、扩展计划、关键功能、总体效率、IT需要;

  基础物理设施规划:可用性等级和相应的供电方案;

  确定用户要求:选择性倾向、约束条件、预算、升级策略、可用性级别、效率和能源利用要求;

  制定项目计划书:编制设计标书;

  制定工程设计计划:编制详细的工程化的建筑设计资料。[NT:PAGE=选择配置供电系统方案的原则与规划$]

  3.2 各种供电系统配置方法与性能比较

  数据中心UPS供电系统所选用的设计方案会直接影响到所建的供电系统最终能否实现规划设计的目标。长久以来,人们设计和建造UPS供电系统时,把主要精力和关注的目标放在对优质设备的选用上,却忽视对供电方案的分析研究,其结果是,系统选用的设备是一流的,而系统的可用性却达不到设计预期的效果。

  有多种供电方案已经在数据中心中使用,诸如并联冗余、串联冗余、分布式冗余、多路并联总线、双总线系统等,这些都是设计工程师或制造商赋予不同UPS配置方案的名称。这里将重点讨论适用于数据中心标准TIA等级III和等级IV的几种典型的供电方案,并着重对可用性作出定量的分析比较。表3.3是各子系统和关键设备可用性的统计和经验数据。

  表3.3 供电系统子系统和设备的可用性数据

\

  3.2.1 关于集中式、区域式、分散式供电方案的讨论

  数据中心用户和设计者在规划供电方案时,通常忽略或不够重视对方案的整体布局-集中式、局部式还是分散式的研究和讨论。实际上因数据中心的规模不同、机房布局不同、维护水平不同、对可扩展能力的要求不同等因素,供电布局方案有三种形式:

  (1)分布式供电方案:又称“点”式方案,其特点是在一个机房中,多个UPS系统分别

  地对各自的IT设备提供保护;

  (2)集中式供电方案:整个机房只使用一台或一套UPS系统为整个数据中心供电;

  (3)区域式供电方案:分布式与集中式的折中,整个数据中心按机房布局或按IT设备功能被划分为若干区域,每个区域由一台UPS(或UPS并机系统)集中地供电。

  早期设计建造的数据中心多以集中式供电为主,造成这种现象的最主要的原因是用户过分强调供电系统的维护。在当现代数据中心对可用性、可扩展性、易管理性、运行成本等要求越来越高的情况下,就暴露出集中式供电的许多不利之处,更何况在大功率数据中心中,集中式大功率供电系统需要多设备并联运行,系统管理变得很复杂,维护工作难度越来越大,需要较高技术水平的专业技术人员从事维护工作。表3.4是三种供电布局有缺点的比较。

  表3.4 三种供电系统布局方案的比较

\

  3.2.2 典型的交流输入不停电供电系统方案配置

  很长时间以来,人们认为只要系统中配置了UPS设备,就可做到不停电供电。实际上并非如此。UPS是靠电池储能维持不停电供电的,而电池能量是有限的,系统投入运行后,电池容量是不允许再扩容的。对于当前要求必须连续运行的数据中心,UPS根本上不能保证系统不停电运行,如果市电故障修复时间大于电池备用时间,系统照样宕机。

  特别是随着IT功率密度的不断提高,对于5KW功率密度的IT机架,市电停电后制冷系统也停止运行,靠机房空间的冷量只能维持IT设备继续运行1-2分钟,所以当代的数据中心毫无例外的都要在设计时考虑增加交流输入的冗余配置。

  图3.1是适合标准TIA等级III和等级IV的交流输入系统框图。

\

  图3.1,A1、A2、A3、A4、A5是设备的可用性,根据表3.2数据,可计算出整个交

  流输入系统的可用性:

\

  油机是非常理想的交流能源,它与市电完全隔离,并且用户可完全自主的配置和运行维护。如果采用第二路市电代替油机(图中虚线所示),则要求两路市电是完全独立的,也就是说两路市电在发电、传输和运行维护方面是完全隔离的,此时系统的可用性为:

\

  3.2.3 适用于标准TIA等级III和等级IV的UPS供电系统的基本类型

  数据中心常用的UPS不停电供电系统的基本类型有三种:“N”系统、并联冗余“N+1”系统和并联冗余“2N”系统。但是为了满足标准TIA等级IV的要求,现代数据中心大多采用了并联冗余“2N”系统,也称双总线系统。

  (1)双总线结构

  这里仅针对“2N”系统做些介绍和讨论。图3.2的典型结构是完全独立的最高可用级别的“2N”系统,图3.3则是“2N”系统的拓扑结构,也成为“∆2N”系统。

\

  (2) “2N”与“∆2N”系统的共同点

  对双输入电源负载来说,两条供电线路是冗余的;

  具体到两条线路中,市电(+变压器)与油机、输入ATS、UPS输入配电、UPS系统、UPS输出配电、列头柜等所有环节和设备都是一一对应冗余的:

  两条供电线路是完全隔离的,只有ATS才是两条路径共用的设备,但是这种类型的

  设备是靠机械触电转换的,所以仍有非常好的隔离功能;

  两个UPS系统完全独立运行,相互隔离,没有同频同相和同幅要求;

  无需将负载转换到旁路模式,即可对UPS、开关装置和其他配电设备进行维护;

  两种方案所有UPS的总容量是相同的。

  (3) “2N”与“∆2N”系统的差别

  相对图3.2的“2N”系统而言,图3.3的“∆2N”系统可选用容量较小的设备,对于相同容量的数据中心,两个系统的设备容量比为3:2,所以图3.3的“∆2N”系统对大容量数据中心“区域性”供电方案更具有灵活性;

  对于整个数据中心而言,如果图3.2的“∆2N”系统的三路负载并不是孤立的,也就是说三路负载中任意一路因供电故障而宕机时,整个数据中心的三路负载的功能都会受到影响,那么对整个数据中心而言,“∆2N”系统就变成了2+1冗余系统,可靠性相对较低。

  (4) 双总线系统的缺点

  冗余组件数量多,成本高:借助这种设计方案,可以尽量排除每一个可能的单路径故障点。不过,排除的单路径故障点越多,设计方案落实起来的代价(包括购置成本、运行成本、占据空间等)也越高昂。可以说,这种系统是行业中最可靠也最昂贵的一种设计;

  由于未达到满负荷工作状态,供电设备容量利用率低,工作效率低。

  (5) “2N”系统可用性

  这里仅分析一下图3.2所示“2N”系统的可用性

  假定:A1、A2:---分别为市电和高压变压器的可用性;

  A3--UPS输入配电、UPS输出配电、列头柜的可用性;

  A4-转换开关ATS的可用性;

  A5-油机的可用性;

  A6---UPS的可用性,这里采用单机UPS的可用性数据。

  根据表3.2数据,可计算出整个“2N”系统的可用性:

\
[NT:PAGE=各种供电系统配置方法与性能比较$]

  3.3节 供电系统设计与应用中存在的误解和错误观念

  尽管各种方案都曾有过大量的使用案例并且运行实践表明是可行的,但是,由于在方案选择和设计过程中存在着很多错误的观念和误解,使这些已在运行的系统不断暴露出各种各样的问题,究其原因,设备选用的质量并不是最主要的,更多的是由于规划设计不当造成的,或者是忽视IT技术进步对数据中心提出的新的要求,使用传统的陈旧的技术造成的,更有甚者是对新技术新设备的误解和错误观念造成的。本文将扼要地提出以下问题供数据中心规划设计者讨论。

  (1)对UPS性能指标的重新审视

  UPS设备的出现和应用已经经历了半个世纪之久,人们对它应具备的性能指标已经耳熟能详并有广泛的共识。但是随着数据中心对供电系统要求的提高,供电系统设计理念发生了巨大的变化(见本文第二篇),这些变化极大的影响着UPS技术研发方向、评价标准、配置方法和用户选用倾向,这些变化主要体现在UPS输出电性能已经不再是研发、测试、选用的主要指标,数据中心设计者更关注的是UPS设备的可靠性和系统配置功能,UPS的可用性、冗余并机能力、模块化可插拔结构设计、容量和不停电运行时间的可扩充能力、智能管理和网络通信功能等,都是用户考察UPS性能的主要指标。

  (2)对可靠性MTBF指标的误解

  对MTBF指标的误解是,MTBF不等于设备实际可连续运行的时间,也不等于设备的生命周期。MTBF是一个概率指标,指设备可连续可靠工作的概率,MTBF是失效率λ的倒数,一个年失效率λ为0.1的设备,其年平均无故障时间MTBF等于87600小时。但是根据年失效率,我们还可以推算出月失效率、日失效率,也就是说,一个年失效率为0.1(MTBF=87600小时)的设备,随时都可能发生故障。

  使用MTBF指标时第二个要注意的是,MTBF可用理论计算、试验验证、故障统计3种方法得出,而在设备选用阶段,这三种方法都是没有条件实现的。一个不可测量的指标自然是不可信和不可作为衡量设备优劣依据的。

  (3)对系统可靠性和设备故障率的错误认识

  在选用模块化UPS或者对单机做n+1配置时,人们发现设备越多故障率也越高(规律是对的),因此得出系统可靠性必然差的结论。这种观念的错误之处在于,在当代数据中心供电系统冗余容错设计中,设备故障不等于系统故障,设备故障率也不再等于系统可靠性。用户关心的是供电系统能否确保IT设备是否能连续不中断地运行,这就是他们宁可选用设备多(故障率高)的n+1和2n系统,而不考虑设备少(故障率低)的n系统的原因。更何况模块化UPS最关键的优势是系统可快速修复,这是提高系统可用性的最有效的关键措施。

  (4)“高频机”将成为现代数据中心UPS设备的首选机型

  自从15年前高频机(包括Delta变换UPS)问世以来,就出现了高频机与传统工频机谁优谁劣的广泛而激烈的争论,争论的问题包括隔离问题、抗干扰问题、对零地电压的影响、安全可靠问题。在这些问题中,有些是电路结构的差别带来的,有些则是错误的观念和无知造成的。相对于传统工频机,高频机在输入功率因数、效率、体积、重量、成本等方面都有无可比拟的优势,如今已经被更多的用户认识和接受,成为现代数据中心UPS设备的首选机型。有关高频机的介绍请看本文第五篇。

  (5)模块机是UPS设备发展的必然趋势

  在本文第二篇中讲到“系统模块化设计成为供电系统设计的基本原则”,模块化UPS是最高可用级别的模块化系统。他不仅具备了高频机结构、系统冗余容错设计、系统集成化架构的所有优势,它的可快速修复更是独有的特殊功能,因此模块机已经成为UPS设备的最重要的发展趋势,本文将在第四篇专门介绍讨论模块化UPS。

  (5)有关备用柴油发电机的配置和使用问题

  越来越多的用户和供电系统设计者已经建立起现代数据中心必须配置交流输入备用能源--柴油发电机的观念,但是,对油机在市电故障时是否能准确无误的投入运行感到无限忧虑,并在数据中心供电系统设计和设备配置时充分考虑了这一情况,例如延长UPS电池备用时间。其实这是个观念和认识问题。传统的观念是把备用油机作为公共电力环境的一部份,像市电一样是由数据中心所在地区或建筑物的公共电力供应部门提供和维护的,数据中心的维护人员无法随时掌握油机的状态。要解决这一问题,就必须改变传统的观念,既然油机是现代数据中心必须具备的设备,就应该把油机作为数据中心供电系统的一个设备,像UPS、配电柜一样,纳入数据中心供电系统中,统一管理维护。有关油机的问题在本文第八篇中做专门介绍。

  (6)对备用电池容量的选择

  UPS备用电池决定了市电掉电后关键IT负载继续正常运行的时间。但是,在现代高功率密度数据中心中,市电掉电后IT设备需要持续的供电和制冷两个条件才能继续运行。持续制冷是由后备油机保证的,而油机又同时给UPS供电系统提供交流能源。油机启动时间在15秒钟左右,在油机工作状态正常和转换无误的情况下,这无异于可把交流输入电源的故障时间控制在15秒钟左右,那末又何必把电池备用时间扩大到30分钟甚至几个小时呢?

  本文将在第八篇中对此问题做专门讨论。

  (7)STS静态开关设备的配置问题

  在双总线(2N)供电系统中,特别是存在单输入电源负载的系统中,传统的设计者的习惯做法是在两路UPS供电系统的输出端配置STS静态开关设备。但是STS在两个交流输入电源同步的情况下才能实现在规定的时间内不间断的转换,否则其转换时间会变成一个不确定的数。为此就必须在两路供电系统中配置UPS同步控制电路,其结果是2N系统的两路供电系统失去隔离功能,UPS同步控制电路本身就是个单路径故障点,又由于不隔离的两路UPS的相依性关系,一路UPS故障可能诱发另一路同时故障,最终是使2N系统的功能不能充分发挥,可用性降低。正确的做法是,如果系统中存在单输入电源负载,应使用小功率机架式ATS,ATS是靠机械式触电转换的,转换时间可控制在10ms之内,不影响IT负载的工作,但却保全了2N系统的功能。

  (8)要重视谐波的影响和谐波抑制

  谐波产生和抑制始终是传统供电系统存在的最棘手的问题,其影响除了会污染电网之外,供电系统设计者更应关注谐波对供电系统本身的影响。包括:

  谐波电流是UPS输入功率因数低和输入能源利用率低的主要原因;

  谐波是供电系统零线电流增大的主要原因;

  导致UPS前端设备无功损耗增大、线缆发热,因此必须加大设备和导线容量;

  增加谐波抑制设备会增加系统成本(购置成本、占地空间、能耗);

  影响油机的正常运行,必须增大油机与系统的容量比;

  如果配置无源滤波器,在负载量较小的情况下,滤波效果会变差,还可能放大谐波甚至引发线路震荡;

  为了解决这些问题,最好选用输入IGBT整流的模块化UPS或单机,其原理是从根本上抑制谐波的产生,输入功率因数高达0.99,谐波成分降到3%以下。有关谐波的产生和治理,在本文第七篇将有专门的论述。

  (9)供电系统零地电压问题

  在数据中心供电系统中,吵得沸沸扬扬的另一个问题是零地电压问题。在三相系统中,由于不平衡的相电流和谐波电流的存在,零地电压增高是很正常的。但是,因为IT设备输入开关电源是隔离的,零地电压增高并不会影响IT设备的正常运行。在三相供电系统为单相设备供电时是不允许零线浮空的,所以IT设备厂家在设备开机前先要测试零线与地之间的电压,是在空载的情况下判定零线与地线是否接好接牢。应该说零地电压≦1V是衡量零线是否接好的标志,而非是是否影响IT负载正常运行的限值。有关零地电压问题将在本文第九篇中做详细的介绍。

  (10)数据中心的接地系统

  机房接地系统不仅涉及到设备和人身安全问题,也是影响IT设备是否能正常工作的一个重要因素。由于地线设计不规范或接线错误而造成IT系统不能正常运行的问题,主要是在系统运行后才显现出来,此时在更改地线系统变得非常困难,所以在规划设计阶段就对地线方案给以足够的重视是非常重要的。有关地线问题将在本文第九篇中做专门的介绍。

  责任编辑:GOCN[NT:PAGE=供电系统设计与应用中存在的误解和错误观念$]




声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。