今年第一季度,先后发生在大西洋两岸的天灾人祸,颠覆了很多人对现代基础设施的认知。
2月中旬,“百年不遇”的寒潮席卷美国德克萨斯州,德州电网宣布进入历史上最为严重的供能危机,从芯片生产到人民的生命安全,都受到严重的威胁。各方分析了导致德州大停电的因素,包括但不限于:
德州众多天然气、风能和火力发电厂因结冰而无法运转,造成电力供应急剧下降;
作为美国三大电网之一,德州电网仅供得克萨斯一个州使用,在寒潮来临时,无法从东部电网和西部电网获得电力外援……
无论具体原因为何,社会运转高度依赖电力供应的现代化国家,电力基础设施竟如此脆弱,还是超出了大家的想象。
3月10日,欧洲最大的云服务商OVHcloud在法国斯特拉斯堡的数据中心发生火灾,SBG2被彻底摧毁,SBG1也严重受损。
在火灾发生前,OVHcloud刚刚启动IPO流程,但受损失更大的无疑是那些永久丢失了数据的客户,还有46.4万个不同域名的360万个网站被关闭,包括:网上银行、网络邮件服务、新闻网站、销售个人防护装备以抵御新冠病毒的网上商店,以及几个国家的政府网站。
OVHcloud表示,具体的火灾起因要到明年才能披露,而其升级内部备份方式的决定也让人心生感慨——为什么不早些向AWS、微软Azure、Google云等美国同行学习呢?
从支撑数字世界运行的信息基础设施,到更为基础、影响范围更大的电网,都在极端状况下暴露出缺乏有效备份手段的巨大危害,足以说明:备份,真没我们想的那么简单。
如果不增加任何成本,就可以在需要时获得有效的保护,那应该没有人会拒绝这样的“备份”。所以,人们在决定是否要采用某种备份手段时考虑的主要因素通常是:
要付出多大代价?
关键时刻能否起效?
稳出活:高效可靠,一体两面
经过多年的演化和普及,服务器、存储等IT设备已经不像数据中心行业刚起步时那般“身骄肉贵”,今天的IT设备可以工作在较高的环境温度下,允许通过提高机房进风温度等手段,降低制冷环节的能耗,达到节能降碳的目标。
但是,哪怕是瞬间的电力供应中断或波动,都可能破坏设备的正常运转,进而导致业务受到严重影响。
所以,UPS首先要做好“不间断电源”(Uninterrupted Power Supply)的本职工作,保证电力供应的持续稳定,再降低转换损耗,才能得到用户的认可。
传统UPS双变换模式下的效率为94~96%,旁路Eco模式可以提高效率到99%,效率的优化空间达到3~5个百分点。重要的一点是,旁路Eco模式通常由旁路直接输送市电给负载,在市电输入消失时才切换到UPS逆变器,这就带来至少两个问题:
正常状态下,IT负载接入市电供电,没有经过UPS调节;
发生任何市电或设备本身问题时,探测并切换到逆变器需要时间,而这个间断时间,不是所有负载都可以接受的。
也就是说,UPS具有化解电力输入波动及中断的能力,但是在旁路Eco模式下处于“养生”状态,不能充分发挥作用。所以,尽管旁路Eco模式不缺历史和供应商支持,在用户侧的实际使用并不是很多。
近年来,随着社会和行业对节能减碳的重视程度不断提高,能够确定性的降低4~6.7%的电能损耗(考虑制冷设备损耗),也是非常值得争取的成果。以施耐德电气(Schneider Electric)新推出的Galaxy VL三相UPS为例:在500kW功率下,采用效率97%的在线双变换模式或高达99%的E变换模式,相比94%的传统设计,每年节电可达14.4万度和23.5万度,相当于减少碳排放15吨和25吨以上。
这个E变换(ECOnversion)模式,与之前的Eco模式,有什么区别呢?
E变换技术是施耐德电气在2012年取得的专利,2014年在Galaxy VM系列产品上首次应用,目前在20~4500KW、功率从小到大(VS、VM、VL、VX)的Galaxy V全系产品都得到了应用。
工作在E变换模式的Galaxy VS,该界面中可以看到三相输出电压、电流、功率和电池状态等信息
E变换结合了在线双变换的稳定可靠与旁路Eco模式的节能高效,与旁路Eco模式不同的是,它是一种智能旁路技术:逆变器一直处于工作状态,与旁路市电并联一起给负载供电,控制的结果是旁路市电提供负载需要的有功功率和基波电流,逆变器提供负载需要的无功功率和谐波电流,旁路市电输入端的功率因数为0.99,输入谐波电流<3%。在旁路市电超出允许范围后,切断旁路由逆变器自动100%支撑负载,0ms(毫秒)接管无间断。值得一提的是,在E变换模式下,还具有10%的充电能力。
在施耐德电气武汉实验室,我们通过Galaxy VS系列100kVA UPS主机体验了E变换模式的效能。
在现场测试中,可以看到,在E变换模式下,UPS的逆变器参与了功率因数校正和谐波处理,还可以调整输入三相负载平衡,能够有效的改善电力输入的质量。也正是因为逆变器一直在工作,模拟市电断电时,示波器捕捉到的输出电压波形中断为0ms,而在旁路Eco模式下的切换时间为5.1ms。
效率方面,在低于50%的较低负载下,测得双变换模式的效率96.56%,E变换模式为97.86%(计入充电功率后效率达到98.78%),都相当接近技术指标。
套用备份领域冷备份、热备份的概念,我们可以将(旁路)Eco模式理解为逆变器“冷备”,那么逆变器始终保持工作状态、随时可以无缝接管的E变换模式就属于“热备”,或者说是“活”备份(Live Backup):节能不输Eco模式,逆变器一直活跃为工作负载保驾护航,但是负载较轻,元器件压力不大,有利于延长整机寿命——根据施耐德电气提供的数据,在E变换运行模式下,UPS设计使用寿命可达15年。
备有活:在线插拔,模块扩缩
在备份的语境中,热备份需要热插拔(Hot Swap)这样的配套手段支撑——不然,连更换个FRU(Field Replace Unit,现场可更换单元)都要停机下电,还奢谈什么“随时待命”?
没错,Galaxy VL系列通过模块化设计和Live Swap(在线插拔)技术,可以在运行时实现功率模块的增减和更换,无需将UPS切换到维护旁路或电池运行。
E变换模式(上)与断电后电池放电模式(下)两种状态的电路流向
可是,UPS毕竟不同于硬盘(或SSD)这类弱电设备,带电插拔是有生命危险的。如何在更换电源模块的时候,为维护人员提供更多的保护?
硬盘和SSD等弱电设备的在线插拔,主要担心损坏这些设备;强电设备的在线插拔,还要担心人身安全
施耐德电气采用一系列手段确保整个更换操作的触摸安全,包括但不限于:
接触防护:在人与带电元件之间增加绝缘隔离,譬如电源模块和输入端之间的连接使用绝缘电缆;
分区隔离:将裸露的带电元件(如,铜排)与插拔区域隔离开,可额外增加一级绝缘隔离,避免在带电插拔活动中发生接触危险。以Galaxy VL系列为例,裸露的接线端子和高能量的旁路区段被隔离在上部隔间的盖板后面,而低能量的插拔区域即电源模块隔间位于设备的下部。在插拔电源模块时,隔离有助于确保工作人员不会接触任何裸露的带电连接器或导线,也有助于降低电弧放电的可能性和严重性。电弧放电能量<1.2cal/cm²并获得UL测试认证。
机械联锁:电源模块设计有机械联锁和继电器,以达到零电流条件,帮助确保模块在电源“关闭”状态下插入或拔出。
从这个角度上来说,Live Swap也可以理解为“活”插拔。
Galaxy VL系列采用第二代模块化设计,负载均衡和按需扩容可以满足用户的不同需求:
并机模式下,以模块为单位均衡负载;当一个模块失效时,可以由其他功率模块均分负荷,系统更可靠。
可以随着负载功率的需求变化,以50kW的模块为颗粒度,从200kW逐步扩容至500kW,无需停机时间,增强业务连续性。
如果需要更大范围的扩容,可以将多台Galaxy VL系列并机使用,或者选择容量更大的Galaxy VX系列(500~4500kW,扩容颗粒度为模块化设计的250kW功率柜体)。
Galaxy VL和VS支持同款锂电池柜
Galaxy VL系列结构也非常紧凑,一台500kVA的设备,占地面积仅为0.8㎡(850mm×925mm,高1970mm),配合同样高(能量)密度的锂电池柜使用,可以加倍节省建筑空间。
感谢科技的进步,让我们可以一次次的从不情不愿的做选择题,进化到有底气说“我全都要!”