動力信息化在保障數據中心動力安全中的重要作用 |
用戶背景:某政府在2008年(nián)初完成一(yī)次改擴建工(gōng)程,添置設備和占地面積均增加了50%以上(shàng),伴随而來的動力問題也開(kāi)始逐步顯現。起初,部分交換機(jī)、服務器(qì)出現了通(tōng)訊端口燒毀現象,随後又(yòu)發生(shēng)個(gè)别網絡設備和服務器(qì)電(diàn)源燒毀的事(shì)故,而經多(duō)次更換未能(néng)根除問題,設備燒毀時有發生(shēng)。多(duō)方工(gōng)程師(shī)根據僅有的網管人員(yuán)回憶,均難以确定故障原因,但可初步判定其間出現反複燒毀的設備絕非設備自(zì)身問題,而是外界供電(diàn)系統異常所緻。但由于缺少故障發生(shēng)時刻的具體電(diàn)網數據,而單純依靠簡單的儀表測量又(yòu)不能(néng)在非故障時發現任何問題,因此該诟病繼續困擾著(zhe)機(jī)房管理人員(yuán)。
2011年(nián),我公司(傲視恒安科技(jì))應機(jī)房集成建設公司邀請,參與對機(jī)房動力偶發性故障問題成因分析工(gōng)作。同月(yuè),根據現場調研判定,此偶發性動力故障成因複雜(zá),涉及故障點隐蔽,危害嚴重,遂決定安裝我公司的動力大師(shī)ERM系統判斷故障并持續保障機(jī)房動力供給。
在曆時一(yī)周的施工(gōng)準備後,廠家安裝人員(yuán)僅用36小(xiǎo)時即完成了整個(gè)ERM監測系統的安裝部署工(gōng)作,其間斷電(diàn)施工(gōng)時間僅為(wèi)3.5小(xiǎo)時(夜間非工(gōng)作時段)。
在動力大師(shī)ERM系統上(shàng)線工(gōng)作後不到(dào)一(yī)周的時間,便捕捉到(dào)了最有可能(néng)造成前述故障的“罪魁禍首”——零地電(diàn)壓嚴重飄高(gāo)和地線浪湧沖擊。由于動力大師(shī)ERM系統能(néng)實現全天候24小(xiǎo)時不間斷測量和數據分析,并且能(néng)實現最高(gāo)每秒(miǎo)2000次采樣,因此該系統能(néng)嚴密的捕捉到(dào)任何異常的電(diàn)網波動,哪怕問題的出現隻有幾個(gè)毫秒(miǎo)。而一(yī)般的動力監測采樣低(dī)密度在0.5~5秒(miǎo)/次,無法精确定位故障源并準确分析故障成因,隻有依賴動力大師(shī)ERM系統的高(gāo)采樣率、全點布控的檢測設備,才能(néng)及時發現用電(diàn)安全隐患并遇有排除。
經過工(gōng)程師(shī)簡單的操作,動力大師(shī)ERM系統給出引發電(diàn)壓波動的故障設備所在回路(lù),管理人員(yuán)順利地找到(dào)了故障電(diàn)源,該故障電(diàn)源雖自(zì)身可正常工(gōng)作,但它導緻了零地半相(xiàng)連。原本從(cóng)設計角度來說,理想中供電(diàn)三相(xiàng)應力圖平衡,零線電(diàn)壓可與地線持平,零線目排電(diàn)流趨近于0,但該機(jī)房為(wèi)什麽會(huì)出現地線上(shàng)的浪湧沖擊呢(ne),受此啓發,複查地線接地情況,确實發現大樓公用地線與大地高(gāo)阻,随即判定故障主要成因是機(jī)房接地不良,次要成因是部分用電(diàn)設備電(diàn)源故障,低(dī)阻連通(tōng)零地。那麽在分析燒毀的設備,全部為(wèi)通(tōng)訊相(xiàng)關設備,其原因在于通(tōng)訊設備通(tōng)常使用公共地作為(wèi)參考GND并直接連接于電(diàn)路(lù)闆,具有的保護也無外乎一(yī)個(gè)瓷珠。因此當220V零線與通(tōng)訊地線偶發性低(dī)阻連接,會(huì)使得通(tōng)訊設備參考地電(diàn)壓突然升高(gāo)。實際測量結果為(wèi)偶發性零地電(diàn)壓20V以上(shàng)。造成零線電(diàn)壓高(gāo)的主要成因又(yòu)是機(jī)房三相(xiàng)配平嚴重不良。綜上(shàng)各方面原因,由于故障形成的背景因素較多(duō),錯(cuò)綜複雜(zá),故而通(tōng)過一(yī)般的萬用表測量難于準确及時發現故障點和分析故障成因,此類問題必須依靠諸如動力大師(shī)ERM系統等設備介入才可全面準确地将其分析透徹。
解決方案:更換故障電(diàn)源設備或模塊,地線增補大地接地點,調整三相(xiàng)平衡,并使用[動力監測系統]持續預警各種電(diàn)網異常,及時遏制動力危害。
在随後的使用中,無論發生(shēng)短路(lù)掉電(diàn),負載飽和,動力大師(shī)ERM系統都可以幫助管理人員(yuán)通(tōng)過簡單操作分析故障成因,預警故障發生(shēng),即使調整供配電(diàn)方案。該系統不但能(néng)為(wèi)用戶節省不必要的配件(jiàn)更換費(fèi)用,更重要的是減少機(jī)房動力故障,提高(gāo)機(jī)房設備Uptime比率,符合數據中心機(jī)房高(gāo)可用性、高(gāo)可靠性的追求目标