摘要:結合銀行數據中心建設項目,設計銀行數據中心機房動力環境監控系統,分析銀行數據中心機房監控對象、搭建系統監控架構,給出監控實現方法,*后針對運行一段時間出現的問題,提出優化措施和建議,對同類工程建設具有一定借鑒意義。
關鍵詞:數據中心;動環監控;系統架構;網絡拓撲
0引言
銀行數據中心機房的供配電和精密空調等基礎設施多,而設備維護人力資源少,因此增加了基礎設施運維人員工作強度和難度。為及時發現設備故障并處理,本文設計了動力環境監控系統,并針對運行中出現的主要問題給出優化措施。
1系統監控對象
銀行數據中心機房動力環境監控系統(以 下 簡 稱 為 動環監控系統)的監控對象可分為三大類:第一是對設備動力系統實時工作狀態進行監控,如供配電系統開關狀態、UPS和柴油發電機等設備的運轉參數和狀態等;第二是對機房內運行環境進行監測與控制,如溫度、濕度、漏水、氫氣濃度及消防等;第三是對人員設備進出進行監控,如門禁、攝像頭、防入侵等安全類設備。而機柜內服務器、交換機、加密機等安全或網絡類硬件設備運行狀態并未納入,不在本文探討范圍。
2系統架構
動環監控系統采用計算機網絡、現代通信技術和控制技術,對機房動力設備及環境等進行實時監控,實現無人值守機房的現代化管理。硬件上采用三層架構:底層為現場設備層,由被監控設備、I/O采集模塊等構成;中間層為數據采集處理層,由各串口服務器、動環服務器、交換機等構成;頂層為數據應用層,由監控平臺或客戶端等終端構成。軟件上采用B/S結構,在機房中通過安裝各種傳感器及數據采集設備進行底層數據采集,將所有子系統集成在統一的用戶界面下,對各個子系統進行統一監視、控制和協調,從而構成統一的協同工作的整體。系統架構設計如圖1所示。
圖1動環監控系統架構設計
3系統實現
3.1工程概況
數據中心主機房設置在6F,按功能細分為服務器機房一、二、三,網絡機房,配電間A、B;配電間重要斷路器或開關、電量儀、UPS及防雷,主機房內新風機、精密空調及漏水檢測、機柜PDU、溫濕度、防入侵(紅外線檢測)需納入動環監控系統。UPS蓄電池室設置在-2F,柴油發電機間設置在-1F,三電源切換室設置在1F,運維室設置在7F,消防氣瓶間設置在8F。動環監控系統的監控對象見表1。
3.2硬件構成
動環監控系統由2臺服務器(雙機熱備)、2臺客戶端PC機、監控大屏、核心交換機(A、B網)、視頻匯聚交換機、門禁接入交換機、采集箱及串口服務器等構成。
3.2.1數據采集層核心設備
采集箱負責開關量、溫濕度等原始數據的采集,是整個監控系統的核心,采用深圳計通機架式,大小為2U,可安裝在機柜內,箱內采集模塊通過端子排與被監控設備相連。串口服務器采用計通OAO-9000E嵌入式智能管理單元,該設備集數據采集、解析、存儲告警于一體,具備正確故障定位能力,可滿足不同廠家設備數據信號的接入與“翻譯"。
3.2.2現場設備層
現場設備層的設備分為需接協議轉換器設備、需提供通信協議設備、模擬量直集模塊和開關量直集模塊四類。
(1)需接協議轉換器(串口服務器)的設備包括精密空調、漏水繩、機柜PDU、電量儀、UPS電源、蓄電池、柴油發電機。這些設備需相應廠家提供通信接口及其開放的通信協議,以便對各設備運行參數或狀態進行監測。
(2)需提供通信協議的設備包括視頻監控和門禁子系統。這些設備需相應的廠家提供通信協議,由動環監控系統進行集成和管理,能實現在動環監控端點擊任意攝像頭調出相應攝像頭的實時監控畫面和實現對任意門的開關控制。
(3)模擬量直集模塊。①溫濕度監測:通過在機房內的重要區域、冷熱通道和機柜內部安裝溫濕度傳感器,實時采集溫濕度的變化情況和熱力分布情況。②氫氣監測:通過在電池間安裝氫氣采集模塊,可實時檢測PPM值是否超標,及時發現氫氣泄漏的電池隱患;當氫氣PPM達到設定的閾值時,系統發出報警。
(4)開關量直集模塊。①重要開關監測:通過監測配電柜內重要斷路器的輔助觸點狀態,判斷開關的通斷狀態;當監測的開關狀態與設定默認狀態不一致時,監控主系統發出報警。②防雷監測:通過監測防雷器的遙信觸點,實時監測防雷器狀態;當監測的防雷器狀態與設定默認狀態不一致時,監控主系統發出報警。③新風排煙監控:通過在新風和排煙管道中安裝壓差開關檢測壓差信號,監測機房內新風機和排煙機的運行狀態,可遠程控制新風機的啟停。④防入侵監測:通過在機房內安裝紅外探頭以監測機房內人員移動狀態;當紅外探測器的狀態異常時,系統發出報警。⑤消防監測:通過采集消防控制主機報警輸出點的信號,實時監測機房內各分區的消防狀態;一旦發生報警,系統就自動切換到相應的監控界面,火警狀態圖標變紅且閃爍顯示,同時產生報警事件并記錄存儲。
4.軟件平臺
動力環境集中監控平臺軟件采用B/S結構,通過在機房中安裝各種傳感器及數據采集設備進行底層數據采集,外廠家設備需提供通信接口及其開放的通信協議,進行數據“翻譯"處理,通過機房監控平臺集中監控,全中文、圖形化;界面結構層次清晰,實時反映數據狀態。集中監控平臺能運行于中文Windows操作系統。動力環境集中監控平臺軟件采用模塊化設計,可劃分為采集層、處理層、管理層及展示層,如圖3所示。其中,個人工作平臺能提供動環監控主界面、告警事件列表、待辦事項、告警等級統計、PUE實時曲線、基礎設施分類餅狀圖等可自由選擇的個性化定制界面。報表管理可根據機房管理原有報表格式生成詳細的數據記錄報表和數據分析報表,存儲格式為Excel或PDF;數據存儲時間需長于1年,且具有防篡改功能。軟件交互界面中,動環監控模塊可直觀看到各個機房實時運行狀態,設置機房名稱、設備圖標等超鏈接可直達各子界面,通過溫濕度監測、門禁、視頻監控、溫度場、漏水監測、紅外監測、消防監測等按鈕可直達各分畫面,并提供基于電子地圖、實時曲線、餅狀圖、折線圖、直方圖等多形式數據展現方式,便于運維人員分析設備歷史運行趨勢,以判斷設備狀況。
圖3動力環境集中監控平臺軟件架構圖
系統告警采取短信、電話、現場語音三種報警結合的方式,報警等級分為緊急、重要、一般三個層次,不同級別的報警采用不同報警方式實現報警信息的發送。無論系統處于任何畫面,都可自動提示告警,顯示告警信息。當一個報警狀態解除時,系統可自動發送相應的恢復短信,以便機房管理人員隨時掌握相關動態。
5安科瑞動環監控系統解決方案
通過數據中心動環監控系統,實現了對數據中心的門禁狀態、水浸狀態,煙霧狀態,視頻狀態,環境狀態,高低壓配電狀態,設備運行狀態進行實時監測,并進行實時報警,保障數據中心正常運行,避免運行環境的失控導致配電設備運行故障,保證維護人員安全,延長設備使用壽命,減少配電室粗放式管理導致成本過高。同時實現動環監控并對各用能耗能進行能效分析,幫助用戶實現用能效率的優化。
5.1系統功能
(1)展示當前數據中心總能耗,IT能耗,空調能耗,及其他能耗并且計算出當前數據中心實時PUE值,通過儀表盤形式直觀展示。
(2)選擇查看數據中心的中低壓配電系統主接線圖,并在一次圖顯示配電系統當前遙測、遙信數據和狀態。實時監測各配電柜的電壓、電流等電力參數,變電站的溫濕度、煙感、水浸、門禁等環境情況。
(3)電氣接點溫度實時監測,斷路器觸頭、觸臂、母排和線纜連接等位置安裝無線測溫傳感器監測接點溫度,便于提前發現溫度異常導致的事故。
(4)監測各變壓器各項參數,包括負載率、頻率、功率因數、三相不平衡度等,并且顯示歷時曲線圖,數據實時變化。幫助用戶直
(5)電能質量在線監測,可以監測電流和電壓諧波畸變率、電壓暫升暫降暫中斷等暫態事件記錄、ITIC容忍曲線等
(6)系統采集UPS輸入、輸出端和旁路三相電壓、電流、有功功率、功率因數頻率,同時監測UPS溫度、蓄電池電壓、當前負載下的剩余時間等數據。
(7)展示單體電池電壓、內阻和溫度,預測電池帶載時剩余時間,每節電池數據均可以設置異常報警,及時發現蓄電池異常。
(8)展示精密配電柜內進線和饋線回路電氣參數,包括電流電壓功率電能以及開關狀態,并可以對數據進行報警設置和分級,數據取自精密配電柜測量模塊。
(9)展示智能小母線的始端箱和插接箱電氣參數,包括電流電壓、開關狀態、插接點溫度,并對數據進行報警設置和分級。
(10)通過平面圖顯示數據中心能源分布,設備分布情況,并顯示設備能耗數據,點擊平面圖上設備可以進入具體設備監控界面。
(11)實時顯示當前數據中心PUE值以及歷史PUE曲線。并且顯示各分項用能的用能情況及用能排行。監測各變壓器運行及負載情況,給出本月變壓器輸出電能排行。
(12)顯示電能消耗日/月/年報表,并可對具體回路選擇曲線圖、餅圖進行展示。對數據中心用電數據進行同比、環比分析比較,查看用電趨勢。
(13)監測精密空調的回風溫濕度,出回水溫度,并可以設定精密空調的溫濕度,達到更好的控制效果。
(14)監測數據中心溫濕度、開關門、水浸、煙霧、噪聲、氣體濃度狀態等參數。曲線圖直觀明了,同時支持歷史數據查詢
(15)通過列表顯示各類報警事件數量,通過柱狀圖顯示逐日報警數量,提供報警總數以及增長趨勢。
維管理功能,可針對數據中心各主要設備進行巡檢派工,消缺,搶修等維護工作。