隨著信息系統及網絡的快速發展,各種信息網絡不安全事件也層出不斷,電力行業現有的信息管理系統在日常的工作中,碰到了越來越多的問題,為了更好地確保電力行業的信息系統網絡安全,確保能及時地發現各種不安全現象,依據IT運維過程中的困擾和難題,根據電力行業的實際情況,實現對機房設備的統一監控和大屏展現的統一管理。
在管理大區部署一套IT綜合運維管理平臺,生產大區部署數據采集引擎裝置,該采集引擎負責對生產大區管理對象進行IT設備狀態基礎數據采集,管理大區IT綜合運維管理平臺負責對生產大區基礎設施資源統一監控和集中管理,預留擴展需要,并且能夠實現對管理大區管理對象直接監控。實現網絡設備、安全設備、網絡流量分析、服務器存儲管理、機房環境管理,以此各類被管對象預警分析及維護管理水平,量化提高IT基礎設施及其狀態的可靠性、利用率、性能質量、安全性等指標,并減少管理和控制運營成本,提供一套實現IT資源集中運維管理平臺。
生產大區監控管理控制操作均在安全區域內,當生產大區采集引擎有數據需要更新時,則通過正向隔離裝置協議將數據反饋到管理大區的IT綜合運維管理平臺。這樣,對于各個安全區被管對象的管理就都集中在管理大區的IT綜合運維管理平臺上進行,實現跨區域的統一、集中監控管理。但是目前還存在以下問題:
技術拓撲如下圖所示:

IT綜合運維管理平臺應在不改變采購方現有單向隔離裝置的前提下實現穿透,采集數據能夠以報文形式轉發,并能實現不低于5分鐘完成數據更新和穿透。能夠實現生產區基礎設施性能數據、日志數據以及服務器硬件信息穿透,完成在管理控制區統一展示。
3.2.1網絡管理
通過網絡管理系統的整體監控能很方便地了解到當前整個網絡的運行情況和當前的網絡設備、服務器及應用等當天信息和歷史信息,以便從多方面了解網絡的歷史和實時運行情況。

集成CMDB功能,了解基本信息、配置信息、物理信息、設備信息,在查看設備信息,或者在設備更新換代時有這重要作用,節省了運維管理人員的時間;也方便可管理人員的操作。

3.2.2服務器硬件管理
支持主流網絡設備(Cisco、華為、H3C、銳捷、Dptech、Nortel、邁普)等硬件監控,監控指標包括網絡設備電源、電源、溫度、風扇等的狀態及性能指標。

支持主流安全設備等硬件監控,監控指標包括網絡設備電源、電源、溫度、風扇等的狀態及性能指標。通過自定義SNMP OID 腳本,采集特殊的服務器特殊指標項。
3.2.3數據庫管理
數據庫是客戶信息系統中的核心應用,系統提供數據庫監控功能對數據庫進行管理,保證數據庫的安全,優化數據庫的性能。
支持的數據庫類型sqlserver2005,sqlserver2008,sqlserver2012,oracle、mysql、DB2、達夢數據庫、人大金倉數據庫等。
3.2.4機房管理
結合網絡機房動力環境系統,能夠提供溫濕度感應探測器對環境狀況的監測,實時監測環境溫度、濕度,并對監測環境溫濕度提供預警功能,防止失控;針對生產區小機房,可提供溫濕度探針的方式收集當前機房溫濕度狀態。
系統平臺應能實時顯示并保存各UPS通訊協議所提供的能遠程監測的運行參數和各部件狀態。實時判斷UPS的部件是否發生報警,當UPS的某部件發生故障或越限時,及時發出報警。

3.2.5存儲管理
電力行業對于存儲的需求極高,網強管理軟件支持對不同廠商、不同型號的存儲設備進行監控,并且支持對存儲池、存儲LUN 物理磁盤進行實時監控,全方面掌握存儲設備的性能指標。同時可以對存儲容量的智能化預測,容理使用分析、性能分析、故障定位等,保障存儲的穩定運行。

IT綜合監控管理平臺需要提供統一的告警管理平臺,根據運維人員不同時間段不同監控的需要。當某IT資源在高負載時間段(即高峰時段,如某網絡設備于周六或周末晚上某一時間段的CPU使用率比平時高很多,而高峰時間段過去后,則將自動恢復平時的閾值),運維人員則可以通過系統的異常過濾和告警過濾的設置。當出現網絡故障時,迅速定位網絡故障發生的位置,分析出現網絡故障的原因,提供解決網絡故障的思路和方案,使網絡與業務系統運行正常。

根據不同的網絡環境以及用戶多種多樣機房網絡拓撲樣式,設計出了一套能夠按照物理圖譜,對應機柜和設備的安裝位置,畫出真實的機房拓撲圖機的機柜擺放圖,幫助在設備發生故障的時候快速定位設備的物理位置,同時也能夠在設備上架的時候,對機柜內的存放位置有所規劃,確保全方位的對機房中的設備運行情況和環境使用情況清楚明了。
網絡管理系統可將異常分為4個等級,當某個資源的監控指標如平均CPU利用率、ICMP響應時間或平均內存利用率等匹配規則大于系統默認的閾值90%時將產生緊急異常、大于70%時為重要異常、大于50%時為一般異常、而大于30%時則為提示異常。同時,運維人員也可以按照個人需求通過閾值設置來對異常等級進行自定義,并可根據不同的異常等級分別設置緊急告警、重要告警、一般告警及轉發郵件等告警方式,使運維人員可以更加清晰地了解到當前網絡中所有異常的輕重緩急,有效處理網絡異常。

從用戶實際關注的角度出發,把網絡IT數據進行高效、可視化的管理,對數據進行整合分析,通過可視化大屏展示來幫助業務人員發現、診斷業務問題。數據實時采集、數據處理、數據分析、數據異常等相關性,幫助用戶解決業務問題,滿足不同用戶業務、IT資源、網絡結構等各種場景的展示需求。

用戶可以設定時間段內的數據報表以及自定義類型報表的實時報表;支持報表一覽(網絡設備、服務器、應用、鏈路、業務、網頁、服務)、報表模板(模塊一覽、內建模板、新建模板)、自定義報表(自定義報表一覽、自定義報表模板、新建自定義報表)三大模塊。
管理大區的IT綜合運維管理平臺需要能夠支持對生產大區安全設備日志的收集管理展示,還支持將告警數據、配置數據以及性能數據發送給第三方系統,運維人員只需通過瀏覽器就可訪問IT綜合監控系統和第三方系統,實現各個系統的互聯互通、有效整合與統一展現。

系統支持對登錄過程中的數據加密,以保障管理員遠程登錄網管系統的安全性;把多個重要的網絡設備、服務器、虛擬化、存儲、應用、防火墻、業務、網站等等設為我的關注,顯示這些設備的實時運行情況和歷史運行情況。

網強成立2003年,17年時間不變初心,砥礪前行,致力于電力行業運維工作,不斷提高自己,為用戶提出科學可行的解決方案,協助用戶在網絡運維工作中的人員配比,時間安排,經濟投入與產出等方面有了系統性的提升。以下為部分案例:
浙江浙能樂清發電責任有限公司
【關于網強】
? ? 網強信息技術(上海)有限公司成立于2003年,是一家專業從事網絡管理和IT綜合管理軟件開發的高新技術企業。經過17年技術積累與實踐經驗,目前已成為國內市場高占有率、國內最大的網絡管理、IT綜合管理軟件開發與解決方案等服務提供商之一。
智能管理專家
免費體驗 無需等待