文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.181019
中文引用格式: 楊曉軍,錢成. 一種基于電流狀態監測分析的系統自我監控管理技術[J].電子技術應用,2018,44(9):79-81,86.
英文引用格式: Yang Xiaojun,Qian Cheng. A self-monitoring and management technology for systems based on real-time current monitoring and analysis[J]. Application of Electronic Technique,2018,44(9):79-81,86.
0 引言
現代社會對信息系統設備的高可靠性、易測試性的要求越來越高,“實時、動態、快速、精確”已成為當今信息系統的新主題。系統健康管理技術日益發展,已成為提高系統高可用性的關鍵技術之一[1],其基本思想是對系統的關鍵部件狀態進行實時監測,并基于系統的健康管理知識庫,進行實時的自主保障診斷、預測與健康管理,從而提高系統的高可用性。
在規則知識自動挖掘獲取方面,從數據中挖掘提取規則知識的技術在很多領域取得了成功應用,如:賀林曉利用關聯規則挖掘方法提取變電設備故障診斷規則[2];黃常海等人對船舶事故的因果關系數據進行分析挖掘,提取預測和控制船舶事故的關聯規則[3]。
電源系統是信息系統的關鍵部件之一,可以通過對電源系統電流的實時監測與數據挖掘分析,在線實時預測預警系統設備的運行狀態,并根據不同運行狀態對其進行狀態診斷與保障維護,從而提高系統的高可用性。
本文以提高信息系統的高可用性、易測試性為目的,采用健康管理的技術理念,通過對一類系統的電源系統架構改造,增加了電流實時狀態監測與診斷知識學習功能,通過對系統設備啟動運行中的電流監測,實現了對運行狀態的在線自診斷,從而給系統的維護檢修提供輔助決策支持功能。
1 基于電流狀態監測分析的自我狀態監測診斷方法
本文設計的自我監控診斷系統架構如圖1所示。其基本思想如下:對系統運行過程中的關鍵狀態數據進行實時在線監測記錄,保存到歷史數據庫中,并通過模式識別、數據挖掘等方法,挖掘提取出數據中潛在的規則知識;然后在系統實際運行中,根據關鍵狀態數據的實時監測值,通過規則匹配及時診斷發現系統設備的異常運行狀態,進行預警并提出相應的系統保障預案,以便及時對系統進行維護保障,從而提高系統的可用性。
供電系統是系統的關鍵部件之一,系統設備的不同工作負荷狀態往往對應著一定的電流序列值。圖2反映了一個服務器設備在運行大型程序、運行普通程序、系統空閑時的電流變化的動態狀態(采樣頻率為10 Hz)。系統空閑時,電流穩定在一個較小范圍內;當運行程序特別是在其運行大型程序或處于CPU占用率較高時,電流會出現明顯上升并至一定峰值高度。可以通過對計算機設備電流變化的特征判定計算機的當前基本工作狀態。本文即采用對系統設備運行中電流狀態的監測與診斷分析的方法來進行系統自我監測診斷。
1.1 電源部件的改進
一些老舊系統的供電系統一般不具備電流狀態在線監測分析功能,為了對系統電流進行實時狀態診斷分析,本文對現有某系統的電源系統架構進行改進,增加了電源參數監控模塊來實時采樣記錄工作設備的電流數據,對記錄的歷史數據通過數據聚類分類算法提取系統設備各種運行模式時的電流序列模式知識庫,實現基于知識庫的系統設備實時監控自我保障預警分析。
在系統架構中,電源是通過多個分線器與不同的工作設備連接來提供,原分線器不具備監控各工作設備電流狀態的功能。為了采集記錄分析各工作設備的工作電流,本設計增加了一個智能電源記錄分析模塊,如圖3所示,它可以實時采集記錄各工作設備的工作電流值的歷史數據。
智能分線器按照10 Hz的采樣頻率對工作設備的電流進行采樣記錄,并傳輸給診斷分析儀對數據進行處理。由診斷分析模塊從歷史數據中挖掘系統設備工作模式的特征知識庫,并基于實時采樣的電流序列,通過知識庫診斷分析系統設備的運行狀態。
1.2 系統設備工作模式特征知識庫構建
從圖2可以看出,設備的每種工作模式對應著一定的電流特征模式,這里采用下列電流特征模型Mt來描述系統的不同工作狀態的模式模型:
對系統正常運行中的歷史數據進行模式學習,建立模式知識庫,當實際運行時的模式與模式庫中的正常模式匹配度較低時,則預警設備維護人員,并記錄相應的異常模式,以輔助設備維護人員及時進行設備維護保障。
為了獲得較高的歸納能力,這里采用模糊數學的模糊值方法來描述電流的狀態、窗口的大小。其中,IS表示電流模糊取值為小,IM表示電流模糊取值中,IL表示電流模糊取值為大,IT表示電流模糊取值為特大;WS表示窗口大小取值為小,WM表示窗口大小取值為中,WL表示窗口大小取值為大。相應的隸屬度函數曲線如圖4所示。
采用這種模型,對于圖2表示的某服務器工作模式曲線,可以建立如下的系統正常工作模式知識庫:
學習獲得系統工作模式的算法流程如下:
輸入:電流序列數值ik;
輸出:系統工作模式知識S。
begin
(1)計算電流模式窗口Wt:
①當|ik-ik-1|較小時,則將k-1時刻作為Wt的開始時刻;
②當|ik-ik-1|較大,且在模式窗口狀態時,將k時刻作為窗口Wt的結束時刻;
③按照W的模糊隸屬度函數,計算得出Wt的離散值
(2)統計Wt窗口內系統的電流值:
①去掉Wt窗口的電流狀態值中的最大、最小值,然后求其平均值iwt;
②根據電流模糊隸屬度函數求iwt的模糊值
(3)計算模式Mt=的支持度Ct:
①累計Mt的模式數;
②Ct=Mt的模式數/總模式數。
(4)由支持度大于閾值的模式組成系統的模式知識庫S;
end
1.3 系統工作模式在線自診斷分析
從系統設備的正常運行狀態下的電流歷史狀態數據中,學習建立了系統的正常模式知識庫后,就可以根據電流序列的狀態模式與知識庫中的模式進行匹配,不能匹配的模式則為異常模式,或者人工分析判斷為正常時作為正常模式加入模式庫。
工作模式自診斷分析算法流程如下:
輸入:電流狀態值ik,模式知識庫S;
輸出:系統工作狀態。
begin
(1)計算電流模式窗口Wt的模糊值
(2)統計Wt窗口內系統的電流值模糊狀態值
(3)計算系統工作模式知識庫中是否含有模式沒可匹配的模式時,則預警系統存在異常工作狀態;
end
2 試驗分析
利用上述方法,本設計對某系統的無線通信設備6個月的正常運行中歷史記錄電流數據進行了學習,建立了系統正常無故障工作狀態下的工作模式知識庫。對系統中正常運行的無線發射設備以頻率10 Hz進行電流采樣,通常情況下,在其進行對外話音或數據通信時可以發現明顯的電流變化,且每次發射的電流變化過程基本一致。在無線發射設備靜默或待機狀態,電流相對平穩,當出現話音通信或定期的數據通信時,其電流出現明顯的躍升,該電流變化特征可作為該無線發射設備工作狀態判定的依據,工作模式知識數據如圖5所示。
在一次無線網絡互聯過程中發現數據通信中斷。一般情況下需要排查整個通信鏈路中參與通信的終端設備、網絡交換設備、路由設備、安防設備以及無線通信設備。在增加了電流數據采樣后,系統發現該無線通信設備電流數據長時間保持在靜默待機狀態,與以往運行路由協議進行周期數據發射模式明顯不同。
根據系統正常無故障狀態下工作模式知識庫:S={(IS,WM,0.32),(IS,WT,0.28),(IM,WM,0.10),(IM,WT,0.13),(IL,WM,0.17)},對系統運行中工作狀態進行實時在線自診斷分析,并檢測出該無線通信設備工作異常狀態模式(IL,WS),進一步對該異常進行機理分析后,診斷為一電子器件老化故障。
3 結論
本文基于系統健康管理的思想,以提高系統的自我診斷保障功能為目標,通過對原有電源系統的改造,增加了運行電流狀態實時監測記錄功能,可以監測系統設備運行中的電流模式特征;建立了電流模式的特征模型,并通過歷史數據學習獲得正常模式知識庫,根據實時運行中的電流模式特征和知識庫自我監測診斷,發現異常運行狀態,從而可以及時針對相應的異常按照相應異常預案進行維護保障,以提高系統維護的實時性,有利于提高系統的高可用性。
參考文獻
[1] 胡蔦慶,胡雷,陳凌,等.裝備健康管理的現狀、未來與挑戰[J].國防科技,2015,36(1):10-15.
[2] 賀林曉.基于粗糙集的關聯規則挖掘在變電設備故障診斷中的應用[D].北京:華北電力大學,2015.
[3] 黃常海,高德毅,胡甚平,等.基于Apriori算法的船舶交通事故關聯規則分析[J].上海海事大學學報,2014,35(3):18-22.
作者信息:
楊曉軍,錢 成
(中國電子科技集團第二十八研究所,江蘇 南京210007)