伺服器應用系統的介接監控"事件數據"


     伺服器應用系統程式的執行狀態與程式認定為異常狀況的事件,通常僅有原設計者才能確認
     資訊維運系統支援應用系統程式的介接監控有依檔案介面型態的"事件警報"與"事件數據"
     當應用系統程式認定為異常事件或數據時,系統負責人將無法即時掌控狀況,亦無法控管下列事項
       *.無法經由統一管道發佈訊息
       *.無法比對數據是否為異常
       *.無法做長短期數據分析
       *.無法分析事件發生時間或狀況解除
       *.無法即時監控
       *.無法串聯命令控制
       *.無法整合維運管理系統做好標準控管機制

     提供伺服器應用系統的介接監控的"事件數據",可以讓應用程式層多一項異常訊息的溝通管道
     如果應用系統控制不當,將會對伺服器的效能產生重大影響,應用程式也可能會有問題
     "事件數據"結合應用系統對異常事件之發佈,是客制化應用,讓特別專屬的應用程式整合入監控系統

     "事件數據" 的警報發佈與解除警報是由維運系統檢測與發佈
     有三種警報
        1. 大於 最高警報值 ">"
        2. 小於 最低警報值 "<"
        3. 超過溢時秒數,無法取得檔案資料

     "事件數據"是伺服主機在應用系統層的輔助監測功能之一
     維運系統對於伺服器是採全面監控,而不放過任何有可能造成主機營運異常的事件
     當上述情況發生時,Watchdog資訊維運系統即會發佈警報並且執行警報機制,務求達到整體妥善率的防護加強

     監控"事件數據"的系統規格
       偵測目的: 讓各專案的應用程式整合入監控系統
                     當應用程式必須將數據資料交由此項功能來統計分析與判別正常或發佈警報時
                     如: 資料庫的TempDB/TABLE 使用比
                     如: 環控系統收集到的溫濕度數據
       監測目標: 檔案名稱內的數據
       警報條件: 最低或最高數據值
       即時資訊: 數據/警報發佈
       資訊收集: 訊息,數據,警報發佈/解除時間點
       緊急處置: 通報,執行預定程式
       警報臨界值: 依應用程式定義警報值

     如果應用程式對於文字類型的事件需要拹助應用分析與異常告警之發佈,可參考"事件警報"

     下圖即為事件數據的主偵測頁面



     進入請由偵測狀態點選伺服主機之後選擇事件數據圖示點選進入即可,如下圖:



     上圖即為事件數據的主偵測頁面,並且本功能提供短期的效能分析圖與警報分析圖以及長期的資料清單-長期

     事件數據功能也有提供了長短期的資訊給使用維運人員評估分析狀況
     點選需要查詢的圖示即可進入長短期分析選擇畫面



     上圖的紅框框內為長短期分析的點選連結示意圖

     以下圖型為Watchdog系統事件數據功能的[效能分析圖-一週],呈現範圍的選擇畫面






     上圖可以看出偵測時間內的數據,一直持續的維持在2122左右.

     下圖可以看出05/12(星期四)的08點到13點陸續有警報發生的情況.



     設定事件數據功能的操作與使用說明

     "事件數據"功能的偵測目的為讓各專案的應用程式整合入監控系統
     當應用程式必須將數據資料交由此項功能來統計分析與判斷正常或發佈警報時
     例如:資料庫的TempDB/TABLE使用比或是環境監控系統收集到的溫濕度數據
     主機端系統程式僅要將事件數據寫入預定的事件名稱檔案即可
     此事件數據功能等於也是一種偵測指定程式與檔案的有效工具,協助維運人員面對各種資訊災害與突發狀況

     設定請由偵測名單內的伺服主機點選事件數據字樣,即可進入設定首頁,如下圖



     點選進入之後即為下圖的事件數據功能的主設定頁面,另外請注意右上角的紅色問號可以點選進入查看使用說明



     偵測首頁如下圖內的紅色框框為特殊欄位:



     設定功能會有特殊欄位與通用欄位,通用欄位請參閱通用選項設定篇,特殊欄位請參考

     以下設定說明:
       1.事件名稱(英文數字):如欲使用本功能,本欄位必定輸入偵測目標的檔案完整名稱,輸入完畢之後點選啟用再儲存
       2.說明:輸入說明事件的欄位,可輸入中文
       3.最低警報值:輸入範圍1到999999999,若偵測到低於"最低警報值",系統將會發出警報
       4.最高警報值:輸入範圍1到999999999,若偵測到高於"最高警報值",系統將會發出警報
       5.數據最低值:輸入範圍1到999999999,為偵測圖行流量最低點使用
       6.數據最高值:輸入範圍1到999999999,為偵測圖行流量最高點使用
       7.單位:輸入單位的欄位,可輸入中文
       8.溢時警報(sec):初值為0,單位為秒,本欄位如果輸入600秒,代表如果10分鐘內
                     程式沒有產生新的數據檔案,則系統會發出告警,並執行警報條件




     以下為使用說明內的內容,由說明頁面所擷取的提供使用者參考:

     利用定時程式將所得之數據寫入檔案,系統會依設定值
        1. 警報通知
        2. 數據分析

     使用方法: 將數據寫入指定的檔案內 如:68
     Unix/Linux 系統
          /usr/rooty/wdogc/Evcnt/事件名稱
     Windows系統
          c:\rooty\wdogc\evcnt\事件名稱

     提供有三種警報機制
       1. 大於 最高警報值 ">"
       2. 小於 最低警報值 "<"
       3. 超過溢時秒數,無法取得檔案資料

     警報數據設定有效值
       0. 若設定值為 "0" 表示不檢查警報值(不發任何警報,僅取得數據)
       1. 最高警報值 1 - 999999999
       2. 最低警報值 1 - 999999999
       3. 溢時秒數 1 - 9999



回到首頁