伺服器與執行程式的存活指標"定時檔案"

     伺服器應用系統的背景執行程式如果有問題,系統管理員會很難查覺到是否正常運行
     使用"定時檔案"的機制要求應用程式必須定時回報訊息做為程式或主機的存活指標
     若應用程式未能在設定的時間內回報訊息則視為異常事件

     "定時檔案"是伺服主機在應用系統層的輔助監測功能之一
     維運系統對於伺服器是採全面監控,而不放過任何有可能造成主機營運異常的事件
     當上述情況發生時,Watchdog資訊維運系統即會發佈警報並且執行警報機制,務求達到整體妥善率的防護加強

     監控"定時檔案"的系統規格
       監測目標: 存活標記(使用字串名稱)
       警報條件: 溢時未回報
       即時資訊: 正常/警報發佈
       資訊收集: 訊息,警報發佈/解除時間點
       緊急處置: 通報,執行預定程式
       警報臨界值: 溢時未收到訊息

     以下為"定時檔案"功能的圖形監控大圖:



     請於本機偵測狀態中的定時檔案之文字連結點選即可進入查詢

     可以定時偵測相關主機傳來的訊息檔案,如系統超過設定時間未收到訊息
     則視為警報事件,並且可以顯示設定好之主機檔案的定時檔案之警報狀態

     背景處理程式不易查覺其執行進程是否有問題,而且程式當掉也難以定義
     如果在程式內加入一段功能在固定的時間內或是迴圈內由程式定時主動發出訊息,就比較能判斷程式是否當掉

     當資訊維運監控系統檢測到伺服主機的應用程式異常時可以透過命令閘道的功能來重啟程式

     以下為圖形監控小圖,請點選偵測狀態的文字連結即可進入:



     本項功能之偵測大小圖的切換可點左上藍點切換大圖或是小圖

     下圖為定時檔案分析表,可以點選要查詢的圖示進入以下畫面:



     於圖中定時檔案的偵測結果點選進入查詢,例如點選警報分析圖一週並且選擇範圍之後進入以下畫面:



     如上圖可以從警報的規律性可判斷警報是否由系統事件造成,或是誤判造成的偽警報
     例如下班,放假,系統測試或維修等等的原因造成定時檔案沒有回應等狀況

     應用上可以點選以下定時檔案分析表的資料清單-長期,並且選擇範圍:



     警報分析圖-資料清單-長期-分析
     如圖中的清單中有以下項目之詳細記錄,包含序號,狀態,資料時間,秒時間(1900起算)
     警報代碼,項目代碼,警報序號,通報群組,解除等級(1-5),警報時間(1900起算),警報至解除時間sec
     等級時間sec,目標索引,偵測目標,警報有效時間與警報訊息等項目


     加入監控目標於"定時檔案"的設定說明

     下圖為定時檔案的主設定頁面,請由偵測名單本機偵測中的定時檔案之文字連結,點選進入即可看到:



     相關設定如下:
       01.序號:偵測目標的排序序號,以WA500型的定時檔案偵測數量為0~127組,其他型號可以參閱規格書
       02.啟用/暫停:主要為選擇偵測目標是否啟用.
       03.刪除:將偵測目標的資訊,整筆移除.
       04.目標索引名稱(英文數字):需要輸入預定偵測的檔案名稱或是程式代碼
              若是使用FTP功能則為檔案名稱,若是使用公用程式則是以"程式代碼"的型態呈現
       05.溢時:系統更新指定檔案的時間間隔,如果檔案在指定時間內沒有傳送進本系統
              即依通報名單發出警報.(初始值為600秒,最高值9999秒)
       06.歸屬主機:圖為點選進去的畫面,於欄位內輸入主機的IP即可產生分群監控的效果
              也就是附掛在遠端主機偵測畫面,如有設定,欄位為綠色,灰色表示尚未建立

     點選圖示可以進入以下設定畫面:



       圖中的欄位內輸入主機IP即可產生分群監控的效果

       07.警報:圖示如果為灰色則代表無設定,當偵測系統發出警報時,系統會依此設定通知命令閘道執行控制命令



       08.解除警報:同警報一樣,如果圖示如果為灰色,則代表無此設定,當偵測系統發現警報解除時
              系統會依此設定通知命令閘道執行控制命令
       09.群組名單:使用者可以在此設定通報群組
       10.單位部門:本項次呼應群組名單,如果群組名單所選擇的群組
       11.別名:使用者可以在此替偵測目標設定別名,系統通報時將會使用此別名發出通報



       12.群組:若在通報群組中有指定或是新增群組,在此項目中可進行群組的通報名單設定



       13.資訊:即為設備資訊,主要是設定偵測點的詳細資料,設定畫面可以參照設備資訊內的設定圖說




回到首頁