伺服器協助監控之"代理偵測-定時檔案"

     "代理偵測-定時檔案"是協助維運系統對整體資訊中心以委託之伺服器角度檢測資訊設備
     以確保其伺服器與應用系統為正常運作

     會使用伺服主機的代理偵測有下列幾個因素
       *.Watchdog維運監控系統無法連線至其網段 如:特定專線
       *.從不同的角度與方向協助維運系統檢測目標
       *.分散維運系統的負擔
       *.建構完整的伺服器維運資訊

     定時檔案主要檢測的目的為
       *.伺服器主體系統定時回報運行正常
       *.伺服器內的應用程式定時回報運行正常

     由伺服主機代理執行"定時檔案",並將偵測值回傳Watchdog維運監控系統進行告警機制檢查與資訊記錄
     是代理偵測主要的目的




     設定"溢時回報"的警報臨界點,是當超過警戒值時,即發出警報並且可以執行預設命令等動作
     協助系統管理人員透過不同角度去查探應用程式的運作,並且有效的管理整體資訊環境的各種狀況

     "定時檔案"功能也可以是檢查伺服主機的應用程式是否當掉時的一種程式工具
     定時偵測相關主機傳來的訊息檔案,如維運系統檢測其超過設定時間未收到訊息,則視為警報事件



     進入偵測狀態的伺服主機之後,點選”代理偵測-定時檔案”圖示即可進入主偵測頁面,如下圖:




     點選主偵測頁面的偵測目標之後,可以選擇需要監看的"警報分析圖一週"或是"資料清單-長期"
     點選進入之後選擇範圍即可:



     "定時檔案"的"警報分析圖一週"與長期的"資料清單-長期"記錄



     上圖為選擇畫面,可以選擇"警報分析圖一週"或是"資料清單-長期"之外,上面還有被偵測目標的詳細資訊
     包含的項目如下:
        *.設備名稱:gotsun-4e779103
        *.資料時間:2016/06/01 16:47
        *.偵測目標:pcftm-1
        *.啟動暫停:啟用
        *.偵測狀態:警報
        *.時效秒數:600 sec
        *.剩餘秒數:0 sec
        *.偵測結果:timeout
        *.警報時間:

     如果是選擇點選"警報分析圖一週"
     參考下圖可以發現05/29(星期一)11點到13點半之間有發生告警與解除警報的狀況

,緊急關機,停電關機,斷電關機




     例如:選擇五月之後點選確定即會出現以下畫面:



     左上角的下載可以本頁記錄當作報表下載下來,提供給維運人員分析與報告使用,欄位內的項目如下
       *.序號
       *.狀態
       *.資料時間
       *.秒時間(1900起算)
       *.警報代碼
       *.項目代碼
       *.警報序號
       *.通報群組
       *.解除等級(1-5)
       *.警報時間(1900起算)
       *.警報至解除時間sec
       *.等級時間sec
       *.目標索引
       *.偵測目標
       *.警報有效時間
       *.警報訊息

     受監控主機或執行程式未能定時送出標記或事件訊息,維運系統判斷為"溢時"後將視為警報事件

     下圖為"代理偵測-定時檔案"功能的主設定畫面



     設定"代理偵測-定時檔案"請由伺服主機點選進入之後,選擇要設定伺服主機然後點選偵測項目,即出現下圖:



     然後點選定時檔案之後,即可進入設定主畫面:



     有關"代理偵測-定時檔案"功能的常用功能請參閱通用功能說明,特殊功能的使用方式請參閱以下說明:
       1.偵測目標:輸入欲偵測的識別名稱與監控名稱
       2.溢時(sec):系統最長回報的時間,訊息在指定時間內若沒傳送進本系統
           即依通報名單發出警報,初始值為600秒,最高可設定到9999秒.
       3.歸屬主機:以伺服器角度出發,一台伺服器可能有數個IP,歸屬主機即標註哪個IP屬於哪台伺服器



回到首頁