"定時檔案"是協助監控伺服器與程式系統的存活指標

     "定時檔案"是協助維運系統對伺服器深層角度的檢測功能,以確保其伺服器與應用系統為正常運作

     定時檔案主要檢測的目的為
       *.伺服器主體系統定時回報運行正常
       *.伺服器內的應用程式定時回報運行正常

     監控"定時檔案"的系統規格
       偵測目的: 監控主機與特定主機系統或主機執行程式的存活標記
       監測目標: 存活標記(使用字串名稱)
       警報條件: 溢時未回報
       即時資訊: 正常/警報發佈
       資訊收集: 訊息,警報發佈/解除時間點
       緊急處置: 通報,執行預定程式
       警報臨界值: 依預設值

     由伺服主機執行"定時檔案",並將偵測值回傳Watchdog維運監控系統進行告警機制檢查與資訊記錄
     是偵測主要的目的




     設定"溢時回報"的警報臨界點,是當超過警戒值時,即發出警報並且可以執行預設命令等動作
     協助系統管理人員透過不同角度去查探應用程式的運作,並且有效的管理整體資訊環境的各種狀況

     "定時檔案"功能也可以是檢查伺服主機的應用程式是否當掉時的一種程式工具
     定時偵測相關主機傳來的訊息檔案,如維運系統檢測其超過設定時間未收到訊息,則視為警報事件

     以下為維運系統之定時檔案功能的圖形監控大圖:



     請於本機偵測狀態中的定時檔案之文字連結點選即可進入查詢

     可以定時偵測相關主機傳來的訊息檔案,如系統超過設定時間未收到訊息,則視為警報事件

     定時檔案的用途為檢查程式或系統是否當掉的方法之一
     背景處理程式不易查覺其執行進程是否有問題,而且程式當掉難以定義
     通常用程序Process在執行存在與否來定義其是否當掉時.如果在程式內加入一段功能
     在固定的時間內或是迴圈內由程式定時主動發出訊息,就知道程式是否當掉也是一種方法

     以下為圖形監控小圖,請點選偵測狀態的文字連結即可進入:



     偵測晝面大小圖的切換可點左上藍點切換大圖或是小圖,本畫面方便判斷訊息檔案是否呈警報狀態

     下圖為定時檔案分析表,如果要判斷檢查程式或是系統是否當掉,可以點選要查詢的圖示進入以下畫面:



     於圖中定時檔案的偵測結果點選進入查詢,例如點選警報分析圖一週並且選擇範圍之後進入以下畫面:



     如上圖可以從警報的規律性可判斷警報是否由系統事件造成或是誤判造成的偽警報
     例如下班,放假,系統測試或維修等等的原因造成定時檔案沒有回應等狀況

     定時檔案偵測功能主要用於
       1.偵測相關主機是否存活?
       2.偵測固定執行的程式是否存活?

     在作業系統上的程式異常很難監控且數量龐大,當使用者通知系統無法使用時
     系統負責人或管理人就必須找出問題,網路連線與伺服器是首先要檢查的對象
     此時定時檔案功能可以排除問題的可能性,有效節省大量時間

     以下為定時檔案的監控圖型大圖:



     可以點選左上角的藍色按鈕切換大圖與小圖

     當檢測到伺服主機的應用程式中斷後,是否需要自動喚起或是檢測到伺服器的應用系統重要程式無回應
     可能是服務程式己中斷或停止執行,也可以透過命令閘道與警報閘道功能來設定自動啟用

     應用上可以點選以下定時檔案分析表的資料清單-長期,並且選擇範圍:



     本圖上方為定時檔案的偵測結果中,時效秒數和剩餘秒數為本功能的關鍵性指標
     並且可以在偵測名單定時檔案設定的溢時欄位中調整參數值



     選取好範圍之後點選確定以進入下圖: 警報分析圖-資料清單-長期-分析



     如圖中的清單中有以下項目之詳細記錄,包含序號,狀態,資料時間,秒時間(1900起算),警報代碼,項目代碼
     警報序號,通報群組,解除等級(1-5),警報時間(1900起算),警報至解除時間sec,等級時間sec,目標索引
     偵測目標,警報有效時間與警報訊息等項目
     都是為協助維運人員分析與判斷系統與程式是否存活的重要依據
    
     定時檔案之偵測目的與設定方式之說明

     設定維運系統的定時檔案功能,需先了解定時檔案功能的主要監測目標即為存活標記的最高溢時秒數
     存活標記是使用字串名稱辨識

     下圖為定時檔案的主設定頁面,請由偵測名單本機偵測中的定時檔案之文字連結,點選進入即可看到:



     相關設定如下:
       01.序號:偵測目標的排序序號,以WA500型的定時檔案偵測數量為0~127組,其他型號可以參閱規格書
       02.啟用、暫停:主要為選擇偵測目標是否啟用
       03.刪除:將偵測目標的資訊,整筆移除
       04.目標索引名稱(英文數字):需要輸入預定偵測的檔案名稱或是程式代碼
       05.溢時:系統更新指定檔案的時間間隔,如果檔案在指定時間內沒有傳送進本系統,即依通報名單發出警報
       06.歸屬主機:圖為點選進去的畫面,於欄位內輸入主機的IP即可產生分群監控的效果



     圖中的欄位內輸入主機IP即可產生分群監控的效果

       07.警報:圖示如果為灰色則代表無設定,當偵測系統發出警報時,系統會依此設定通知命令閘道執行控制命令



       08.解除警報:同警報一樣,如果圖示如果為灰色,則代表無此設定,當偵測系統發現警報解除時
              系統會依此設定通知命令閘道執行控制命令



       09.群組名單:使用者可以在此設定通報群組
       10.單位部門:本項次呼應群組名單,如果群組名單所選擇的群組,有單位部門的名稱,就會顯示出來,方便管理人員判別
       11.別名:如為灰色圖示則表示此功能尚未建立,使用者可以在此替偵測目標設定別名
              系統通報時將會使用此別名發出通報



       12.群組:灰色圖示表示群組尚未建立,若在通報群組中有指定或是新增群組,在此項目中可進行群組的通報名單設定



       13.資訊:即為設備資訊,主要是設定偵測點的詳細資料,設定畫面可以參照設備資訊內的設定圖說




回到首頁