使用最通用的方法"封包測試"來檢測連線品質與網路斷線

     使用"ping"指令來檢測網路連線狀態是大部份系統人員常用的指令,其偵測狀態也值得信賴
     "封包測試"的功能主要是使用"ping"指令由ICMP協定對有IP網路設備的監測目標進行檢測
     檢測項目有漏失率(loss)與封包回應時間(ms),此項檢測方法可取得兩者之間的網路品質與忙錄或斷線
     當上述情況發生時,Watchdog資訊維運系統即會發佈警報並且執行警報機制,務求達到整體妥善率的防護加強

     監控"封包測試"的系統規格
       偵測目的: 針對有網路能力的設備進行連線網路品質監測與斷線測試
       監測目標: 漏失率與封包回應時間
       警報條件: 大於漏失率或封包回應時間+次數+連續時間
       即時資訊: 數據/警報發佈
       資訊收集: 訊息,數據,警報發佈/解除時間點
       緊急處置: 通報,執行預定程式
       警報臨界值: 依設備(要觀查7天後才定義警報值)

     "封包測試"監控項目的警報臨界值有下列兩項
       *.封包漏失率(loss)高於最高臨界值漏失率(loss)
       *.封包的回應時間(ms)高於最高臨界值

     請參考下圖為封包測試的圖形監控小圖



     可以看到顯示伺服器之IP以及封包測試之警報狀態,可以依照螢幕解析度的狀況點選左上角的藍點切換成大圖
     以下圖型即為監控大圖



     在偵測上如果遇到螢幕解析度不夠的情形時,可以點選畫面左上方的藍點進行切換小圖
     另外需注意兩項關鍵指標為回應時間(time)和漏失百分比(loss)可判斷警報的嚴重性
     偵測目標不一定是伺服器,只要有IP位置的網路設備皆可設定為偵測目標

     以下即為封包測試的圖形監控之大圖,於偵測名單內的項目點選即可進入查詢:



     一般在偵測上會使用封包測試功能來監控所有具有IP的網路設備之連線狀況,
     可以作到隨時收集資訊並且提供數據給維運人員進行分析確認,當發生異常時可進行立即通報等後續之處理..
     本封包測試功能可以自動收集資料並加以分析,啟動系統的自動應變機制,
     讓網管人員的時間可以用來處理更為急迫的工作事項,
    
     以下為點選封包測試圖型所展示的分析表:



       如圖中的反應時間(time)和封包漏失(loss)即為本偵測功能的關鍵指標
       可在偵測名單內的時間ms和漏失率進行調整參數值

     本封包測試的偵測目的為針對有網路能力的設備進行網路連線品質監測與斷線測試
     同時記錄用於長短期的數據分析.將系統人員常做的"ping"處置自動化定時檢測且擴大其應用範圍
     經由佈線追蹤找出網路串接之故障點,有效的協助維運管理人員ping確認目標存活的一種功能
     封包測試功能的監測目標即為有IP之設備之斷線,漏失率(loss)與封包回應時間(time)

     下圖為封包測試分析表:




     本圖上方為本功能的偵測結果,可以看到反應時間(time)和封包漏失(loss),即為本功能的重要關鍵指標
     並且可在偵測名單的時間ms和漏失%的欄位內調整偵測之參數值

     下圖為封包測試功能之圖形監控小圖:



     可以顯示已設定網路設備的封包測試之警報狀態,點選目標偵測點可以進入以下畫面,即為封包測試分析表:



     於上圖的偵測結果可以看到偵測目標的反應時間(time)和封包漏失(loss)為本功能的關鍵指標

     點選效能分析圖-一週-設定的文字連結進入下圖:



     點選範圍按確定之後即可進入效能分析圖-一週-封包回應時間



       可以查詢整個偵測範圍內的圖表狀況

       點選效能分析圖-一週-封包漏失率的文字連結進入以下圖型:



     如上圖的橫軸單位為時間(年/月/日/時:分),縱軸單位:封包回應時間圖為-回應時間(毫秒ms)
     封包漏失率圖為-封包漏失率(百分比%)

     另外注意效能分析圖-一週的兩個圖形相互關聯.例如封包漏失率呈100%水平線且封包回應時間亦呈0毫秒水平線>br>      則該時段可能是下班,例假日,系統測試或維修
     點選效能分析圖-資料清單-長期-設定進入以下畫面選擇範圍:



     選擇完畢確定之後,即會出現以下的長期資料表格,也可以當成是報表來使用,效能分析圖-資料清單-長期-分析:



     上圖中的清單有以下項目的詳細記錄,包含有序號,狀態,資料時間,時間(秒+1900),漏失警報值
     反應時間警報值,漏失,反應時間,群組名稱,效能等級等等的項目
     再點選警報分析圖-一週即可參考以下的畫面:



     上圖中可從警報的規律性可判斷警報是否由系統事件造成,或是誤判造成的偽警報,例如:下班,放假,系統測試或維修
     點選警報分析圖-資料清單-長期的文字連結進入以下選擇設定畫面:



     選取要查詢的月份時間,即可進入以下的警報分析圖-資料清單-長期-分析畫面:



     於圖中的清單有著各種項目之詳細記錄,包含有序號,狀態,資料時間,秒時間(1900起算),警報代碼
     項目代碼,警報序號,通報群組,解除等級(1-5),警報時間(1900起算),警報至解除時間sec,
     等級時間sec,目標索引,偵測目標,警報有效時間與警報訊息等等

     點選搜尋交換器位置的文字連結進入以下畫面:



     如圖中的打勾之連接埠表示網路設備在交換器Switch上的連接埠位置,可有效的方便網管人員在複雜的
     線路中快速找到網路設備的位置
     其中的全部交換器,VLAN分佈圖-特定IP,VLAN分佈圖-全部,埠速度分佈圖-特定IP埠速度分佈圖-全部
     以及佈線追蹤為一般功能的共通項目
     欄位內的設備資訊點選可以進入以下畫面:



     設備資訊頁面包含有以下的項目,
     檔案名稱,偵測目標,IP位址,通信埠,驅動設備,RS485-ID,設備編號,設備次號,設備類別,重要等級,設備名稱,
     廠牌型號,設備用途,設備地點,設備樓層,設備位置,機櫃編號,UPS位址IP,PDU位址IP,
     PDU插座編號,位置地圖,照片檔名,建置時間,設備群組名稱,設備群組說明,
     使用單位代號,使用單位名稱,使用單位聯絡人,保管單位,保管人員,維護廠商,
     維護人員,聯絡電話,維護期間,備註事項,設備照片與位置地圖等項目,
     這些項目可以在偵測名單的設備資訊項目進入進行設定,製作完整也可作為公司的簡易資產管理表

     如要查詢網路佈線,請直接點選文字連結進入以下畫面:



     網路佈線圖顯示兩個網路設備間經過的所有結點(node),利用ping指令逐一測試網路佈線圖尚未排除的節點
     可有效的找出有問題的網路設備,亦可以透過網路埠線的功能來追蹤路由是否正常,路由追蹤-正常:



     如圖中,如果顯示路由連線正常的清單,若沒有發生路由追蹤正常,便無此記錄,當路由追蹤-異常時則產生以下畫面:



     顯示路由連線異常的清單,若沒有發生路由追蹤異常,便無此記錄

     系統設定由偵測名單中的文字連結點選進入主設定畫面,如下圖,即可開始進行設定:




     如圖中,只要設定好次數,間隔,漏失%,時間ms與偵測目標等資料,本偵測系統便能定時主動取得封包測試的資料,
     若重測之後仍超過警戒值,即依"警報條件"判斷是否該發出警報,並且依照設定好的群組名單,
     一次轉發給相關的資訊人員.儲存好的設定可以後.可以選擇啟用,暫停或刪除來進行選擇性之偵測

     設定項目說明請參考以下說明:

       次數:指偵測為異常時重測的次數.範圍從1-99,預設值為3次
       間隔:本欄位內指重新測試時的間隔秒數,範圍從1-999,預設值為30秒
       漏失%:本欄位為輸入漏失指封包漏失的百分比%
       時間ms:輸入時間指封包回傳的時間毫秒ms的欄位

     以上次數,間隔,漏失與時間等四個項目,其設定值會影項封包測試之功能在偵測告警上的靈敏度
     偵測目標:為輸入要偵測的目的設備之IP
     其他通用欄位包含有序號,啟用,暫停,刪除,設備,基本匣道,歸屬主機,警報,解除,群組名單,單位部門
     別名,群組,佈線及資訊等項目,為常見設定

     詳見連結或下方說明:
     在設備欄位內有可能會出現以下的系統圖示:



     在顯示偵測目標的網路設備類別時.系統會依照偵測到的判定,如果是OS,例如IBM AIX,SPARC,Linux
     則會如上圖所示,如果是其他類別的設備,會有以下的圖示畫面:



     例如KVM,IP Camera,Switch,Route,UPS,VPN等等各種不同的設備系統.會如上圖所示

     基本匣道:本欄位為偵測系統與偵測目標之間的通道,若有建立基本匣道之IP
          警報發生時只會針對基本閘道發出一個警報,並且不會對經由基本閘道的每個偵測項目都發警報
          為避免警報濫發的一個機制
     歸屬主機:本欄位如果直接點選擇會進入以下畫面:



     此歸屬主機欄位主要是將本偵測目標歸屬在伺服主機底下,並且是以伺服器角度出發
     在一台伺服器也可能擁有數個IP時,歸屬主機即可標註哪個IP屬於哪台伺服器的功能

     點選警報進入以下的畫面



     上圖主要是設定當產生告警時,所發出警報的條件,在偵測系統發出警報時
     會同時執行命令閘道內的遠端控制命令警報之後同樣有解除警報的控制命令之頁面可以進行選擇與設定

     如下圖:



     如上圖為選擇當系統解除警報時,會同時執行命令閘道內的遠端控制命令
     群組名單:本欄位為已經建立之群組或個別輸入的名單
     單位部門:警報通報之群組名單的單位,部門名稱之註記
     別名:為一個連結,點選進入設定的目定為設定偵測目標的別名

     如下圖:



     使用別名的好處是可以讓系統管理者很快的知道設備之用途,請於設定好後點選儲存
     偵測目標與設備名稱就會以別名的形式顯示
     群組欄位為設定告警發佈或解除警報時的通報名單是依群組,部門,特性定義為一群組名稱



     如圖中,群組分為警報發送的通報名單或是伺服器的分組群組名單
     佈線欄位主要是設定偵測系統與偵測目標之間所經過的網路設備



     在連結佈線追蹤系統功能時,當網路不通時可依據佈線追蹤圖找出有問題的節點(node)
     資訊頁面之連結,點選進入下圖型:



     此頁面主要是設定被偵測設備的詳細資訊,如:用途,位置,機櫃,設備照片...等項目
     並且與維運監控系統的其他偵測功能擁有串聯的功能,可作為簡易資產管理表,設定完成後儲存即可運用

     點選相關連結可以進入路由表進行設定選擇,如下圖:



     建立路由表主要是可以在兩個網路設備的中介設備發生問題時,只針對中介設備發出警報
     而不會因誤判而造成對其後面無法偵測到連線的設備發送大量錯誤警報訊息
     通報群組為輸入發佈或解除警報時的通報名單是依群組,部門,特性定義為一群組名稱



     分為警報發送的通報名單或伺服器的分組群組名單
     然後命令閘道功能為設定系統命令的優先順序與間隔執行時間等作用





回到首頁