監控虛擬主機(ESX/ESXi主機)與整合Guest伺服主機


     市面上虛擬主機的品牌有很多種,但最具代表性的是VMware
     (如:VMware,Microsoft Hyper-V,Sun Virtualbox,Linux KVM,Citrix XenServer)
     Watchdog資訊維運系統的"虛擬主機監控"是以VMware為主要項目,其他則歸屬一般伺服主機監控

     資訊維運系統會將虛擬主機的監控分為下列兩類
       *.ESX/ESXi主機
       *.Guest主機

     本處所所談論的"虛擬主機"是指ESX/ESXi主機或VMware Host
     而Guest主機則依Guest OS歸類在"伺服主機"監控項目內

     監控虛擬主機,VMware原廠己提供了管理工具(如:VMWare vSphere Client)
     但僅限於VMware相關系統,無法整合資訊中心的關聯資訊設備
     Watchdog資訊維運系統會將虛擬主機與資訊中心的資訊設備同步整合並將其關聯資訊串聯統一

     資訊維運系統對於虛擬主機的主要監控重點於下列項目
       1.ESX/ESXi主機
         *.主機硬體層監控
         *.資源分配與基本效能監控
         *.主機系統配置的基本資訊
       2.ESX/ESXi與Guest主機關係
         *.ESX/ESXi與Guest主機的資源分配與資訊整合
         *.串接Guest主機的監控資訊與狀態




     ESX/ESXi主機監控項目
       虛擬主機-主機硬體層:
                    IPMI,ILO,IMM,iDRAC等包含:主機板安全指標數據狀態,電源供應器,溫度感測器,風扇轉速,電壓電流
       虛擬主機-作業系統層:
                    作業系統重要資訊(200項以上),如:硬體清單,iSCSI清單,網路介面,軟體配置,存儲設備
                    檢測項目有:CPU負載率,記憶體使用率,檔案系統(Filesystem)使用率等項目
       虛擬主機-磁碟陣列:
                    即時掌控磁碟陣列卡與實體磁碟機之安全指標與設定狀態,可預警式更換磁碟
                    支援常用之廠牌 如:"HP Smart Array","Adaptec RAID","LSI MegaRAID"
                    告警項目 如:新增或移除,故障,重建
                    檢測新增設備之功能
                          磁碟陣列卡,陣列磁碟區,邏輯磁碟區,實體磁碟機
                    檢測設備移除之功能
                          磁碟陣列卡,陣列磁碟區,邏輯磁碟區,實體磁碟機
                    檢測設備硬體狀態
                          磁碟陣列卡,記憶體狀態,電池狀態
                    檢測設備組織狀態
                          邏輯磁碟區的使用狀態訊息(正常與異常的訊息)
                          如:
                               Failed Physica Drive ->故障或HD己移除
                               Recovering,5%complete ->重建中
                               ReadyforRebuild ->己重建
                          實體磁碟機的使用狀態訊息(正常與異常的訊息)
                          如:
                               Failed ->故障或己移除
                               Data Drive ->使用中的實體磁碟機
                               Spare Drive ->備用的實體磁碟機
                               Unassigned Drive ->未定義的實體磁碟機
                               Rebuilding (重建中)

     ESX/ESXi與Guest主機關係
       *.提供ESX/ESXi與Guest主機完整的資源分配圖與監控資訊
       *.串聯ESX/ESXi主機進入Guest伺服主機的全景即時監控狀態資訊
       *.連結Guest伺服主機的網路資訊(如:交換器Switch)
       *.可彈性定義新增或移除Guest時發出告警訊息
       *.即時統計實體主機,虛擬主機,Guest主機使用數量

     虛擬主機 ESX/ESXi 維運監控首頁如下圖:



     虛擬主機的監控項目有下列功能:
     監控與資訊類項目
       *.磁碟陣列
       *.CPU與記憶體
       *.硬碟使用
       *.新增Guest
       *.移除Guest
       *.Guest效能
       *.Guest拓樸圖
       *.Guest資料清單
       *.Guest系統資源
       *.本機封包測試
       *.警報記錄

     設備關聯類項目
       *.IPMI
       *.交換器
       *.系統記錄
       *.儲存系統
       *.電力設備UPS
       *.電力排插PDU
       *.網站連結
       *.設備資訊

     每一台虛擬主機 ESX/ESXi 的監控項目或系統資訊功能 如下圖:



     從維運中心的主監控可直接進入虛擬主機的
       *.虛擬主機整體資源分配圖
       *.ESX/ESXi與Guest主機的資源分配與資訊整合

     如下圖為Watchdog系統的維運監控主畫面:



     虛擬主機整體資源分配圖
     包含CPU與記憶體資源分配圖與VMGuest 安裝數量,開機數量 等資源分配圖



     一台ESX/ESXi與Guest主機的資源分配與資訊整合
     圖為VMGuest主機的資料清單偵測畫面,可以有效監控與統計各種VM偵測的相關數據與監控關聯:



     維運系統對於偵測虛擬主機,透過多種協定的資料收集以達到全面偵測的目的,包含有ESXI,CLI與SNMP等多種協定
     下圖為透過SNMP收集到資訊整合後所產出的偵測畫面:



     資訊維運系統內全部的虛擬主機VMGuest資料清單



     ESX/ESXi主機的磁碟陣列監控畫面:



     由伺服主機-SNMP功能收集到的VMHost之CPU與記憶體的使用率:



     點選進入可查看CPU與記憶體使用率的詳細資訊:



     包含效能分析與資料清單等資料
     虛擬主機VMHost的檔案系統(Filesystem)偵測項目 如下圖



     點選VMGuest可以看到偵測目標內的Guest之主機的運作狀態圖



     可以查詢VMHost主機與VMGuest之關聯拓墣圖



     點選VMGuest的資料清單進入下圖
     可以查詢VMGuest的詳細使用狀況,包含有CPU,MEN等使用量還有Guest總數量與開關機的統計
     與VMGuest的資源分配與基本效能監控



     以下為虛擬主機之CLI命令的基本資訊



     可以選擇暫停命令,並且查詢用圖說明與資料量等資訊


     點選交換器的連結圖示,進入到以下的位置顯示頁面



     同時可以查詢該交換器的各種監控狀態與各項分析圖等資訊

     進入到設定虛擬主機的也面請點選偵測名單下圖的虛擬主機之文字連結即可進入



     以下為虛擬主機之偵測項目的主設定頁面



     序號:偵測項目的流水編號
     啟用,暫停:決定是否進行偵測的選項
     刪除,確認刪除:如要刪除偵測項目,請點選刪除之後再打勾確認刪除並且存檔即可
     虛擬主機IP:輸入要偵測的虛擬主機之IP的欄位
     VMHost:勾選為新版本的VM,選擇偵測選項的欄位
     虛擬廠牌:選擇目標虛擬主機品牌的欄位
     虛擬廠牌:顯示出偵測目標之虛擬主機品牌的欄位
     VC主機:輸入監控之VC主機的欄位
     重要/備載:本欄位為顯示偵測目標是否與重要主機勾選為重要主機的欄位
     主機資訊:可以顯示偵測目標的虛擬主機是使用哪種作業系統的欄位
     Guest主機:手動輸入設定Guest名單的連結頁面
     Guest拓樸:配合Guest主機欄位,顯示對應拓樸圖的欄位
     Raid:顯示偵測目標是否有啟用磁碟陣列之偵測的圖示欄位
     偵測:本項目點選進入,可進入進階設定的功能頁面
     閘道:輸入對應的閘道之頁面

     連結:
     點選右上角的問號可進入使用說明,以下為使用說明的文字敘述:
     虛擬主機在本系統管理上分三類
       1.可安裝"伺服主機"系統,如:VirtualBox,Windows Hyoer-V
       2.不可安裝"伺服主機"系統,但有支援CLI命令,如:VMware5
       3.不可安裝"伺服主機"系統,又不支援CLI命令

     [注意]
       *."VMGuest主機"的資訊是來自"伺服主機"
       *.支援CLI命令的VMHost,請先建立"VMHost使用者"資料,才能順利取得各項資訊
       *.VMHost欄位是系統自動勾選,有勾選表示本機無法使用"伺服主機",是要用VMHost之CLI命令
       *.VMHost"定時收集-基本資訊","磁碟陣列"預設每隔3600秒收集資料一次,時間可調整300-36000秒之間
       *.如果要檢查VMGuest新增或移除時發出警報,須啟用"新增移除VMGuest時發出警報"開關
           發出警報依VMHost IP,同一主機新增與移除僅會發出一次警報,但會記錄內容(最多1MB)
       *.己刪除之VMHost IP將會保留30天,若此IP在30天之內重新建立將會使用舊資料還原
           安裝VMware主機的磁碟陣列命令(CLI) "hpssacli"
           如: HP DELL 伺服器使用VMware vSphere 5.5
              1.下載HP VMware Utilities for VMware vSphere 5.5
              2.解壓縮後,將hpssacli-1.50.4.0-5.5.0.vib copy至VMHost,如:scp *.vib root@esxserver:/tmp/
              3.安裝
                     ssh root@esxserver
                     esxcli software vib install -f -v /tmp/hpssacli-1.50.4.0-5.5.0.vib
              4.reboot ESXI host

     利用 "伺服主機-SNMP"來取得VMware ESXI 主機更詳細的資訊

     當某些伺服主機無法安裝"Watchdog Client系統程式(Agent)"時,可使用SNMP取得部份,重要資訊
     如:VMWare,IBM AS/400
     使用SNMP取得伺服主機資訊,如:VMWare,Linux,Windows的CPU負載,記憶體使用率與檔案系統(Filesystem)
     使用率,Guest主機清單

     設定 "伺服主機-SNMP"監控名單時要注意下列事項
       *.若將最小與最大警報臨界值設定為"0"時將不檢測警報值
       *.若無法取得資料將會發佈警報訊息
       *.如果使用32bit數據可能無法正確的取得容量數據資料(如:-1234567 負數),將無法統計每台儲存系統的
       檔案系統(Filesystem)的總容量與總使用率等資訊
       *.如果有勾選"全部"表示要將無路徑(PATH)之檔案系統(Filesystem)的容量納入總計內
       *.VMHost 系統會同時取得 VMGuest 名稱,系統啟用,Mac 等相關資訊
       *.如果"儲存系統"或伺服主機己建立名單,將無法重複建立



     點選偵測的圖示進入以下畫面:



     本頁面為針對VM虛擬主機的進階設定頁面
     點選VMHost使用者進入以下畫面



     本頁面需輸入使用者名稱與密碼,並且確認密碼之後才能收集到偵測目標的偵測數據

     定時收集-基本資訊



     啟用定時收集基本資訊的的命令之頁面

     VMHost關機命令



     輸入VMHost關機命令之欄位頁面

     VMHost重新開機命令



     輸入VMHost重新開機命令之欄位頁面

     VMHost CLI的常用命令



     本頁面為啟用VM系統之CLI常用命令的頁面

     VMHost 磁碟陣列



     為設定磁碟陣列的控管之功能頁面,詳見磁碟陣列使用說明:

     關聯類之依附設備與關連設備(歸屬主機),項目包含主機硬體-IPMI,系統日誌-Syslog
     儲存系統,電力設備-UPS,電力排插-PDU,主機硬體IPMI



     為關聯類的標記功能頁面,主要為標記實體主機的IPMI之IP

     系統日誌Syslog



     為關聯類的標記功能頁面,主要為標記系統日誌之Syslog的IP

     儲存系統



     為關聯類的標記功能頁面,主要為標記儲存系統的IP

     電力設備UPS



     為關聯類的標記功能頁面,主要為標記UPS的IP

     電力排插PDU



     為關聯類的標記功能頁面,主要為標記PDU的IP

     磁碟陣列的主要設定選項如下,包含
       *.標記本機無磁碟陣列
       *.磁碟陣列-CLI命令
       *.邏輯磁碟區掛載
       *.實體磁碟安裝記錄

     磁碟陣列-CLI命令頁面如下



     選擇伺服器磁碟陣列廠牌,型號而安裝不同的磁碟陣列卡,不同的磁碟陣列卡會用自己的命令(command line)
     來取得磁碟狀態,必須安裝正確的磁碟陣列"CLI工具程式"Vmware VIB
     如:HP伺服器之"hpssacli"

     本頁面之選擇的磁碟陣列卡廠牌可多選,使用說明如下



     邏輯磁碟區掛載



     偵測欄位包含CLI名稱,硬碟編號,硬碟介面,硬碟型號,硬碟容量,應用狀態,使用狀態,
     掛載位置(/home2) 驅動位置(/dev/cciss/c0d2)

     實體磁碟安裝記錄



     顯示出實體硬碟安裝記錄的頁面,欄位有CLI名稱,硬碟編號,硬碟介面,硬碟型號,硬碟容量,
     應用狀態,使用狀態,硬碟安裝時間yyyy/mm/dd與保固年限

     磁碟陣列的使用狀態



     定時收集-基本資訊(VMHost)



     序號,暫停,用途說明,VIB,CLI命令,命令選項,資料量(Bytes),花費時間(Sec),資料時間,資料內容

     VMGuest主機啟用資訊



     序號,World ID,Process ID,VMX Cartel ID,UUID,Display Name,Config File

     搭配虛擬主機偵測功能的伺服主機之SNMP偵測功能之設定,主要是可以協助在虛擬主機功能無法收集到
     某些資訊數據時,可設定本功能來完善整體虛擬主機的偵測完成度,下圖為偵測名單的進入項目:



     點選進入主設定畫面



     序號:顯示偵測項目之序號的欄位
     啟用,暫停:選擇目標為偵測啟用狀態或是暫停的欄位
     刪除與確認刪除:如要刪除請點選刪除並且確認刪除,即可移除偵測目標
     設備IP:輸入偵測目標之IP的欄位
     設備別名:顯示設備別名的欄位
     Snmp版本:選擇Snmp別名的欄位,下拉選單
     群組:為輸入群組名稱的欄位
     密碼:輸入密碼的欄位
     廠牌:輸入廠牌的欄位
     型號:輸入型號的欄位
     基本匣道:可以輸入偵測目標所經過的基本閘道之欄位
     硬體平台:顯示偵測目標之硬體平台的欄位
     IP數量:顯示出偵測目標的IP數量之欄位
     初始:點選進去可以查看初始的設定(詳見SNMP或是Switch偵測名單的設定)
     調整:調整初始或是初值所取得之資料的頁面(詳見SNMP或是Switch偵測名單的設定)
     初值:第一次設定時,輸入群組與密碼之後,點選本連結進入取得偵測之初值
     警報資訊:點選進入可以設定警報之偵測值的警戒欄位
     多組IP:手動定義多組IP的設定頁面
     群組名單:選擇通報的群組之下拉選單
     單位部門:顯示通報之單位部門的欄位
     別名:點選進入可以輸入別名的頁面
     群組:進入可手動設定告警群組的頁面,請於群組名單中先選擇好通報群組才能設定
     資訊:輸入本偵測目標之各種資訊的欄位頁面,包含管理者,維護廠商等詳細資訊
     記事:輸入備註的欄位頁面
    
     使用說明如下



     伺服主機-SNMP設定之使用說明:
     當某些伺服主機無法安裝"Watchdog Client系統程式(Agent)時,可使用SNMP取得部份重要資訊
     如:VMWare,IBM AS/400
     使用SNMP取得伺服主機資訊,如:VMWare,Linux,Windows的CPU負載,記憶體使用率與檔案系統(Filesystem)使用率,
     如超過警報臨界值將會發佈警報訊息

     重點說明
       *.警報臨界值,預設90%
       *.若將最小與最大警報臨界值設定為"0"時將不檢測警報值
       *.若無法取得資料將會發佈警報訊息
       *.如果使用32bit數據可能無法正確的取得容量數據資料(如:-1234567負數)
           將無法統計每台儲存系統的檔案系統(Filesystem)的總容量與總使用率等資訊
       *.如果有勾選全部表示要將無路徑(PATH)之檔案系統(Filesystem)的容量納入總計內
       *.VMHost系統會同時取得VMGuest名稱,系統啟用,Mac等相關資訊
       *.如果儲存系統或伺服主機己建立名單,將無法重複建立



回到首頁