建立IT維運管理前的準備事項




     專屬IT資訊維運管理系統

       以500台伺服器,250台網路設備,30台VM,60個機櫃規模的資訊中心為列,談IT資訊維運管理系統
       內容分屬三個不同層面的角度看

       系統維運工程師: 伺服器,網路管理員,系統工程師
             負責層面: 建置,設定,執行,排除問題,回應疑問,定期更新,故障維修 ..等事項

       管理層主管: 課長,科長,經理,拹理,PM經理
             負責層面: 同合執行與整合管理,通才技術,制度管理,事件拹調處置,管理流程建立與執行,技術支援,解決疑難雜症

       政策層主管: 主任,處長,資訊長,資訊中心主管
             負責層面: 創造政策,效益評估與驗証,建立管理制度,承擔責任
     成立專案

     預先規劃任何有可能影響到資訊營運的狀況點是提升資訊維運妥善率最好的方法
     詳細的檢測與收集各類型的資料用於保障正常維運的基本要件
     *.專案人員
         .原單位資訊管理的負責人
         .維運經理/專案經理(PM)
         .資深系統技術人員(包含:系統,網管,應用)
         .原廠技術人員

     *.定義納入受監控設備的範圍
         .清查納入監控的設備項目
             如: 伺服器,Switch
         .受監控設備必須安裝的裝置
             如:IPMI/ILO 的網段與網路線
         .受監控設備必須配合的設定與資訊
             如:Switch SNMP啟用,Newflow設定
         .應用系統整合的機制-歸類整合項目
             異常訊息轉送
             拹助數據檢測與分析
             拹助檢測檔案,時間,程式的狀態

     *.了解資訊中心資源與架構
         網路架構圖
             基礎網路架構圖
             網段區域之網路與管制架構圖
             網段區域的路由走向
             網路設備可支援的功能清單(如:NetFlow/sFlow)

         伺服器佈署的應用
             伺服器重要性分類
             伺服器重要服務的存活指標點
             伺服器服務系統重要支撐項目(如:inode,NAS mount filesystem)
             系統設備效能
             網路連線應用清單
             應用必用的服務清單(如:IIS,Apache)
             重要應用必用的程式
             應用程式訊息溝通

     *.自動化後檢測點共同的問題
         . 需要監控的項目
         . 監控項目的異常臨界點
             數據類通常會用大於(>)或小於(<)來定義警報發出時機
             字串文字類與訊息類會用比對方式與邏輯(or,and,not)來確認警報發出時機
         . 檢測警報狀況發出的告警效率,嚴緊度與警報敏感度
         . 警報發出的管道與通知名單
         . 警報發出後的緊急處置方案
         . 建立重要關聯整合點(如:封包測試之佈線追蹤)
         . 相關資訊建立(如:設備位置,用途,保管人,維護廠商)

     *.依設備與系統不同的層次特性設計監控目標
       伺服主機(實體主機/虛擬主機)
         主機硬體層-運作主體
         作業系統層-主機效能
         網路連線層-存活指標
         網路連線層-忙碌指標
         網路連線層-品質檢測
         應用系統層-啟用執行
         應用系統層-輔助監測
         應用系統層-訊息溝通
         應用系統層-進階使用
         資訊安全層-潛在危機

       網路設備(交換器/路由器) 網路核心-交換器
         流量資訊
         狀態資訊
         設定資訊
         安全檢測
         串聯架構

     *.中心監控項目
       中心監控項目-網路連線
       中心監控項目-轉送機制
       中心監控項目-特定資訊
       中心監控項目-應用系統整合
       中心監控項目-網路安全
       中心監控項目-系統與事件日誌
       中心監控項目-拹助環境監控
       中心監控項目-緊急處置



回到首頁