僅給有勇氣面對系統健康狀況的資訊中心使用




     如果能夠排除90%的潛在危機,剩下10%的突發狀況,對於整體資訊中心都是一件好事
     如果各類型的資訊設備"健康狀況"不好,則問題就會變多
     例如:
          網路線接觸不良就會降速,VM資源分配不當CPU能力會變差,程式重複性的執行未能正常結束,
          磁碟I/O效能差,負載平衡器(Load Balance)設定失效 ..等問題
     要進行全面性的健康檢查並不困難,但大部份的狀況並不是如此,能夠進行整體資訊中心,
        全面性的體健不是一件容易的事
     系統設施的健康檢查不是偶爾做一次即好,而是要7x24隨時都要做
        但進行全面性的健康檢查除了要有系統工具外,可能會面臨到最大的問題是"人"
        尤其是對於 "公開展示"的即時資訊戰情中心所呈現狀態資訊,會有極大的抗拒
        同時將遭遇相當多的藉口與阻撓
       *.資安問題,而不能將系統狀態資訊展示
       *.沒有多餘的人力來解決問題或廠商說系統沒問題
       *.事情太忙沒時間做,系統人員壓力太大
       *.沒有經費來執行
       *.了解越多,事情就越多,等到使用者提出問題時再解決比較快
       *.如何檢測,檢測項目與標準何在都是問題




     要進行全面性的健康檢查對於資訊中心而言是要有極大的勇氣與決心才能進行

     系統的健康檢查當然是越細項越清楚,但至少要有下列大類
     伺服器主機硬體,作業系統,VM分配,應用系統,網路設備或交換器(Switch)與
     各類型協定的網路連線測試,儲存系統等有關聯的設備

     找出問題後最大的關鍵在於系統調整與解決,這會是大難題,除了技術問題外最重要的是
     系統負責人與維運人員,軟體廠商與設備原廠也會為釐清問題與負責處理的事件糾纏不清
     整合與解決問題雖然有點困難,但做好系統的健康檢查並完成適當的系統調整與處置,
     對系統負責人員與維運人員對往後都是一件好事



回到首頁