企業/政府將關鍵業務或生產運行于IT系統之上,IT系統是否能夠正常運行直接關系到業務或生產是否能夠正常運行。但IT管理人員經常面臨的問題是:網絡變慢了、設備發生故障、應用系統運行效率很低、想升級改造IT系統但無法說清問題的真實原因。
IT系統的任何故障如果沒有及時得到妥善處理都將會導致很大的影響甚至會成為災難。因此,如何保障IT系統的正常運行,實現:
1、預知故障,即在故障發生之前發現故障;
2、實時告知,即在第一時間將故障情況通知相關的管理人員;
3、有效處理,即在預定的時間內處理故障,若未及時處理將采取升級措施;
以上問題簡單來說,如何實現“第一時間發現問題”、“第一時間通知相關人員”,“第一時間處理問題”,成為生產型IT系統主管關注的問題。
建立統一的系統運行監控平臺的意義在于:為管理員提供統一的管理界面,從系統角度監控網絡、主機、數據庫、應用系統的運行性能和故障,準確定位故障根源。