企業(yè)如何走出被動(dòng)式運(yùn)維的怪圈
隨著IT運(yùn)維管理技術(shù)的不斷進(jìn)步,系統(tǒng)工程師已經(jīng)能夠獲取網(wǎng)絡(luò)設(shè)備、服務(wù)器、網(wǎng)絡(luò)流量,甚至數(shù)據(jù)庫的警告信息,但又面臨著另一個(gè)令人頭大的問題:成千條警告信息堆積在一起,問題的根源在哪,根本沒法判斷。雖然不少產(chǎn)品提供了告警過濾和壓縮,但結(jié)果并不盡人意。工程師依舊沒有走出被動(dòng)式運(yùn)維的怪圈。
“主動(dòng)”在IT運(yùn)維中并不是一個(gè)新鮮的概念。
幾乎所有的宣傳、產(chǎn)品、用戶、理念都在宣揚(yáng)“主動(dòng) ”。從被動(dòng)到主動(dòng)管理的升華,是每個(gè)企業(yè)針對(duì)信息系統(tǒng)如何提高IT服務(wù)水平、提高系統(tǒng)可用性、降低運(yùn)維成本,實(shí)現(xiàn)IT科學(xué)性的過程。很多企業(yè)在選擇IT管理工具時(shí)將最終目標(biāo)就定位在“主動(dòng)”,希望業(yè)務(wù)系統(tǒng)能夠“無憂”,但真正能夠達(dá)成IT與業(yè)務(wù)融合的企業(yè)卻很少。在以往的企業(yè)IT運(yùn)維工作中,傳統(tǒng)被動(dòng)式運(yùn)維和類似“救火員”角色的IT系統(tǒng)運(yùn)維方式,根本不能滿足企業(yè)的需求。
在虛擬化、云計(jì)算等新興技術(shù)的刺激下,IT正在走向一種整合的發(fā)展趨勢。
當(dāng)然,這種整合并不局限于幾臺(tái)服務(wù)器的集群或組成一個(gè)數(shù)據(jù)中心,而是更多地指向了有序、有效地集中,但也就會(huì)導(dǎo)致原有的問題也會(huì)集中在一起。大多IT工程師習(xí)慣于將工作重心放在性能而不是質(zhì)量上,放在提供支持而不是消除問題上,永遠(yuǎn)都在忙著處理問題,卻忽略了防患未然。
在傳統(tǒng)IT運(yùn)維工作的管理中,就有一些技術(shù)工程師將自己查找日志而排除問題的能力拿出來炫耀,但在“業(yè)務(wù)集中之后”,這種排查日志的技能幾乎葬送了自己所有的工作時(shí)間。因此對(duì)于“問題管理”,在“集中之后”更多的企業(yè)不但需要發(fā)現(xiàn)業(yè)務(wù)系統(tǒng)的問題,更需要聯(lián)動(dòng)式解決問題的辦法,實(shí)現(xiàn)減少問題發(fā)生次數(shù)的目標(biāo)。將IT基礎(chǔ)架構(gòu)內(nèi)由錯(cuò)誤引起的事件和問題對(duì)業(yè)務(wù)的負(fù)面影響減到最小,并預(yù)防這些相關(guān)的事件、問題和錯(cuò)誤的再度發(fā)生,這才是主動(dòng)管理的精髓。
對(duì)于IT系統(tǒng)真正的主動(dòng)管理,是實(shí)現(xiàn)業(yè)務(wù)服務(wù)管理中最重要的基石之一。
有些用戶在修正現(xiàn)有的IT管理目標(biāo)是比較盲目的,因?yàn)樵葲]有一致而且正式的運(yùn)維程序與原則,因此根本無法擬出服務(wù)等級(jí)(SLA)。如果沒有 SLA,實(shí)現(xiàn)業(yè)務(wù)測量運(yùn)營績效與確立IT目標(biāo)幾乎是不可能的,也就不可能為主動(dòng)管理排出精準(zhǔn)的規(guī)劃。
很多IT管理工具并沒有將業(yè)務(wù)放在第一位,設(shè)計(jì)的核心沒有用業(yè)務(wù)指導(dǎo)網(wǎng)絡(luò)運(yùn)維,因此從一開始有些人就站在了相反的起跑線上,即使用了最先進(jìn)的IT運(yùn)維管理系統(tǒng),如今還仍然是在做底層獲取的工作,雖然擁有了海量龐雜的相關(guān)數(shù)據(jù),如果得不到提煉,則上層流程的“主動(dòng)”管理必將成為空談,業(yè)務(wù)的保障和管理就會(huì)成為無本之木。
就如我們共知的那樣,IT問題的發(fā)生是必然的,但未能根據(jù)業(yè)務(wù)進(jìn)行基礎(chǔ)監(jiān)控的用戶,將喪失在問題造成業(yè)務(wù)中斷之前,就進(jìn)行防止的契機(jī),也就喪失了“主動(dòng)”的條件。?
企業(yè)用戶在使用網(wǎng)強(qiáng)平臺(tái)時(shí),可通過服務(wù)目錄的形式提供IT服務(wù)的交付,用戶可點(diǎn)擊服務(wù)目錄中的服務(wù),創(chuàng)建請(qǐng)求流程,通過服務(wù)門戶匯總所有服務(wù)請(qǐng)求、事件、問題、變更記錄,分派服務(wù)任務(wù),監(jiān)督執(zhí)行情況全面管控事件的生命周期,支持事件升級(jí)策略定義,提高運(yùn)維人員的效率,符合SLA,擺脫救火式的被動(dòng)局面、分類分析并解決問題,探究問題出現(xiàn)的根本原因,有效避免再次發(fā)生。