IT運(yùn)維服務(wù)危機(jī)管理研究

時(shí)間:2022-01-16 02:46:34

導(dǎo)語:IT運(yùn)維服務(wù)危機(jī)管理研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

IT運(yùn)維服務(wù)危機(jī)管理研究

1危機(jī)管理的特點(diǎn)

(1)復(fù)雜性隨著知識產(chǎn)權(quán)事業(yè)的高速發(fā)展,專利信息化水平不斷提高,服務(wù)器設(shè)備、存儲、網(wǎng)絡(luò)交換機(jī)、數(shù)據(jù)庫、中間件等系統(tǒng)不斷增加,IT運(yùn)維規(guī)模越來越大,在一定程度上增加了運(yùn)維的復(fù)雜性,另外還涉及不同廠商、不同品牌等,IT環(huán)境結(jié)構(gòu)龐大、復(fù)雜,各業(yè)務(wù)系統(tǒng)調(diào)用接口眾多,從而導(dǎo)致故障定位困難。(2)先兆性IT系統(tǒng)發(fā)生故障時(shí),會有一定的先兆性,例如:設(shè)備硬件異響、內(nèi)存、CPU使用率高、監(jiān)控指標(biāo)達(dá)到預(yù)警值等,需要運(yùn)維人員根據(jù)經(jīng)驗(yàn)、能力敏銳察覺設(shè)備故障先兆表現(xiàn),及時(shí)發(fā)現(xiàn)問題,快速定位,把問題解決在萌芽狀態(tài)。(3)突發(fā)性IT運(yùn)維中,也會有一些突發(fā)性故障,例如機(jī)房停電、漏水、消防火警等,對于這類緊急情況的處理需要按照應(yīng)急預(yù)案進(jìn)行操作。需要運(yùn)維人員沉著冷靜,正確應(yīng)對。突發(fā)性故障如果不能及時(shí)響應(yīng),正確應(yīng)對,造成的危害將是災(zāi)難性的。這就要求必須提前制定相應(yīng)的應(yīng)急預(yù)案。

2危機(jī)主要表現(xiàn)

(1)服務(wù)臺故障報(bào)修量經(jīng)過統(tǒng)計(jì)近幾年服務(wù)臺故障報(bào)修數(shù)量(包括桌面客戶端、業(yè)務(wù)系統(tǒng)、服務(wù)器、存儲、電話、網(wǎng)絡(luò)、動力環(huán)境):2013年8萬件,2014年9萬件,2015年突破9萬,2016年將近10萬。如圖1所示看出隨著設(shè)備使用年限的增長,已進(jìn)入故障高發(fā)期。(2)機(jī)房動力環(huán)境機(jī)房動力環(huán)境包括空調(diào)、UPS、消防、門禁、新風(fēng)機(jī)等,其中空調(diào)故障占87.5%,UPS故障占2.5%,外圍保障占10%。機(jī)房動力環(huán)境故障主要集中在空調(diào)故障,空調(diào)故障有可能導(dǎo)致機(jī)房高溫,造成服務(wù)器設(shè)備宕機(jī),進(jìn)而影響業(yè)務(wù)系統(tǒng),空調(diào)故障危害性大,影響面廣,是機(jī)房動力環(huán)境需要重點(diǎn)關(guān)注的對象。(3)IT業(yè)務(wù)系統(tǒng)IT業(yè)務(wù)系統(tǒng)包括服務(wù)器、網(wǎng)絡(luò)、小機(jī)、安全設(shè)備、主機(jī)、數(shù)據(jù)庫、中間件、存儲等。根據(jù)IT工作的特點(diǎn),可以將IT業(yè)務(wù)系統(tǒng)故障分為兩類:硬件和軟件。一種是服務(wù)器、網(wǎng)絡(luò)交換機(jī)等硬件設(shè)備故障,另一種是數(shù)據(jù)庫、中間件等軟件故障。IT業(yè)務(wù)系統(tǒng)故障主要集中在硬件故障,經(jīng)過統(tǒng)計(jì)數(shù)據(jù)發(fā)現(xiàn),硬件故障占85%,軟件故障占15%。其中硬件故障又細(xì)分為電源、硬盤、內(nèi)存、其他幾類,分別占45%,35%,3%,17%。在硬件故障中,電源和硬盤為主要故障占80%。

3現(xiàn)有危機(jī)管理舉措

(1)應(yīng)急預(yù)案根據(jù)各自業(yè)務(wù)特點(diǎn)制定了相應(yīng)的應(yīng)急預(yù)案,在危機(jī)發(fā)生時(shí)運(yùn)維人員能夠做到有預(yù)案可依,正確應(yīng)對,把危機(jī)帶來的危害降到最低。例如機(jī)房動環(huán)部分有停電應(yīng)急預(yù)案、漏水應(yīng)急預(yù)案、消防應(yīng)急預(yù)案,IT系統(tǒng)部分有E系統(tǒng)應(yīng)急預(yù)案、S系統(tǒng)應(yīng)急預(yù)案、存儲應(yīng)急預(yù)案、網(wǎng)絡(luò)應(yīng)急預(yù)案等。另外,針對節(jié)假日期間,還制定了非工作時(shí)間重大事件處理流程,以方便值班人員在故障發(fā)生時(shí),可以遵循相應(yīng)的規(guī)則操作,解決問題。(2)建立聯(lián)動機(jī)制為了更好地應(yīng)對IT運(yùn)維服務(wù)危機(jī),建立了聯(lián)動機(jī)制,危機(jī)發(fā)生時(shí),適時(shí)啟動更好的解決問題。有些故障比較復(fù)雜,可能涉及多方面業(yè)務(wù),例如網(wǎng)絡(luò)、存儲、應(yīng)用等,需要協(xié)作共同定位排查問題,解決故障。針對這種情況,建立了總值班人制度,由總值班人進(jìn)行統(tǒng)一溝通、協(xié)調(diào)、匯報(bào)。(3)危機(jī)恢復(fù)后及時(shí)總結(jié)當(dāng)IT運(yùn)維故障處理完畢后,及時(shí)對問題進(jìn)行分析總結(jié),找到事發(fā)原因,形成分析報(bào)告,為今后避免此類情況再發(fā)生打下基礎(chǔ)。

4危機(jī)管理對策改進(jìn)

引用4R危機(jī)管理模型構(gòu)建一個(gè)完整的危機(jī)管理架構(gòu)進(jìn)行支撐,構(gòu)建信息中心IT運(yùn)維服務(wù)危機(jī)管理體系,包括危機(jī)縮減、危機(jī)預(yù)備、危機(jī)反應(yīng)、危機(jī)恢復(fù)4個(gè)方面。(1)危機(jī)縮減在4R模型中,危機(jī)縮減是整個(gè)危機(jī)管理過程的核心,對于組織來說,如果能夠?qū)⑽C(jī)風(fēng)險(xiǎn)解決在萌芽狀態(tài),有效阻止危機(jī)潛在的誘因繼續(xù)發(fā)展擴(kuò)大,就能夠在危機(jī)全面形成前將其控制,把危機(jī)帶來的危害降到最低。危機(jī)縮減主要是未雨綢繆,進(jìn)行預(yù)防,把相關(guān)工作布置在危機(jī)發(fā)生之前,危機(jī)縮減在危機(jī)管理中是關(guān)鍵的一環(huán),該階段也是解決危機(jī)最有效果的。IT運(yùn)維服務(wù)危機(jī)縮減管理主要包括進(jìn)行風(fēng)險(xiǎn)評估、加強(qiáng)風(fēng)險(xiǎn)縮減。在信息中心日常IT運(yùn)維中,應(yīng)采取一系列措施,降低風(fēng)險(xiǎn)發(fā)生的機(jī)率,根據(jù)風(fēng)險(xiǎn)評估表,制定有效的應(yīng)對方法,確保該風(fēng)險(xiǎn)能夠降低到組織可以接受的水平。(2)危機(jī)預(yù)備危機(jī)預(yù)備是危機(jī)管理過程的關(guān)鍵,針對各種危機(jī)情況,提前做好預(yù)防,在危機(jī)來臨時(shí),可以進(jìn)行主動的,有準(zhǔn)備的應(yīng)對,更好地消除危機(jī)。所以,在信息中心IT運(yùn)維服務(wù)危機(jī)管理時(shí),應(yīng)重視預(yù)防,堅(jiān)持預(yù)防為主,防治結(jié)合的原則。IT運(yùn)維服務(wù)危機(jī)可以提前進(jìn)行預(yù)防,不管人為因素或突發(fā)事件引起的危機(jī),都可以提前制定應(yīng)急預(yù)防,并進(jìn)行定期演練,這樣在一定程度上對危機(jī)進(jìn)行防范,最大程度控制危機(jī),減輕危機(jī)對組織帶來的不利影響。IT運(yùn)維服務(wù)危機(jī)預(yù)備管理包括4個(gè)方面:組建危機(jī)管理團(tuán)隊(duì)、完善危機(jī)預(yù)警系統(tǒng)、強(qiáng)化危機(jī)管理預(yù)案、定期開展容災(zāi)演練。(3)危機(jī)反應(yīng)IT運(yùn)維服務(wù)危機(jī)反應(yīng)階段是指當(dāng)危機(jī)發(fā)生后,危機(jī)管理團(tuán)隊(duì)馬上進(jìn)行評估,確定危機(jī)的級別及影響范圍、程度,根據(jù)相關(guān)應(yīng)急預(yù)案進(jìn)行處置,該階段是解決危機(jī)的重要環(huán)節(jié),在IT運(yùn)維服務(wù)危機(jī)反應(yīng)階段應(yīng)做到準(zhǔn)確、快速、及時(shí)、有效,把危機(jī)帶給組織的沖擊降到最低,減輕損失。IT運(yùn)維服務(wù)危機(jī)反應(yīng)管理包括快速識別確認(rèn)危機(jī)、統(tǒng)一權(quán)威信息、危機(jī)處理與消除危機(jī)。在反應(yīng)管理中,運(yùn)維人員應(yīng)急處置能力至關(guān)重要,提高運(yùn)維人員應(yīng)急處置能力可以從兩方面入手。第一,在信息中心開展培訓(xùn)活動中,加強(qiáng)對業(yè)務(wù)技能培訓(xùn)的支持力度,通過培訓(xùn)提高運(yùn)維人員綜合業(yè)務(wù)素質(zhì)水平。第二,加強(qiáng)容災(zāi)演練,通過實(shí)戰(zhàn)積累經(jīng)驗(yàn),提高運(yùn)維人員的應(yīng)急處置能力。(4)危機(jī)恢復(fù)IT運(yùn)維服務(wù)危機(jī)結(jié)束后,需要對危機(jī)管理過程進(jìn)行回顧、總結(jié),發(fā)現(xiàn)問題,找出不足,對原有的應(yīng)急預(yù)案進(jìn)行完善、優(yōu)化,為組織進(jìn)一步提高打下堅(jiān)實(shí)的基礎(chǔ)。IT運(yùn)維服務(wù)危機(jī)的恢復(fù)管理包括危機(jī)恢復(fù)、化危機(jī)為機(jī)遇兩部分。信息中心IT運(yùn)維服務(wù)危機(jī)恢復(fù)主要從以下幾個(gè)方面進(jìn)行考慮,1)對更換下來的故障備件進(jìn)行妥善處置,例如硬盤進(jìn)行格式化處理,保證數(shù)據(jù)不外泄。2)加強(qiáng)與客戶的溝通,爭取其理解與支持。3)對危機(jī)處置效果進(jìn)行評估,做好相關(guān)文檔記錄,對發(fā)現(xiàn)的問題不回避,不隱瞞。信息中心危機(jī)管理團(tuán)隊(duì)通過分析總結(jié)后,審視IT運(yùn)維服務(wù)危機(jī)管理的效果,找出問題并制定有效的措施進(jìn)行改進(jìn)。在危機(jī)縮減環(huán)節(jié),對可能存在的風(fēng)險(xiǎn)進(jìn)行識別,加強(qiáng)風(fēng)險(xiǎn)管控。在危機(jī)預(yù)備環(huán)節(jié),對危機(jī)管理團(tuán)隊(duì)的職責(zé)進(jìn)一步界定,優(yōu)化應(yīng)急預(yù)案,對運(yùn)維人員加強(qiáng)培訓(xùn)和演練。在危機(jī)反應(yīng)環(huán)節(jié),通過總結(jié),完善針對突發(fā)事件的響應(yīng)流程、策略,提高危機(jī)管理團(tuán)隊(duì)識別、處理危機(jī)的能力。另外,利用wiki開發(fā)一個(gè)危機(jī)知識庫,對危機(jī)處理過程、方法進(jìn)行總結(jié)后按版塊進(jìn)行分類加入知識庫,進(jìn)行經(jīng)驗(yàn)積累,為日后危機(jī)處理提供依據(jù)。

參考文獻(xiàn)

[1]魏華.公共管理視角下的中國危機(jī)管理研究-現(xiàn)狀,趨勢和未來方向[J].才智,2016,(8):253.

[2]許雁容.巨變時(shí)代的危機(jī)管理[J].機(jī)器人產(chǎn)業(yè),2016,(2):96-100.

[3][美]羅伯特•希斯.危機(jī)管理[M].王成,宋炳輝,金瑛.北京:中信出版社,2001:13.

[4]科索路咨詢.IT服務(wù)管理白皮書[M].科索路咨詢,2013:13.

[5][美]羅伯特•希斯.危機(jī)管理[M].王成,宋炳輝,金瑛.北京:中信出版社,2001.

[6]趙平.公共危機(jī)管理的理論與實(shí)踐研究[J].人民論壇,2013,(23):56-57.

[7]胡百精.危機(jī)傳播管理[M].北京:中國傳媒大學(xué)出版社,2005:8.

作者:于文奇 單位:中國專利信息中心