在過去的30-40年間,災備服務體系本身在不斷的自我完善:從最初的僅僅面向數(shù)據(jù),面向IT系統(tǒng),面向單一自然災害,逐漸轉向面向業(yè)務、面向合作伙伴、面向整個供應鏈。
現(xiàn)在,越來越多的企業(yè)CIO青睞于選擇災備外包模式——在業(yè)內(nèi)人士看來,由災備自建到災備外包,是企業(yè)災備管理意識的自我覺醒和自我提升。采用災備外包模式,企業(yè)不僅可以在基礎設施建設、運行維護及人力資源投入等方面節(jié)約大量成本;而且在災備服務質(zhì)量,服務效率,降低實施風險,提升核心競爭力等方面更具優(yōu)勢。
選擇適合”的災備外包服務商對于災備項目的成功,以及遇到突發(fā)災難后的災難恢復成功至關重要。雖然,業(yè)界對災備外包服務商的選擇沒有統(tǒng)一的標準,但是,企業(yè)可以從服務資質(zhì)、服務客戶、服務經(jīng)驗、服務體系、運維管理體系、客戶滿意度等多方面衡量外包服務商的能力,如是否具有高等級數(shù)據(jù)中心或災備中心服務網(wǎng)絡;是否具有災備服務資質(zhì);是否具有經(jīng)過認證的ISO20000、ISO27001、ISO9000、BS25999等標準化服務流程;是否有相關行業(yè)客戶及成功案例;是否具有經(jīng)過實踐檢驗的服務方法論和流程等。
將災備外包或自建災備中心,并不意味著企業(yè)就可以高枕無憂,長治久安,企業(yè)還需要不斷地進行測試、演練,并提升基礎設施、IT架構等方面的持續(xù)管理能力。因為并不是所有的問題都可以通過切換到災備中心就可以解決,災備只是企業(yè)高可用管理中的一個環(huán)節(jié)。企業(yè)只有將災備與高可用管理相結合,從IT架構及運維管理、基礎設施及管理、災備建設及運維、安全及管理、IT治理等方面全方位考慮,整體改進和提升,才能使IT系統(tǒng)始終處于一種高可用的水平,降低總體擁有成本,保障業(yè)務持續(xù)、安全、高效、健康運行。
從自建到外包,災備管理意識的自我覺醒
居安思危,思則有備,有備無患”是古人對災備”理念最好的詮釋。今天,隨著信息化和網(wǎng)絡的普及,災備與政府、企業(yè)的IT、業(yè)務的緊密程度越來越高,從電子商務到政府服務、從交通管理到金融交易,從能源供應到生產(chǎn)制造,人們的日常生活和政府、企業(yè)的正常運轉越來越離不開災備,幾個小時甚至幾分鐘的IT中斷都可能造成經(jīng)濟和市場、聲譽方面無法估量的巨大損失,甚至直接影響到社會穩(wěn)定和生命健康、安全。
在過去的30-40年間,災備服務的范圍在不斷延伸,擴展,從最開始僅僅面向數(shù)據(jù),面向IT系統(tǒng),面向單一自然災害,逐漸轉向面向業(yè)務部門、面向合作伙伴、面向整個供應鏈,并且,災備體系本身也在不斷的自我完善。
國內(nèi)政府、企業(yè)的災備建設真正起步大概是在2000年左右,主要受千年蟲”,9.11”等事件影響,部分銀行、保險、基金公司開始關注災備。其中,相對于大批自建災備項目,深圳發(fā)展銀行獨辟蹊徑,選擇將災備外包,這在當時業(yè)內(nèi)人士看來,不外乎一大創(chuàng)舉。該舉措創(chuàng)造了多個國內(nèi)第一,如國內(nèi)第一個災備外包先例,創(chuàng)IT服務市場最大單項服務合同額等,對災備服務市場產(chǎn)生了極大震撼。
從2005年起,國內(nèi)企業(yè)對信息系統(tǒng)災備提出了更為迫切的需求,相應的標準和規(guī)范也越來越多,如國家標準《信息系統(tǒng)災難恢復規(guī)范》以及銀行、證券、保險、基金等行業(yè)標準相繼出臺,對災備的建設范圍、等級和方法提出了明確的要求,企業(yè)迫于自身災備需求和行業(yè)監(jiān)管要求,陸續(xù)開始進行災備體系建設。
相對來講,國內(nèi)災備市場發(fā)展與國外發(fā)達國家之間還存在較大差距。首先,災備建設起步較晚;其次,早期災備建設以自建為主,超過70%以上的企業(yè)采用自建模式,在歐美等發(fā)達國家,情況正好相反,超過70%以上的企業(yè)采用外包模式;第三,國內(nèi)企業(yè)更偏重IT系統(tǒng)的災備,對業(yè)務關注度不高,而且備份系統(tǒng)偏少。
2008年,中國災備外包接受程度有大幅度提高,對災備的認識也有了進一步提升:包括國家開發(fā)銀行、華夏銀行、國投瑞銀等在內(nèi),一大批金融企業(yè)選擇了災備外包模式;調(diào)研機構IDC 2009年針對中國市場進行的災備調(diào)研報告顯示,有意向全部災備外包的企業(yè)有10%,而有意向部分外包的企業(yè)則占受調(diào)查企業(yè)的56%—70%,潛在的用戶需求預示著龐大的市場需求。
國家發(fā)展和改革委員會高技術產(chǎn)業(yè)司處長王娜指出,商業(yè)化的第三方災備體系,更加符合國家實現(xiàn)資源配置最優(yōu)化的需求”。工業(yè)和信息化部軟件服務業(yè)司處長尹洪濤也認為,IT外包、災備外包、數(shù)據(jù)中心管理外包都是非??尚械模袊呀?jīng)具備進行災備外包的基礎設施,數(shù)據(jù)中心和災備外包更適合中國國情,而且,災備外包更具有優(yōu)勢。
對此,GDS(萬國數(shù)據(jù)服務有限公司)總裁兼CEO黃偉非常贊同,他表示:以GDS為例,GDS不僅擁有覆蓋全國的高等級數(shù)據(jù)中心、災備中心網(wǎng)絡,而且擁有專業(yè)的災備服務團隊和多客戶服務經(jīng)驗,可以為政府、企業(yè)做好災備服務的基石。”
不僅是政府機構認可災備外包,越來越多的企業(yè)也開始青睞災備外包。在大連銀行常務副行長許文看來:充分借助外在力量,揚長避短是大連銀行IT系統(tǒng)建設的策略之一。采用災備外包能夠較好地解決投入資金巨大、人才匱乏、時間緊張以及過往成功經(jīng)驗不足四大問題。
海富通基金管理有限公司總裁田仁燦對此有著由衷的體會,田仁燦指出:在災備建設方面,海富通的態(tài)度是 外包,做自己更擅長的事”。因為,我們雖然是投資管理界中的專家,但是我們不可能是所有方面的能人,在當今這個科技、技術、知識不斷發(fā)展的情況下,我相信沒有一個人敢說他懂一切,所以海富通在災備建設方面愿意傾聽專家的建議,愿意將不熟悉、不擅長的工作外包出去。”
同樣,在國開行看來,災備屬于非核心業(yè)務,如果自建,投資巨大,建設周期長;選擇公司內(nèi)部分支機構辦公場地建災備中心,建筑標準、電力供給又難以滿足災備中心要求;此外,災備中心的運營、管理也不同于生產(chǎn)中心,需要專業(yè)運維、管理經(jīng)驗。因此,國開行選擇將災難備份中心建設及運維服務外包給第三方完成。
災備外包的諸多優(yōu)勢
為什么越來越多的政府、企業(yè)傾向于將災備外包,災備外包與自建相比究竟有哪些優(yōu)勢?GDS(萬國數(shù)據(jù)服務有限公司)首席災備專家汪琪指出,相對于災備自建,災備外包在基礎設施建設、運行維護及人力資源投入等方面可以幫助企業(yè)大量節(jié)約成本;在災備系統(tǒng)服務質(zhì)量、服務效率、降低實施風險、核心競爭力提升等方面也更具優(yōu)勢。
基礎設施建設成本
災備中心對于電力系統(tǒng)、空調(diào)系統(tǒng)、消防系統(tǒng)及建筑物規(guī)格等的要求非常高,還需要配備業(yè)務恢復坐席、指揮室、會議室、多功能廳此、客房、餐飲等業(yè)務連續(xù)性輔助設施,因此,企業(yè)若自建災備中心,將面臨更多的困難及挑戰(zhàn)。采用外包模式,企業(yè)可根據(jù)災備系統(tǒng)實際的機房面積需求及IT系統(tǒng)建設周期(一般為3-5年期),靈活的租用場地空間,通過共享基礎設施及業(yè)務連續(xù)性輔助設施等,企業(yè)可以大幅節(jié)約在基礎設施成本方面的投資。
運行維護成本
自建模式下,企業(yè)需建立一支技術覆蓋面廣、專業(yè)性強的災備中心運維團隊,人力成本非常高。另外,還需要支付由于自建模式預留資源而增加的額外成本,例如機房未完全使用時,空調(diào)系統(tǒng)所需的額外電力成本。
外包模式下,企業(yè)無需擴大自身人力規(guī)模,減少了因人才聘用或流失而花費的管理、時間及技術風險成本,增加了人力資源配置的靈活性。通過采用按需支付的服務模式,利用第三方服務商的基礎設施及運維人員,可以快速獲得高規(guī)格的基礎設施及維護服務,企業(yè)也避免了預留資源而增加的額外成本。
服務質(zhì)量
自建模式下,企業(yè)災難恢復體系的質(zhì)量保障主要依靠企業(yè)自身的人員素質(zhì)和管理水平;由于災難恢復系統(tǒng)運行的特殊性,人員穩(wěn)定性、技術能力以及專業(yè)性都會面臨挑戰(zhàn)。外包模式下,企業(yè)可以對外包服務商進行綜合評估,通過嚴格的SLA(服務水平協(xié)議)、SOW(工作說明書)對服務質(zhì)量進行經(jīng)常性審查,服務質(zhì)量、服務效率更有保障。
責任機制
自建模式下,大部分企業(yè)是由同一個部門承擔生產(chǎn)中心和災備中心的運行責任,在管理機制上災備中心的運行隊伍并不是面向生產(chǎn)中心負有服務責任,其工作責任主要靠崗位職責和績效考核。外包模式下,災備中心由專業(yè)公司負責運維,對企業(yè)的生產(chǎn)中心承擔服務責任,并且有相關的服務賠償條款,相關責任和義務更為明確。
建設、運營效率
自建災備中心工程浩大,已遠遠超出企業(yè)IT部門和企業(yè)自身管理范疇,而且牽扯電力、市政、土建等多個政府職能部門,因此,建設周期通常為12-24個月。外包模式由第三方服務商提供現(xiàn)成的災備中心資源,大大縮短了項目周期,使企業(yè)在3-6個月就可獲得相應的災難恢復能力。
風險及實踐經(jīng)驗
第三方服務提供商擁有完善的災難恢復服務體系和方法論,專業(yè)的技術和運營管理團隊,豐富的運營、管理、服務經(jīng)驗,可以讓企業(yè)直接分享服務提供商的最佳成功實踐。
核心競爭力提升
災備中心建設和災備運營、管理僅是業(yè)務持續(xù)運行的支持、保障手段,并不能直接創(chuàng)造營業(yè)額,因此,采用外包模式可以幫助企業(yè)在基礎設施建設、運維管理、人力資源投入等方面節(jié)約的同時,使企業(yè)能夠集中更多的人力、財力、物力等資源,專注于核心競爭力的提升。
需要特別強調(diào)的是,目前災備服務市場的服務提供商水平還良莠不齊,差強人意,企業(yè)需要選擇服務經(jīng)驗、服務能力、服務水平、服務質(zhì)量均有保證的服務提供商。雖然災備外包服務商沒有統(tǒng)一的選擇標準,但是企業(yè)可以從服務資質(zhì)、服務客戶、服務經(jīng)驗、服務體系、運維管理體系、客戶滿意度等多方面衡量服務提供商的能力,如是否具有高等級數(shù)據(jù)中心或災備中心服務網(wǎng)絡;是否具有災難恢復服務資質(zhì);是否具有經(jīng)過認證的ISO20000、ISO27001、ISO9000、BS25999等標準化服務流程;是否有相關行業(yè)客戶及成功案例;是否具有經(jīng)過實踐檢驗的服務方法論和流程等。
高可用管理,災備能力的再提升
在災難恢復體系規(guī)劃和建設過程中,普遍存在一些問題:國外的災難恢復體系規(guī)劃建設方法是從19世紀80年代IT系統(tǒng)可用性改進過程中逐步發(fā)展和完善起來的,在發(fā)現(xiàn)單數(shù)據(jù)中心通過以部件冗余、系統(tǒng)冗余、數(shù)據(jù)安全、數(shù)據(jù)備份恢復等技術為代表的本地高可用技術不能完全解決重大事件引起的中斷后,逐步發(fā)展了包括緊急事件管理、危機公關、災難恢復、業(yè)務連續(xù)等相關的理念和方法。
可以說,國外的災難恢復和業(yè)務連續(xù)管理理念和方法是以成熟的高可用性管理為基礎和支撐的。災難恢復體系的建設是完整高可用性管理的外延和擴展。
而目前,國內(nèi)的IT系統(tǒng)雖然在建設和規(guī)劃過程中使用了很多成熟的高可用技術,但對高可用性管理卻缺乏統(tǒng)一的認識和整體的規(guī)劃管理方法,甚至會出現(xiàn)舍本逐末的現(xiàn)象,對災難恢復體系的建設寄予過高的期望。好像災備中心建成后,以后不論出現(xiàn)什么問題都可以通過切換到災備中心來解決。而實際上災難恢復體系并不是萬能的,受到災難恢復體系的等級、使用的技術、災備中心的距離和物理位置等限制,災難恢復體系并不能解決所有的問題。它只是整個高可用性管理體系中的一個環(huán)節(jié),只有從整個IT系統(tǒng)的角度,在技術和管理方面對整個系統(tǒng)的可用性進行通盤考慮和規(guī)劃,才能真正達到預期的可用性目標:將IT管理人員從惴惴不安的等待火情發(fā)生的救火隊員的角色中解救出來,從規(guī)劃師和設計師的角度重新審視整個管理范圍,消除可能隱患、布置監(jiān)控和管理工具、對重要區(qū)域和高風險事件進行重點防范,達到既提升了安全等級,使IT系統(tǒng)風險管理有序可控;又提升了管理效率和工作品質(zhì)。
雖然很多IT管理人員和服務廠商在IT系統(tǒng)可用性的提升方面投入了大量的成本和精力,甚至可以說不遺余力,但實際結果卻是各自為政,效果無法預期。這主要是由IT系統(tǒng)的復雜性所決定的,現(xiàn)在的IT系統(tǒng)服務可用性依賴于技術和管理的不同方面,包括:數(shù)據(jù)中心基礎設施、技術架構、信息安全、災難恢復等,涉及網(wǎng)絡、存儲、數(shù)據(jù)復制、安全、監(jiān)控、空調(diào)、電力等不同技術領域,而且往往取決于最薄弱的環(huán)節(jié)和最短板。
因此,提升IT高可用性管理水平需要從IT架構及運維管理、基礎設施及管理、災備建設及運維、安全及管理、IT治理等方面全方位考慮,整體改進和提升,使IT系統(tǒng)始終處于一種高可用的水平。
從實施策略方面看,企業(yè)首先應在基礎設施、應用系統(tǒng)、中間件、數(shù)據(jù)庫、操作系統(tǒng)、存儲、服務器、網(wǎng)絡、災難恢復體系和安全防御手段等技術層面實現(xiàn)高可用,確保企業(yè)IT資源運行的持續(xù)性和應用系統(tǒng)運行的安全性和穩(wěn)定性。其次,應在基礎設施管理、IT服務管理流程、關聯(lián)組織、人員、治理結構、災難恢復體系管理和安全管理等管理層面確保IT服務的可用性、安全性和持續(xù)性。