編者按:在印度著名的軟件服務出口商Mphasis的IT部門,風險主要集中在業(yè)務流程外包(BPO)操作上。為了緩和公司面臨的風險,該公司與其客戶實行連續(xù)性的計劃。另外,該公司的IT部門使用了一個多層標簽交換MPLS網(wǎng)絡來連接其國內(nèi)的其他分支機構。在最后一公里接入方面,Mphasis采取了冗余保護,采用兩種不同的傳輸媒體互為備份,在其中一條出問題的時候,另一個條線路還可以讓業(yè)務保持正常。這些應對措施令其不僅能輕松應對來自人為的風險,即使發(fā)生了臺灣地震那樣的自然災害,Mphasis的CIO也能高枕無憂,他就是這樣給我們講述了兩個應對自然災害的故事。
兩項改進應對資源危機
【IT168 專稿】盡管應對措施非常完善,我們還是曾經(jīng)面臨過一次非常嚴重的網(wǎng)絡資源耗盡危機,很多網(wǎng)站遭受著被中斷的危險。后來,我們發(fā)現(xiàn)我們的冗余設計在服務商接入點POP上存在問題,在其上聯(lián)處只有一個路由器。這意味著連接到這個特定MPLS服務商接入點POP的網(wǎng)站被影響了。
幸運的是,我們在班加羅爾有一個24x7x365工作的全球網(wǎng)絡運行中心,它可以全天24小時地監(jiān)視我們網(wǎng)絡的運行情況。它發(fā)現(xiàn)了這個問題。而且由于我們及時采取措施,我們不用再去求助于我們的災難恢復計劃了,該計劃將在災難發(fā)生4小時后啟動。
根據(jù)這次事故的經(jīng)驗,我們采取了兩個改進措施:首先,我們在服務商接口地方進行了冗余設計;另外我們還將最后一公里接入的其中一條線路轉(zhuǎn)移到第二個服務商接入點上。這種級別的設計很容易,同時也讓我們的網(wǎng)絡可以一直保持不出問題。
雙層ATM環(huán)的保障
我們的系統(tǒng)經(jīng)常遭受到來自大自然的考驗。2004年發(fā)生的海嘯影響了其中一條線路,在另一條線路保持順暢通信的情況下,我們順利恢復了出故障的線路。另一次是最近臺灣的地震,這次地震對我們的網(wǎng)絡造成了一定威脅,但是我們把所有數(shù)據(jù)的路由從太平洋線路無縫地切換到了大西洋的線路上,因此這中間沒有一分鐘的斷線。
因此到現(xiàn)在為止,我們還沒有面臨任何真正的危機。
我們可以實現(xiàn)這些事情是因為我們的網(wǎng)絡是一個具有冗余線路的雙層ATM(異步傳輸模式)環(huán)。這意味著我們使用了不同的線纜系統(tǒng),可以在發(fā)生意外情況的時候可以自動切換系統(tǒng)到?jīng)]有故障的線路中。
我從風險降低中所學到的最重要的東西是,IT危機需要從源頭上解決。CIO們不應該在簽訂了一個合約后,整日擔心其風險的發(fā)生,而應該在危機發(fā)生后,甚至危機發(fā)生前就從源頭上將其徹底解決掉。
點評:從印度軟件服務出口商Mphasis的IT危機解決經(jīng)驗中,我們知道在面臨IT危機的時候,我們要透過危機的表面現(xiàn)象,查找到引起危機的真正根源,從根源上真正將危機解決。無論是技術性還是管理性問題,解決辦法莫不如此。