容錯服務器是未來發(fā)展的趨勢。在技術方面,雙機熱備份系統(tǒng)因其靈活配置方面更具優(yōu)勢,是許多企業(yè)中經(jīng)常采用的一種保證數(shù)據(jù)安全性的方法。
目前主流應用的服務器容錯技術有三類,它們分別是:服務器群集技術、雙機熱備份技術(簡稱雙機熱備)和單機容錯技術。它們各自所對應的容錯級別是從低到高的,服務器群集技術容錯級別最低,而單機容錯技術級別。
由于PC服務器的安全性因素,基于該平臺業(yè)務系統(tǒng)的安全,穩(wěn)定可靠和系統(tǒng)的持續(xù)運行成為系統(tǒng)的關鍵,其中雙機熱備份技術以其技術成熟,成本相對較低,獲得了廣泛的應用。
在一般情況下,當系統(tǒng)不能正常運行時,我們需要用人工的方法進行故障的認定、分析、恢復及測試。
這些都需要花費很長的時間。在這段時間內(nèi),系統(tǒng)必須停頓下來以等待恢復,從而給企業(yè)帶來難以估計的經(jīng)濟損失。
理解雙機熱備
所謂雙機熱備份是指系統(tǒng)對主機及硬盤、通訊線路等核心設備,采用雙機備份,當系統(tǒng)正常時主機進行工作,并且每隔設定時間系統(tǒng)自動檢測,若發(fā)現(xiàn)問題,系統(tǒng)能夠自動切換到備份機繼續(xù)工作,保證不影響系統(tǒng)的正常運行。
具體來說,利用另一臺服務器做熱備份機,并共享磁盤陣列上的數(shù)據(jù)。當主機發(fā)生故障時,備份機通過所建立的心跳路徑檢測到主機的故障,自動接替所有主機的資源,并在本機上將繼續(xù)讀取數(shù)據(jù),所有的接替工作都在備份機上自動完成而不再占用主機的任何資源。
用了雙機熱備份技術后,能保證客戶機不間斷地對數(shù)據(jù)進行訪問,不需要人工進行干預,可以實現(xiàn)無人職守狀態(tài)下的自動切換。整個的切換時間小于40秒,這樣就可以保證數(shù)據(jù)的不間斷訪問。
雙機熱備份的主從模式
主從模式是最標準、最簡單的雙機熱備份應用,即是目前通常所說的Active/Standby方式。它使用兩臺服務器,一臺作為主服務器(Active),運行應用系統(tǒng)來提供服務。
雙機熱備份系統(tǒng)采用“心跳”方法確保主系統(tǒng)與備用系統(tǒng)之間的聯(lián)系。所謂“心跳”,是指兩個系統(tǒng)之間按照一定的時間間隔互相發(fā)送通訊信號,表明各自系統(tǒng)當前的運行狀態(tài)。
系統(tǒng)的管理軟件隨時監(jiān)控“心跳”狀態(tài),如果“心跳”信號出現(xiàn)異常,則表明主機系統(tǒng)發(fā)生故障,或者備用系統(tǒng)無法收到主機系統(tǒng)的“心跳” 信號,管理軟件就認為主機系統(tǒng)發(fā)生故障,指令主機停止工作,并將系統(tǒng)資源轉移到備用系統(tǒng)上,備用系統(tǒng)就會替代主機正常工作,這種方式保證了網(wǎng)絡服務不間斷運行,如圖所示。
雙機互備與多點集群
雙機互備是在雙機熱備的基礎上,兩個相對獨立的應用在兩臺機器同時運行。但彼此均設為備機,當某一臺服務器出現(xiàn)故障時,另一臺服務器可以在短時間內(nèi)將故障服務器的應用接管過來,從而保證應用的持續(xù)性。
這種方式實際上是雙機熱備的一種應用。它避免了兩個應用需要使用四臺服務器才能分別實現(xiàn)雙機熱備。
但雙機互備存在著性能瓶頸,即如果進行切換后,在一臺服務器上就同時運行兩個應用,有可能負載過大。并且,有些情況下會有不止兩臺服務器對外提供服務。在這種情況上,多點集群就顯示出了其必要性。
多點集群可以理解為雙機熱備在技術上的提升。多機服務器可以組成一個集群。根據(jù)應用的實際情況,可以靈活地在這些服務器上進行部署,同時可以靈活地設置接管策略。
例如,可以由一臺服務器作為其他所有服務器的備機,也可以設置多重的接管關系等。這樣,就可以充分地利用服務器的資源,同時保證系統(tǒng)的高可用性。
如何實現(xiàn)雙機熱備
雙機熱備有兩種實現(xiàn)模式,一種是比較標準的,兩臺服務器通過一個共享的存儲設備(一般是共享的磁盤陣列或存儲區(qū)域網(wǎng)SAN),并且安裝雙機軟件,實現(xiàn)雙機熱備,稱為共享方式。
另一種方式是通過純軟件的方式,一般稱為純軟件方式或鏡像方式(Mirror)。
基于存儲共享的雙機熱備是雙機熱備的最標準方案。對于這種方式,采用兩臺或者多臺服務器,使用共享的存儲設備,磁盤陣列柜或存儲區(qū)域網(wǎng)SAN。兩臺服務器可以采用互備、主從、并行等不同的方式。
在工作過程中,兩臺服務器將以一個虛擬的IP地址對外提供服務,依工作方式的不同,將服務請求發(fā)送給其中一臺服務器承擔。
當一臺服務器出現(xiàn)故障時,另一臺服務器根據(jù)心跳偵測的情況做出判斷,并進行切換,接管服務。對于用戶而言,這一過程是全自動的,在很短時間內(nèi)完成,從而對業(yè)務不會造成影響。
由于使用共享的存儲設備,因此兩臺服務器使用的實際上是一樣的數(shù)據(jù),由雙機或集群軟件對其進行管理。
對于純軟件的方式,則是通過支持鏡像的雙機軟件,將數(shù)據(jù)可以實時復制到另一臺服務器上,即保持數(shù)據(jù)同步運行在兩臺服務器上,如果一臺服務器出現(xiàn)故障,可以及時切換到另一臺服務器。
純軟件方式有幾大優(yōu)點,它避免了磁盤陣列的單點故障;節(jié)約投資,不需購買昂貴的磁盤陣列;不受距離的限制,這樣,可以更靈活地部署服務器,包括通過物理位置的距離來提高安全性。
從方案選擇的角度,建議在進行雙機熱備時,如果投資充裕、數(shù)據(jù)量比較大(如達到T級以上的數(shù)據(jù)),可以采用共享的存儲設備,如磁盤陣列的方式,但應盡量選擇可靠性比較高的設備,并且考慮選擇雙控制器的方案。
如果用戶選擇的是純軟件方式。就一定要選擇一些廠商提供的經(jīng)得住考驗的成熟產(chǎn)品。
決定是否使用雙機熱備,正確的方法是要分析一下系統(tǒng)的重要性以及對服務中斷的容忍程度,以此決定是否使用雙機熱備。即用戶能容忍多長時間恢復過程,如果服務中斷會造成多大的影響等因素。
目前主流應用的服務器容錯技術有三類,它們分別是:服務器群集技術、雙機熱備份技術(簡稱雙機熱備)和單機容錯技術。它們各自所對應的容錯級別是從低到高的,服務器群集技術容錯級別最低,而單機容錯技術級別。
由于PC服務器的安全性因素,基于該平臺業(yè)務系統(tǒng)的安全,穩(wěn)定可靠和系統(tǒng)的持續(xù)運行成為系統(tǒng)的關鍵,其中雙機熱備份技術以其技術成熟,成本相對較低,獲得了廣泛的應用。
在一般情況下,當系統(tǒng)不能正常運行時,我們需要用人工的方法進行故障的認定、分析、恢復及測試。
這些都需要花費很長的時間。在這段時間內(nèi),系統(tǒng)必須停頓下來以等待恢復,從而給企業(yè)帶來難以估計的經(jīng)濟損失。
理解雙機熱備
所謂雙機熱備份是指系統(tǒng)對主機及硬盤、通訊線路等核心設備,采用雙機備份,當系統(tǒng)正常時主機進行工作,并且每隔設定時間系統(tǒng)自動檢測,若發(fā)現(xiàn)問題,系統(tǒng)能夠自動切換到備份機繼續(xù)工作,保證不影響系統(tǒng)的正常運行。
具體來說,利用另一臺服務器做熱備份機,并共享磁盤陣列上的數(shù)據(jù)。當主機發(fā)生故障時,備份機通過所建立的心跳路徑檢測到主機的故障,自動接替所有主機的資源,并在本機上將繼續(xù)讀取數(shù)據(jù),所有的接替工作都在備份機上自動完成而不再占用主機的任何資源。
用了雙機熱備份技術后,能保證客戶機不間斷地對數(shù)據(jù)進行訪問,不需要人工進行干預,可以實現(xiàn)無人職守狀態(tài)下的自動切換。整個的切換時間小于40秒,這樣就可以保證數(shù)據(jù)的不間斷訪問。
雙機熱備份的主從模式
主從模式是最標準、最簡單的雙機熱備份應用,即是目前通常所說的Active/Standby方式。它使用兩臺服務器,一臺作為主服務器(Active),運行應用系統(tǒng)來提供服務。
雙機熱備份系統(tǒng)采用“心跳”方法確保主系統(tǒng)與備用系統(tǒng)之間的聯(lián)系。所謂“心跳”,是指兩個系統(tǒng)之間按照一定的時間間隔互相發(fā)送通訊信號,表明各自系統(tǒng)當前的運行狀態(tài)。
系統(tǒng)的管理軟件隨時監(jiān)控“心跳”狀態(tài),如果“心跳”信號出現(xiàn)異常,則表明主機系統(tǒng)發(fā)生故障,或者備用系統(tǒng)無法收到主機系統(tǒng)的“心跳” 信號,管理軟件就認為主機系統(tǒng)發(fā)生故障,指令主機停止工作,并將系統(tǒng)資源轉移到備用系統(tǒng)上,備用系統(tǒng)就會替代主機正常工作,這種方式保證了網(wǎng)絡服務不間斷運行,如圖所示。
雙機互備與多點集群
雙機互備是在雙機熱備的基礎上,兩個相對獨立的應用在兩臺機器同時運行。但彼此均設為備機,當某一臺服務器出現(xiàn)故障時,另一臺服務器可以在短時間內(nèi)將故障服務器的應用接管過來,從而保證應用的持續(xù)性。
這種方式實際上是雙機熱備的一種應用。它避免了兩個應用需要使用四臺服務器才能分別實現(xiàn)雙機熱備。
但雙機互備存在著性能瓶頸,即如果進行切換后,在一臺服務器上就同時運行兩個應用,有可能負載過大。并且,有些情況下會有不止兩臺服務器對外提供服務。在這種情況上,多點集群就顯示出了其必要性。
多點集群可以理解為雙機熱備在技術上的提升。多機服務器可以組成一個集群。根據(jù)應用的實際情況,可以靈活地在這些服務器上進行部署,同時可以靈活地設置接管策略。
例如,可以由一臺服務器作為其他所有服務器的備機,也可以設置多重的接管關系等。這樣,就可以充分地利用服務器的資源,同時保證系統(tǒng)的高可用性。
如何實現(xiàn)雙機熱備
雙機熱備有兩種實現(xiàn)模式,一種是比較標準的,兩臺服務器通過一個共享的存儲設備(一般是共享的磁盤陣列或存儲區(qū)域網(wǎng)SAN),并且安裝雙機軟件,實現(xiàn)雙機熱備,稱為共享方式。
另一種方式是通過純軟件的方式,一般稱為純軟件方式或鏡像方式(Mirror)。
基于存儲共享的雙機熱備是雙機熱備的最標準方案。對于這種方式,采用兩臺或者多臺服務器,使用共享的存儲設備,磁盤陣列柜或存儲區(qū)域網(wǎng)SAN。兩臺服務器可以采用互備、主從、并行等不同的方式。
在工作過程中,兩臺服務器將以一個虛擬的IP地址對外提供服務,依工作方式的不同,將服務請求發(fā)送給其中一臺服務器承擔。
當一臺服務器出現(xiàn)故障時,另一臺服務器根據(jù)心跳偵測的情況做出判斷,并進行切換,接管服務。對于用戶而言,這一過程是全自動的,在很短時間內(nèi)完成,從而對業(yè)務不會造成影響。
由于使用共享的存儲設備,因此兩臺服務器使用的實際上是一樣的數(shù)據(jù),由雙機或集群軟件對其進行管理。
對于純軟件的方式,則是通過支持鏡像的雙機軟件,將數(shù)據(jù)可以實時復制到另一臺服務器上,即保持數(shù)據(jù)同步運行在兩臺服務器上,如果一臺服務器出現(xiàn)故障,可以及時切換到另一臺服務器。
純軟件方式有幾大優(yōu)點,它避免了磁盤陣列的單點故障;節(jié)約投資,不需購買昂貴的磁盤陣列;不受距離的限制,這樣,可以更靈活地部署服務器,包括通過物理位置的距離來提高安全性。
從方案選擇的角度,建議在進行雙機熱備時,如果投資充裕、數(shù)據(jù)量比較大(如達到T級以上的數(shù)據(jù)),可以采用共享的存儲設備,如磁盤陣列的方式,但應盡量選擇可靠性比較高的設備,并且考慮選擇雙控制器的方案。
如果用戶選擇的是純軟件方式。就一定要選擇一些廠商提供的經(jīng)得住考驗的成熟產(chǎn)品。
決定是否使用雙機熱備,正確的方法是要分析一下系統(tǒng)的重要性以及對服務中斷的容忍程度,以此決定是否使用雙機熱備。即用戶能容忍多長時間恢復過程,如果服務中斷會造成多大的影響等因素。