您是否因核心業務生產資料無保護,而擔憂數據丟失?
您是否因數據同步效率低下,導致數據丟失時間太長?
您是否因全量掃描拖累業務性能,進而導致核心生產業務受影響?......
以上問題,深信服EDS存儲異步遠程復制技術一一攻克!
通過融合SnapDiff增量識別等創新手段,EDS存儲實現了高效的數據同步,為您的業務連續性提供堅實保障。
今天,我們將深入解析EDS存儲異步復制技術的原理與優勢,展示它如何成為您業務連續性的可靠支撐。
01基本原理及關鍵概念介紹
在異步復制過程中,數據同步的機制如下:首先,主端和備端的兩個 EDS 存儲集群通過容災網絡建立集群Peer。接著,配置復制組,并將需要保護的容災目錄加入其中。最后,設置定時計劃,確保數據能夠定期復制。接下來,我們將為大家詳細解析這些關鍵概念。
集群Peer
兩個存儲系統上的復制集群配對組成集群Peer,集群Peer通過兩個系統上的復制網口及互聯網絡進行通信交互,這兩個存儲系統間的復制特性基于該集群Peer運行。
復制節點
參與遠程復制任務的節點稱為復制節點,復制節點上用于遠程復制的網口稱為復制網口。
容災網絡
主端復制節點與備端復制節點建立鏈路時所使用的網絡稱為容災網絡。用戶可以通過增加或刪除復制節點上的復制網口,來管理容災網絡。此外,集群Peer支持通過共享標簽和共享密鑰對備端集群進行鑒權。
復制鏈路集
復制鏈路集是主、備集群間建立的一組鏈路集。鏈路集中包含了兩端復制節點之間的所有通信鏈路。所有異步遠程復制目錄對都將共用此復制鏈路集來執行遠程復制任務。主、備集群之間鏈路流控也基于復制鏈路集完成。
每個復制節點都會和對端復制節點建立一條鏈路,如主端存在3個復制節點、備端也有3個復制節點,則會建立9條復制鏈路。當主端集群的某個復制節點發生故障時,復制鏈路的通信鏈路將自動重建,從而保障復制業務的連續性。
保障復制業務的連續性
遠程復制組
遠程復制組是指一條數據復制關系,用于描述和管理數據復制的來源和目標。管理員可以基于此進行數據同步、故障切換等操作。
在文件存儲的遠程復制中,數據復制的來源稱為主端目錄,數據復制的目標稱為備端目錄。數據復制的方向為主端目錄向備端目錄復制。主、備端角色和數據復制方向可通過主備切換操作進行改變。
管理員可以指定主端集群的任意目錄(MTree空間)作為主端目錄(數據復制的來源),并指定備端集群中的任意空目錄(MTree空間)作為備端目錄(數據復制的目標)。管理員可以根據業務需求在主、備集群間創建多個遠程復制組。
02運行機制介紹
深信服EDS存儲基于文件數據差異,將主文件系統周期性地同步到備文件系統。在每個周期內,對數據進行如下處理:
1、主文件系統生成新的快照,無損記錄快照之間的文件操作行為變化點;
2、結合變化點和快照內容,生成文件元數據增量和文件數據增量;
3、將文件元數據增量和數據增量發送并寫入到備文件系統;
4、備文件系統完成一個周期的同步后,生成新快照。
周期處理示意圖
基于快照的數據同步
遠程復制組進行初始同步時,存儲系統會為主端目錄創建快照。然后基于該快照向備端目錄進行數據的全量同步(包括目錄結構、數據、元數據、擴展屬性等)。
在數據同步的過程中,主端目錄不受影響,可以繼續讀寫數據,數據同步期間變更的數據會隨下一次數據同步過程同步至備端目錄。
當數據同步完成后,存儲系統會為備端目錄也創建一份快照,該快照用于備端目錄的本地備份,保障備端目錄的數據完整性。
基于SnapDiff增量數據的同步
完成初始同步后的每一次同步,存儲系統都會再次為主端目錄創建快照,并通過SnapDiff分析兩次快照之間的增量數據,然后將增量數據同步至備端目錄。
同樣地,每次數據同步完成后,存儲系統都會為備端目錄創建一份快照,用于備端目錄的本地備份。
故障切換
文件存儲異步遠程復制提供了故障切換操作(暫時僅支持計劃內切換)。當主端集群因為各種突發災難性事件而失效時,可以將業務切換至備端集群,由備端集群繼續提供服務。
備文件系統保護
備文件系統保護可以實現對備端目錄進行只讀保護。數據正常同步時,開啟備文件系統只讀保護,以保障主、備端目錄的數據一致性。當執行計劃內切換時,手動中斷并刪除復制組使備端目錄變為讀寫狀態,從而允許備端目錄接管業務。
03差異化優勢
深信服EDS存儲的異步復制技術突破傳統存儲方案桎梏,構建了多重差異化優勢——
文件級復制,效率更高
傳統存儲一般基于文件系統層之下的卷層做復制,復制內容為變化的數據塊。而EDS存儲采用文件級復制,復制內容為基于文件變化而識別出的文件操作。
1. 網絡帶寬占用更少
以刪除文件為例,傳統存儲需要找到文件占用的所有數據塊,復制內容為所有數據塊的變化,文件越大則數據塊越多,網絡傳輸數據量越大。
EDS存儲的復制內容為“刪除操作 + 文件路徑”,網絡傳輸數據量為字節級,用戶無需關注文件大小。
2. 復制內容實時生效
傳統存儲的復制過程中,每次傳輸的是數據塊,已丟失文件語義,不是完整的文件操作,導致備文件系統的內容不完整,變化非實時生效,備文件系統的變化要等到數據塊完整傳輸完成時才可見。
EDS存儲在復制過程中每次傳輸的是完整的文件操作,備文件系統的內容變化實時生效可見,備端讀取業務更及時。
與文件系統Snapdiff結合,自定義文件增量語義
傳統存儲復制采用主機復制軟件進行文件復制,基于全量掃描(POSIX接口語義)識別變化數據,增量識別粒度受POSIX標準限制。
EDS存儲則與自身的文件系統Snapdiff相結合,用戶可以自定義文件增量語義,精準識別文件增量操作、文件增量內容,提升復制效率。
相較于全量掃描(POSIX接口語義)識別,Snapdiff增量識別在性能和速度上更具優勢。
1.性能無損,復制速度快
傳統主機復制軟件需要對整個目錄進行全量掃描識別數據,對前端業務性能影響較大。在文件數量規模太大的場景(>1億),即便只有極少量文件變化,往往需要數十小時才能完成掃描,從而拉長了整個數據復制的時間。
EDS存儲根據前后快照內容結合Snapdiff識別增量數據,無需對目錄進行全量掃描識別,對前端的業務性能影響小,獲取增量數據快速。
2. 僅傳輸文件真實操作行為及文件變化的內容,網絡帶寬利用率高
以移動文件為例,EDS存儲根據文件級Snapdiff和前后快照內容,可識別出文件移動操作,在備文件系統回放該操作即可,處理輕量。主機復制軟件只能識別出原路徑的文件減少和新路徑的文件新增,在備文件系統要刪除舊文件、創建新文件并重傳整個文件。
以修改文件為例,EDS存儲除了支持文件級Snapdiff,還支持文件內容的Snapdiff,復制時僅傳輸文件中改變的內容。主機復制軟件只能識別出文件有更新,無法識別出哪些內容發生更新,需要重傳整個文件,文件越大則重傳數據量越大。
基于應用/目錄的智能Qos控制
EDS存儲可以針對目錄進行Qos限速,將要求較低的應用/目錄進行限速以優先保障高業務要求的RPO時效。
災難恢復能力強
EDS存儲支持最短15min級的RPO,實現增量、異步、周期性的同步,災備站點可快速接管業務(暫時僅支持計劃內接管業務)。
未來,深信服EDS存儲將持續深化異步遠程復制技術,以生產級可靠性構建數據生命線,保障業務運行連續性。
云話技術是深信服打造的一檔云技術內容專欄,將定期為大家推送云計算相關的技術解析、場景實踐等內容,為大家深度解析深信服在云計算領域的創新能力、技術動態、場景應用及前瞻分析。