• <nav id="5jebs"></nav>
    <button id="5jebs"></button>
        • 技術博客

          技術博客??>??VMware替代中不可忽視的事:云平臺升級
          VMware替代中不可忽視的事:云平臺升級
          背景圖 2024-08-15 10:16:11

          領跑AI品牌banner

          本期焦點

          虛擬化云平臺的升級,一直以來都是數字化用戶較為關注的事情。尤其在VMware替代的需求之下,云平臺的升級關系到業務運行穩定性、業務環境的安全、運維操作難度等,本文將介紹深信服云平臺的升級機制,為廣大數字化用戶及正在進行VMware替代的用戶,提供一些技術角度的參考。

          Part.1 什么時候需要升級?

          傳統虛擬化云平臺,常?;谝韵聨讉€原因需要升級:

          • 新功能特性的引入:對于云平臺,其重大版本特性發布、重要機制變更、新場景下的新功能、對新硬件的支持、舊場景下功能的額外支持等,均需要升級。

          • 產品性能的提升:伴隨著云平臺產品內部結構機制優化帶來的性能提升,以及技術進步帶來的性能優勢均要升級云平臺。且一般來說,這類升級通常需與第一點或第三點一起升級完成。

          • 產品補丁的修復:此類問題也屬于需要常升級的原因,任何產品都不可能沒有缺陷,在云平臺產品Beta版發布后,一般要根據用戶反饋進行優化調整,同時將已知的問題進行修復,然后做成產品補丁形式進行升級。

          • 產品LTS到期等:隨著時間的推移,云平臺舊版產品的LTS維護到期,如果用戶想要繼續獲得官方技術支持保障,則必須升級到新版本云平臺。

          在業務實踐上,升級的內容通常有以下幾種:

          升級的內容

          其中虛擬化平臺軟件通常分為幾層:UI前端、平臺管控面、平臺數據面,在升級時會拆分成這幾個部分進行升級。一般而言,平臺管控面涉及的是虛擬化軟件的業務代碼與策略邏輯,平臺數據面涉及底層用戶數據存儲與數據流量,因此通常是先升級平臺管控面,后升級平臺數據面。

          Part.2 升級應該考慮什么?

          下表根據重要程度排序,列出了升級重點關注事項:

          升級關注事項

          在升級過程中,能否保障虛擬機中業務持續不中斷,是大多數用戶非常關心的問題,因為這關系到業務是否要中止來進行維護,涉及到各個層面的運營安排,需要停機的升級處理成本要比不停機的升級處理成本高,因此用戶往往選擇不停機的升級方案,即熱升級方案。

          而業界普遍的熱升級方案是通過虛擬機遷移來將需要升級的主機搬“空”,然后對主機進行升級變更,升級完再回遷虛擬機,然后再對虛擬機本身進行升級操作,因而這種方案在進行升級時成本較高。例如一臺大規格的虛擬機,在遷移時需要耗時非常久才能完成遷移,從而導致有些用戶也會選擇停機升級。

          因此,當大家普遍關注“業務不中斷”時,升級耗時也是一個關鍵因素。

          對升級整體而言,快速完成是避免升級影響業務運營的核心要素之一,而升級的操作方式越簡單、越易上手操作,便越能提高升級效率、減少耗時。同時,為了減少升級失敗故障,避免升級失敗后檢修完再重復升級導致浪費時間,對升級前的平臺做一次整體“健康檢查”是非常有必要的,這可以大大減少升級故障導致的升級耗時,巡檢工具就是用于升級前平臺環境“健康檢查”的,有助于降低升級時的故障率。

          Part.3 業內主流升級類型

          業內主流升級類型

          熱升級泛指升級時不需要停止/中止用戶業務的升級動作,具體表現為不需要重啟虛擬機,但實現該效果有多種技術方案,主要有兩種技術路線:滾動熱升級和原地熱升級。

          滾動熱升級是現在業界主流升級方式,原地熱升級是后來業界發現了滾動熱升級的缺陷——虛擬機遷移耗時長且需占用主機額外資源,進而改進的另一種思路。主要代表有2020年KVM論壇提出的實時升級技術[1],其核心思想是通過修改QEMU和內核的代碼來將虛擬機及Guest機內部狀態和內存頁表保存到本地文件,然后通過新版本QEMU加載這些文件,讀取還原新的虛擬機從而完成升級。

          值得一提的是,2017年,深信服就已經發現了滾動熱升級的缺陷,從而提出了類似于實時升級技術的另一種原地熱升級技術:深信服原地熱升級技術,其主要方法是優化改進虛擬機熱遷移技術,對虛擬機本地拷貝,復制內存到新進程空間中,而后還原新虛擬機進行切換,此過程可以并發進行,快速迭代完成升級。因此,在原地熱升級技術上,深信服有著較為充分的技術積累與實踐經驗。

          Part.4 VMware vSphere升級

          我們以主流的VMware vSphere為例,簡要介紹下業界的滾動熱升級是如何設計的。下圖為VMware升級的主要流程步驟(以升至v6.7為例):

          VMware升級的主要流程步驟

          VMware vSphere升級流程[2]

          其中,對于ESXi主機與vCenter,是替換底層平臺代碼程序,根據官方文檔主機升級時需要檢查VIB的接受程度,根據不同程度選擇是否將主機設置為維護模式以及是否需要重啟主機[3]。

          而對于需要重啟主機的VIB升級,則需要先將該主機上的虛擬機全部遷移到其他節點,然后進行升級并重啟主機,重啟完后再回遷虛擬機到主機上,然后進行下一步的虛擬機升級??梢钥吹?,VMware升級操作繁瑣,需要不斷手動遷移虛擬機調整位置,耗時耗力。同時,遷移虛擬機意味著集群需要保留出一部分資源空間預留給遷移虛擬機,否則集群在高負載時無法完成遷移虛擬機動作,將導致無法升級集群。

          而對于虛擬機的升級,只要Guest機內部系統是Windows或Linux系統,均需要重啟Guest機系統[4],即需要用戶業務暫時中斷,這將影響用戶業務運行并且需要用戶制定停機計劃以切換業務虛擬機。

          針對上述問題與缺陷,我們介紹深信服是如何實現升級時業務不中斷的。

          Part.5 深信服原地熱升級方案

          深信服HCI的原地熱升級技術,不需要重啟物理機,不改變虛擬機運行位置和運行狀態,直接對所在主機進行升級。平臺通過服務化改造與組件解耦,以統一的API接口提供服務,在主機底層文件系統升級的過程中,只要保證各組件的API接口向下兼容且正常服務,則不會對虛擬機的運行狀態以及遷移任務產生任何影響。下圖為深信服HCI升級的主要流程:

          深信服HCI原地熱升級流程

          深信服HCI原地熱升級流程

          其中,平臺軟件的管控面升級是通過熱重啟與熱替換技術完成的,不需像VMware一樣重啟主機才能生效。而對于虛擬機進程則通過深信服的虛擬機原地熱遷移技術完成熱升級,所謂原地熱遷移其實是同存儲遷移場景下的一個特殊場景(也叫本地熱遷移),該遷移只需要內存拷貝復制而不需要遷移運行位置,而深信服對原地熱遷移進行了特殊優化,能讓虛擬機在升級場景下通過共享內存文件形式快速完成遷移本地遷移,從而提高遷移效率,以減少升級耗時。

          另一方面,深信服同樣支持滾動熱升級,其基本邏輯與VMware相差不大,但在實踐操作上有以下特點:

          • 可編排滾動路徑:滾動熱升級的過程中,可通過界面進行升級任務編排,確定各主機的升級順序、業務虛擬機遷移關機行為等,同時支持隨時暫停升級行為,等待下次業務低峰期繼續執行。

          • 全自動滾動升級:完成升級編排后,滾動升級全過程無需人為介入操作,升級流程自動執行,大大降低升級操作復雜度。

          Part.6 深信服原地熱遷移技術

          深信服虛擬機原地熱遷移是基于同存儲熱遷移實現的,同存儲熱遷移即在存儲位置不變情況下,將運行中的虛擬機進程遷移至另一個新虛擬機進程,方法是將運行時的虛擬機內存和Guest機完整復制拷貝至新進程上,以構造兩個完全一致的虛擬機進程,從而到達瞬時切換虛擬機的效果。

          基于上述方法,在本地主機上將運行時的虛擬機進程內的Guest機內存,通過共享內存文件直接共享給新進程中,大大減少內存拷貝時間,遷移性能上進一步提高。

          深信服原地熱遷移技術

          深信服同存儲熱遷移流程

          如上圖同存儲熱遷移所示,主機A上的虛擬機VM1遷移至本地的VM1’上,VM1’的虛擬機參數與VM1完全一致,同時兩者的Guest內存完全一致,虛擬化出來的模擬設備均保持一致,深信服同存儲熱遷移有以下幾個遷移階段:

          • 準備階段:平臺前置檢查以及虛擬機規格參數檢查等。

          • 預復制階段:啟動本地內存復制過程,開始拷貝復制內存到新虛擬機中,并記錄跟蹤所有內存頁。

          • 迭代復制階段:因為源虛擬機仍在運行中,所以內存頁會被不斷寫入新數據,由于前面已經記錄了所有內存頁,此時可以將變化的臟頁重新拷貝復制至新虛擬機,迭代復制過程最終收斂臟頁至一個小范圍區間。

          • 懸停切換:通過虛擬機底層指令掛起源虛擬機,此時源虛擬機會短暫性假死懸停,即downtime時間(VMware亦稱stuntime)此時間大約為100ms左右,在該時間段內虛擬化平臺會快速將所有剩余的內存臟頁拷貝至新虛擬機,最后從新虛擬機恢復啟動并解除屏蔽新虛擬機,源虛擬機關機停止,此時就完成了遷移。

          相比于同存儲熱遷移,虛擬機原地熱遷移進一步節省了拷貝內存時間,深信服通過共享內存技術直接減少Guest機的內存拷貝,而不需要像同存儲熱遷移拷貝內存,原地熱遷移只需要拷貝虛機寄存器、硬件設備等狀態數據到新進程即可完成遷移切換,這大大提高了虛機遷移效率。

          基于以上流程,深信服云平臺可以將每臺主機快速升級完畢,同時升級過程中每臺主機都可以獨立并發的一起升級,這樣不管集群規模有多大,云平臺都能夠在短時間內完成整個平臺升級,包括虛擬機的兼容性升級。同時,無需跨主機遷移虛擬機,也極大減少了網絡帶寬的消耗以及空閑資源預留。

          Part.7 與VMware升級方式對比

          深信服原地熱升級優勢在于不需要跨主機遷移虛擬機,特別是大規格虛擬機(大內存大磁盤等)不需要消耗網絡帶寬進行遷移,節省了內存復制拷貝時間,大大提高遷移效率。

          下表給出了深信服原地熱升級技術與VMware的滾動熱升級技術細節參照對比:

          與VMware升級方式對比與VMware升級方式對比

          Part.8 升級技術總結

          總體來看,業界普遍存在的升級方案往往步驟繁瑣,耗時較長,尤其在處理大型配置的虛擬機時,遷移和變更尤為困難。此外,兼容性升級通常需要中斷業務并關機,這無疑對業務運營和工作效率造成了嚴重影響。

          為了完善平臺升級方案,深信服云計算產品已支持采用滾動熱升級的方式。在升級的實際操作上,對比業內的滾動方案,深信服實現了升級路徑的編排、全自動的升級過程、支持升級暫停版本異構等高級特性,顯著降低了滾動升級過程中的操作復雜度。

          深信服云產品升級方案不僅優化了滾動熱升級,還引入了更為簡便的原地熱升級技術。原地熱升級簡化了操作步驟,縮短了升級時間,且無需重啟主機,對于大規格虛擬機來說,性能優勢尤為明顯,讓升級流程得以迅速完成,大幅減少業務維護時間,有效降低升級過程對業務運行的影響。

          本文引用內容如下:

          [1]網頁:https://blogs.oracle.com/linux/post/qemu-live-update

          [2]網頁:https://docs.vmware.com/cn/VMware-vSphere/6.7/com.vmware.esxi.upgrade.doc/GUID-7AFB6672-0B0B-4902-B254-EE6AE81993B2.html

          [3]網頁:https://docs.vmware.com/cn//VMware-vSphere/6.7/com.vmware.esxi.upgrade.doc/GUID-B21C1C99-E6D5-4719-A51C-6FE1F5B5C7EF.html

          [4]網頁:  https://docs.vmware.com/cn/VMware-vSphere/6.7/com.vmware.vsphere.vm_admin.doc/GUID-41AA8386-D1DA-4788-9718-216C62CE112A.html

          分割線

          云話技術是深信服打造的一檔云技術內容專欄,將定期為大家推送云計算相關的技術解析、場景實踐等內容,為大家深度解析深信服在云計算領域的創新能力、技術動態、場景應用及前瞻分析。

          久久在精品线影院,久久视频这里只精品亚洲,99欧美精品含羞草,欧洲精品性爽视频