制造業企業的數字化正在面臨一場變革。
業務的迅猛拓展、產業規模的快速擴張,內部信息系統覆蓋范圍及復雜程度逐步加深,制造業企業對信息系統在數據安全保障、系統穩定可用以及持續高效運行等方面,有了更高的需求。面對業務系統架構復雜、種類繁多、數據中心運維壓力大等挑戰,格力博(江蘇)股份有限公司(以下簡稱格力博)已踏上一條創新的云化轉型之路。
四大挑戰
格力博公司自2007年開始從事新能源園林機械的研發、設計、生產及銷售,是全球新能源園林機械行業的領先企業之一。隨著業務的持續發展,企業的核心競爭力正由信息化驅動向智能制造化發展。
在信息化階段,公司已經構建起了較為完善的信息系統架構,涵蓋了企業資源規劃(ERP)、辦公自動化(OA)、產品生命周期管理系統(PLM)、生產制造系統(MES)、機器人自動化系統(RPA)、BI系統等多個領域。現有業務系統均部署在私有云中,但因資源池不足、售后運維服務體驗差等問題,現有云平臺已無法滿足業務發展的需求——
IT基礎設施面臨升級挑戰
格力博打造的無人化和智能化生產,對IT基礎設施提出較高的要求。原私有云IT基礎設施條件、計算存儲網絡等資源已無法支持業務發展,原先云服務商提供的私有云數據中心面臨設備老舊性能差、版本不更新、缺乏業務系統備份方案等問題。
運維服務差,每年專業云運維服務成本高
當前私有云平臺已停止后期維護,導致平臺版本無法升級迭代,用戶目前自有運維團隊僅有3人,在應用系統層、操作系統層和云平臺層的運維方面存在明顯短板。
公有云方案難以滿足需求
作為制造業企業,格力博生產系統如WMS、MES、SRM、CAD等與本地終端和設計人員通信交互時,要求時延控制在毫秒級,這就需要云服務商既能提供常州本地就近接入的云數據中心,又能提供持續演進的云服務資源。公有云往往是集中的數據中心,與本地業務通過公網互訪時延偏高,若采用跨城裸線連接,雖可降低時延,但成本高昂,用戶難以在時延、云資源和成本之間取得平衡。
業務快速發展,需要高效獲取與自主控制云資源
公司業務擴張,短期有大量新業務急需上線,長期需要把現有私有云環境上的業務做搬遷,尤其是生產類系統如MES、WMS、APS、PDM等,需要保障現有業務穩定持續運行,還要兼顧未來升級、搬遷、災備和資源管理等工作。
托管云的方案:數據中心延伸
為了解決上述問題,格力博決定采用托管云專屬云方案建設——本地與托管云采用裸纖互聯,解決跨數據中心訪問,確保全業務系統訪問流暢;業務系統資源使用專屬可控的物理節點,保障數據主權。
面對用戶的需求,深信服的整體解決方案設計思路如下:
-
規劃設計托管云常州本地數據中心到用戶常州本地機房、托管云上的業務出口網絡訪問一律走本地數據中心出口(即云上無互聯網出口)。
-
保障業務平滑遷移到托管云,整體的遷移過程盡可能降低對業務的影響。
-
上云后業務系統的規格設計需確保對應規格能夠滿足業務系統的資源需求。
-
上云后各個業務系統的IP地址是否保持不變,確保本地終端設備無需修改IP地址即可實現訪問;上云后各業務系統網絡是否做隔離。
基于上述設計思路,深信服與格力博最終采用托管云數據中心延伸方案,即在托管云數據中心與本地機房通過兩條裸光纖二層打通,實現業務跨數據中心的訪問。
網絡方案設計
- 數據中心鏈路設計
整體網絡架構采用主備裸光纖組網接入方式,其中托管云常州數據中心與格力博本地數據中心之間通過兩條獨立裸光纖互為主備實現互聯,確保了數據傳輸的高速、穩定性、可靠性。為保障安全,托管云上不規劃互聯網出口,托管云上的業務訪問互聯網需求通過裸光纖走本地出口。
正常網絡接入下,托管云數據中心與格力博數據中心通過主鏈路(裸光纖)進行通信,訪問互聯網業務同樣走主鏈路。
當托管云數據中心與格力博數據中心之間同城容災主備鏈路其中主鏈路故障時,能通過容災主備鏈路自動切換至備鏈路,實現訪問鏈路的切換。這種自動切換機制確保了訪問鏈路的無縫切換,從而保障了業務的連續性。
- VPC網絡設計
考慮線上和線下的大二層通信,根據用戶對不同業務系統之間的隔離要求,托管云通過劃分獨立虛擬私有云(VPC),并按照不同的業務屬性分別創建了8個VLAN、8個子網:數據庫子網、MES/BI/SRM等業務系統子網。
子網之間的通信和訪問控制通過分布式防火墻(vAF)進行管理,確保了網絡的安全性和業務的隔離性。
- 內外網負載規劃
在網絡架構的規劃與管理中,為實現更高效、安全且精準的應用訪問流量分配,規劃如下策略:
針對源自公司網絡內部的訪問請求,以及來自外部網絡環境的訪問請求,分別部署獨立的虛擬應用交付(vAD)系統,以此作為應用訪問流量的負載均衡處理單元,從而確保內部訪問與外部訪問在各自獨立且適配的網絡資源分配體系下,實現穩定、流暢且安全的應用訪問體驗,有效提升整體網絡服務質量與安全性保障水平。
計算存儲資源設計
考慮業務穩定性及遷移規劃,一期遷移的資源采用6臺高性能服務器組成獨享私有云資源池,實現計算以及存儲資源的完全獨享,保障格力博業務以及數據的最大安全性及高性能。
1. 每臺服務器的配置為:
-
CPU:2*intel Gold 5220R(24core,2.2GHz)
-
內存:16*64G
-
系統盤:2*240G SSD
-
緩存盤:2*1.92T SSD
-
數據盤:8*6T SATA HDD
根據托管云最佳實踐,集群整體的可用資源為:1110vGPU,4580G 內存,134T 存儲空間。
2. 備份存儲規劃:
采用深信服3臺分布式存儲aStor-EDS1210-W,單臺存儲服務器配置為:
-
內存:2*32GB DDR4 2933
-
系統盤:2*240GB SATA SSD
-
緩存盤:2*1.92TB
-
數據盤:10*12TB
采用糾刪碼EC4+2冗余策略,使得存儲空間利用率達66.6%。
安全設計
針對網絡出入口安全防護側,部署深信服下一代防火墻vAF以構建堅實的安全防護屏障,能夠針對網絡出入口方向的流量進行全方位、多層次的深度檢測與精準防護。
針對云主機的安全防護層面,充分利用本地已購置的終端安全解決方案,通過配置策略,使托管云上云主機能夠無縫接入并復用該安全防護體系。這樣一來,無論是本地機房中的業務主機,還是托管云機房內的云主機,均能在統一的安全防護標準下運行,確保其業務防護能力保持一致性。使用本網絡與安全架構的設計方案顯著降低了用云成本。
備份設計
為應對各類潛在的數據風險與故障場景,針對部署于云端的170個云主機,構建每周全備一次,每12小時執行一次的自動化增量備份機制,以確保云主機數據的安全性與可恢復性,為業務的持續穩定運行筑牢數據防護壁壘。
遷移方案設計
新增兩條裸光纖線路用于托管云數據中心與本地機房通信,本地機房與私有云機房保持原二層裸光纖通信鏈路不變,實現業務跨數據中心的遷移,待遷移完成后把此鏈路取消。
由于本次涉及遷移的虛擬機有將近70個,因此本次業務遷移需要重點考慮以下3點:
- 分批次遷移
為避免一次性遷移所有云主機對網絡和存儲資源造成巨大壓力,導致性能下降,如網絡擁堵、存儲I/O性能受損,且出現故障時難以定位和恢復,同時考慮到業務連續性,各業務系統應用間存在復雜的依賴關系,分批次遷移有助于逐步重建依賴關系,同時減少用戶可感知的服務中斷,保障用戶體驗,合理分配目標環境資源,本次遷移分5批次遷移。
- 業務系統遷移過程中降低整體的停機時間
本次遷移按照用戶應用負責人不同,將業務的遷移分為5個批次進行遷移。每個批次的遷移數據傳輸過程不影響業務的正常運行,只在業務遷移的割接期間需要業務停機,每批次遷移業務停機時間在30分鐘以內。
針對業務遷移停機時間的問題,本次遷移主要采用兩種方式進行,停機時間保障在30分鐘以內,停機時間和用戶商定晚上和周末的時間,盡可能降低對業務的影響。
- 遷移失敗問題的處理
遷移過程失敗的問題,深信服技術團隊會針對問題進行記錄并排列優先級,及時協調相關資源解決以保障遷移順利進行。以下是遷移失敗過程記錄的問題及解決方案:
業務運行情況
目前,用戶側云主機都正穩定運行。
用戶價值
本地數據中心延伸方案:專屬資源,持續演進
通過高可靠的裸光纖從用戶本地機房接入到托管云延伸數據中心節點,實現云端專屬資源的同時數據留存本地的同時獲得持續演進的云服務。
云上業務安全復用本地已有的安全資產,云上業務安全防護能力與本地一致,安全策略自動遷移跟隨。
在進一步降低運維成本的同時,建立一套高效的云上容災體系,以增強用戶對潛在業務中斷和數據丟失的的抵御能力。
就近接入 滿足數據留存本地的需求
通過托管云常州本地機房實現就近接入,滿足格力博資源專屬及低延時訪問需求,保障各類核心業務系統的穩定運行。
高級版VPC代維服務 釋放IT運維人員的壓力
通過專享服務計劃,日常的創建虛擬機、配置安全策略、修改云主機配置、云資源優化、云資產每季度的巡檢等都由管家來執行,解決用戶運維人員不足的問題。同時,線上管家會以專業的技術能力,在用戶進行IT規劃時給出專業建議。真正釋放格力博運維人員精力,讓IT人員可更多地聚焦在業務創新上。
更少的投入 更全面的應用與系統層運維服務
深信服為用戶提供應用層和OS層的運維服務,用戶無需額外投入運維團隊建設,大幅降低人力與技術投入成本,從而實現資源的最大化利用和業務的快速增長。
各行業數字化轉型面臨不同難題,關鍵在于找到貼合自身需求的方案。深信服托管云從實際業務場景出發,圍繞不同用戶的痛點規劃針對性的方案,解決云化升級中的復雜問題,以創新能力助力用戶業務快速發展。