實踐背景
國金證券股份有限公司(以下簡稱“國金證券”)前身為成都證券,經中國人民銀行批準,成立于1990年12月,是上證380指數、中證500指數、MSCI新興市場指數成份股,是一家資產質量優良、專業團隊精干、創新能力突出的上市證券公司。
隨著國家對金融行業技術創新的重視,并結合公司對自身業務穩定性、用戶數據安全的升級需求,國金證券正積極開展業務系統的數字化創新,同時也在尋求對基礎設施中國外原有虛擬化平臺的遷移升級方案。
基礎架構先行,選型私有云平臺方案
以業務穩定性和用戶數據存儲使用的安全性、可靠性為重點,國金證券大力推進基礎架構平臺建設的實踐。
整體建設框架
按照1+2+3自主創新技術框架推進:
-
1個技術底座
-
2個賦能中臺
-
3類業務系統
國產技術棧選型
私有云平臺選型思路
在創新云平臺的選型階段,國金證券面臨三種不同路線的選擇:
(1)以深信服為代表,基于超融合為底座構建私有云平臺:
-
高效輕量化設計:平臺自身對硬件資源消耗低,在中小規模集群的應用場景中可實現資源的高效利用。
-
優異的資源池能力:在計算虛擬化和存儲虛擬化方面表現出色,滿足了對性能、穩定性、可靠性和可用性的高標準要求。
-
強大的開放性:在云管理層與外部系統的無縫對接,以及在虛擬化層與分布式存儲的硬件兼容性方面,都具有良好的開放性。
(2)以公有云廠商為代表的全棧云私有化部署方案:
主要特點是大而全。PaaS層功能豐富,但存在建設投入過重、資源消耗高、運維復雜度高等問題,不適合中小規模用戶的私有云建設。
基于OpenStack的商用化私有云架構:
云管能力豐富,但在計算虛擬化、存儲虛擬化等對于性能、穩定性、可靠性、可用性能力要求高的技術領域表現欠佳。
結合實際需求,并基于以下考量,國金證券最終決定采用深信服超融合作為構建私有云技術架構的基石——
-
規模適配:國金證券預計的建設規模屬于中小型,超融合架構在有效地滿足公司規模需求的同時,可保持資源的高效利用,并幫助簡化運維流程。
-
功能對齊:私有云的建設目標是與國金證券現有的監控、運維和流程管理平臺無縫對接。深信服云管平臺在與外部系統的對接上具備良好的開放性,可保障IT環境協調統一。
-
穩定可靠:私有云平臺將逐步擴展至承載核心系統,對平臺的穩定性、可靠性和可用性提出了更高的要求。深信服超融合在各項故障場景的測試中均有優異的性能表現,可保障業務連續性和數據安全性,以下為對典型場景的測試及實測報告:
△超融合緩存盤故障情況下,虛擬機性能基本無影響,數秒后快速平穩恢復
△超融合主控節點掉電情況下,集群內其他節點虛擬機運行基本無影響
私有云平臺從OA到核心業務承載逐步進行升級
國金證券率先從辦公業務切入,逐步深入到一般業務系統、核心業務系統。當前已完成OA系統、郵件系統、運維自動化系統、投行質量評價系統以及關鍵行情分發系統等數十套系統升級,實現了業務流程的全面優化和效能提升。
接下來我們以核心業務系統“行情分發平臺”為例闡述一下整個升級過程。
核心業務系統承載實踐:行情分發平臺
背景與難點
(1)系統運維工作復雜繁重
在業務系統領域,國金證券的行情分發系統扮演著至關重要的角色,它不僅連接著外部交易所,還與公司內部的關鍵業務子系統緊密相連。然而,這一系統自投入使用以來已歷經多年,其數據傳輸工具依賴于三家不同品牌的軟件,分別由運維部門的三個獨立小組維護。隨著證券市場業務種類的不斷擴展,運維工作的復雜性也隨之增長。
例如,為了滿足行情分發的需求,一臺行情中繼服務器可能需要同時運行多個甚至超過十個不同的傳輸工具客戶端,如果遇到交易所行情源發生變更,可能需要對多達三種不同的傳輸工具進行同步升級,這無疑給運維工作帶來巨大的挑戰。
(2)原有基礎架構無法支撐未來業務發展
在基礎架構方面,國金證券現有的環境包含原有國外虛擬化平臺,現都面臨技術支持不足和市場政策變化的雙重問題。國金證券認為后續可以采用統一的超融合架構進行管理,然而,考慮到國內廠商的技術能力參差不齊,系統的可靠性和性能仍需經過嚴格的驗證。
具體需求
國金證券的業務和基礎架構團隊經過深入分析,從自主可控性、業務與技術實施的可行性、資源配置、潛在風險以及業務應急預案等多個角度進行了細致的考量,并最終明確了項目的建設目標。
- 項目定級為等保三級,類型屬于直接交易相關的系統,信息系統分類級別設定為6級。在數據備份方面,項目將達到一級能力,故障應對能力為二級,具體要求為恢復時間目標(RTO)小于5分鐘,恢復點目標(RPO)小于30秒。
- 系統設計容量和性能指標經過嚴格評估,確保在控制機最大用戶數設為200的并發條件下,將響應時間控制在300~500毫秒,同時確保行情數據的轉發處理不受影響。
- 在基礎設施方面,采用市場上廣泛認可的國產芯片,底層軟件則選用國產的達夢數據庫和操作系統。同時要求提供相應的芯片兼容性證明報告,以保障整個系統的安全可靠運行。
技術方案實施
經過技術評估和驗證,國金證券決定采用深信服超融合作為其基礎架構的核心支撐。同時,選用國內自主研發的傳輸工具廠商,以遷移升級目前所使用的國外產品。所采用的行情傳輸軟件基于分層架構設計,涵蓋了基礎設施層、服務層、管理客戶端、控制臺、日志中心以及授權控制等關鍵組件,可實現行業認可的平穩可靠運行。
行情傳輸軟件功能架構
行情傳輸軟件部署架構
為確保升級過程中行情數據的安全性和可靠性,對接深交所和北交所的主備虛擬機采用節點互斥保障可靠性,同時國金證券建立了本地與異地雙重備份,對于本地備份,每日的行情文件會被采集并上傳至上證通數據歸集服務器,最終保存至上海磁帶庫。而異地備份則通過上海磁帶庫將備份數據同步至成都西信磁帶庫實現,實現秒級RPO要求。
此外,平臺在主數據中心到交易所的連接線路、行情網關、分發服務等關鍵環節均實現了多節點部署,確保在任一節點或線路出現故障時,能夠迅速切換至其他節點,以維持對外服務的連續性。同時在異地數據中心配置災備系統,以應對可能的緊急情況,實現分鐘級RTO要求。
在基礎架構的升級上,采用深信服基于超融合架構的輕量級云解決方案。充分發揮超融合架構在靈活性、輕量化、擴展性以及兼容性方面的顯著優勢以外,國金證券也看中深信服在底層穩定性和性能提升上的持續投入,可為業務的持續增長和未來發展需求提供長期保障。
最終,國金證券基于深信服超融合,成功地將原有國外虛擬化平臺進行遷移,并升級為全新的超融合架構。通過深信服的SCMT遷移工具,國金證券已順利遷移超過100個業務虛擬機,保障業務的平滑過渡和持續運行。
完成系統升級后,國金證券選擇多個應用廠商及自研產品,對相關區域節點的延時、CPU使用率、內存占用以及流量壓縮比等關鍵性能指標進行全面的承載測試。測試數據表明,經過升級的行情分發平臺,基于深信服超融合的底層架構支撐,性能表現優異,完全滿足日常業務運營的需求。
應用系統測試結果
總結
通過本次成功實踐,國金證券在基礎設施和業務系統上的數字化升級中收獲顯著成效——
解放運維壓力
深信服超融合提供多資源池的統一管理能力,為日常運維管理提供了強大的支持。同時,依賴于超融合完善的高可靠機制,日常運行中因服務器硬件問題帶來業務影響的運維壓力顯著降低。
升級后的統一行情分發平臺,徹底解決同時維護和更新多個傳輸工具的復雜工作,極大地減輕了用戶的運維負擔,讓運維團隊得以從繁瑣的運維工作中解放出來,轉而投入到與業務發展更為緊密的系統支持工作中。
基礎架構升級
國金證券借助深信服超融合和私有云平臺,率先將關鍵業務行情分發系統融入自主創新環境中,實現轉型升級。在這個過程中,深信服與國金證券一同推動生態廠商之間的協作,解決兼容性和性能問題,為金融行業的數字化升級提供優秀實踐經驗。
-
在性能優化層面:業界的ARM芯片的單核計算能力與X86相比仍有一定差距,國金證券聯合深信服針對ARM多核、多NUMA的情況進行了性能調優,采用自研的NUMA智能調度技術,以虛擬機為單位在多個NUMA內進行調度平衡,盡量減少跨NUMA的遠地內存訪問,提高服務器集群整體性能。在A/B兩個應用廠商的承載測試中,上海區域時延均達到1ms以下,自研產品的處理時延也顯著降低。
-
在可靠性升級上:深信服超融合從硬件、平臺、業務和數據四個層面來保證可靠性,特別是在數據可靠方面,通過雙活容災方案,包括雙活和主備等多種方案,保障數據安全與業務的連續性。
-
在安全升級方面:深信超融合平臺的內建安全能力,從業務上線之初就對資產進行實時監控,并通過多維度的風險展示,提供了包括病毒掃描、系統防護、勒索軟件防護等在內的全面安全防護措施,確保了業務運行的安全性和穩定性。
逐步實現全業務系統轉型升級
截至目前,國金證券已經聯合深信服在兩地五DC部署全新的超融合集群,涵蓋了包括鯤鵬ARM和海光C86芯片在內的16+集群,為數十套業務系統提供穩定支撐,逐步實現了全業務系統的轉型升級。
技術的發展與市場的變化,正影響著金融行業的數字化升級路徑,國金證券積極擁抱變化,運用最新國產自研技術優化并升級IT基礎設施,為客戶提供更加安全、高效、穩定的金融服務。深信服也將持續打磨技術,進行產品創新,為更多金融行業用戶提供更有效的平滑遷移及轉型升級解決方案。