隨著近幾年技術的演進和實踐,越來越多的客戶進一步認識了超融合架構,并應用在數據中心基礎設施建設中。然而,當方案涉及核心生產業務、大并發應用的承載時,IT負責人或多或少產生了一些顧慮:即使產品穩定性得到了驗證,但是性能真的能媲美中高端FC-SAN么?能保障業務在大并發業務時的高效訪問么?
早在2016年,深信服就提出了“關鍵業務上云”的理念,并且陸續提供了Oracle RAC、SQL Server Alwayson承載方案,以及高性能存儲方案。
大量客戶通過深信服超融合架構方案,大幅提升了相關業務的訪問速度。
- 勁霸男裝的大數據分析由10小時縮短到4小時
- 大族激光20小時的業務結算縮短到8小時
- 濟南二院減少75%的HIS訪問時間
- 貴州理工學院業務上線從幾個月縮短至幾星期
2018年底,深信服發布的超融合新版本再次突破分布式存儲性能瓶頸。在中配CPU、混合磁盤部署(SSD+HDD)的常見使用環境下,3節點超融合一體機存儲性能突破44W IOPS。
▲ 客戶場景使用的普通混合磁盤一體機
▲4KB、8KB性能測試
超融合架構存儲性能是隨著節點數量增加而線性增長的,當單卷配置16節點時,性能將輕松突破200W IOPS。對于部分客戶期望使用全閃存環境,性能可以進一步提升,在全閃存環境下每節點性能將高達20W IOPS,單卷性能可以突破300W IOPS的極限。
到底新版本具備了哪些特性保障了性能的大幅提升?
高效的分層算法
擁有自主專利的I/O分層技術,能夠根據業務讀寫的切換自適應地分配到讀緩存和寫緩存空間去,靈活地應對讀寫兩種場景的變換。
例如當數據持續寫入量較大時,整個分層都可以申請空間用于寫緩沖,同理,當數據持續讀取量較大時,整個分層都可以申請空間用于讀緩沖,可以更好地滿足業務讀寫的彈性需求。
▲aSAN緩存系統中SSD的各個分區及大小
分層的先進性
-
數據一次寫入,開銷更小。數據寫入到分層后,可以直接用于數據的下次讀取,即使數據回寫到容量層HDD后,仍然駐留在SSD的分層中。
-
SSD的效能高。首先整個分層空間都是可以用于讀緩沖的,并且當數據寫入量較大時,整個分層都可以申請空間用于寫緩沖,可以更好地滿足業務讀寫的彈性需求。
-
可以抵抗掃描讀。對于掃描性的讀操作,雖然其被訪問的時間上是最近的,但其被訪問的次數僅有一次,因此數據熱度并不是最高的,不會擠占熱度更高的數據。
特色的自適應條帶化和I/O本地化技術
深信服分布式存儲采用一種全新的aRaid 2.0技術,aRaid 2.0在硬盤底層進行塊虛擬化,在上層進行策略管理調度,能夠實現條帶數據靈活的分布,支持文件級別的條帶化和自適應的條帶化,最終實現單業務全局最優的并發性能,性能可接近集群的物理極限。
I/O本地化技術
以四節點、雙副本為例,對于某個虛擬機而言,其上的數據其中一個副本會聚合在一臺主機上(如下圖的主機A),稱之為聚合副本;另外一個副本會分散在最多三臺主機上(如下圖的主機B、C、D),稱之為散列副本。
▲數據條帶化、分片、復制后的分布情況
虛擬機優先運行在聚合副本所在的主機上,以達到數據本地化的效果。虛擬機對數據進行訪問時,可以直接從聚合副本中讀取,避免跨存儲網絡對數據進行讀取,以此可提高數據讀取的吞吐性能,突破網絡帶寬的瓶頸。
I/O塊自適應分布
-
主機內優先跨磁盤組分布策略 – 利用更多的SSD
無論是聚合副本還是散列副本,其分片組內的分片都會在主機內優先跨磁盤組分布。這是因為每個磁盤組都有一塊SSD可為其磁盤組下的HDD提供緩存加速的能力,盡可能跨越多個磁盤組,意味著對條帶組內的數據進行并發讀寫時,可以利用到更多的SSD的緩存加速能力,從而提升性能。
-
磁盤組內優先跨磁盤分布策略 – 利用更多的HDD
同一個分片組內的分片落入到同一個磁盤組時,會在磁盤組盡可能地跨磁盤進行分布。如上圖所示,主機A的分片分布情況,同一個分片組內的分片盡可能保證不會落到同一塊物理磁盤上。這是由于機械硬盤的隨機I/O性能較差,為了避免對一個條帶組內的數據塊進行并發讀寫時對機械硬盤產生隨機的I/O。
I/O無鎖化及I/O低開銷
深信服虛擬存儲架構采用自研的流水線技術,縮短關鍵I/O路徑,結合協程和異步I/O技術自由調度減少阻塞,實現I/O無鎖化。隨著I/O深度的增大,即并發度的增加,I/O性能可以保持比例增加,提升存儲框架性能。流水線技術的實現方式是,把整個I/O流程切分成若干個步驟,每個步驟由一個固定的線程來完成,去掉加鎖的環節。這工業生產的流水線作業類似,一個產品的生產過程劃分成若干個步驟,每個工人只負責其中一個步驟,整個生產過程構成一個流水線,每個工人完成自己的步驟后,通過流水線交給下一個工人完成下一個生產步驟。
正是對于存儲算法和機制的不斷優化,深信服超融合存儲也在不斷承載,深信服規劃在2020年,3節點即可突破100W IOPS性能,相信在未來深信服云計算可以給客戶的核心生產業務提供更高性能的服務。