超融合是什么,華為超融合是什么?

華為超融合是什么是以虛擬化為核心,將計算、存儲、網絡等虛擬資源融合到一臺標準x86服務器中形成基準架構單元,并通過網絡聚合多套單元設備 , 實現模塊化的無縫橫向擴展 , 形成統一的資源池的創新IT架構 。

超融合是什么,華為超融合是什么?

文章插圖
超融合的本質是什么首先,關于什么是超融合
我們可以參考維基百科中的如下定義:超融合基礎架構(hyper-converged infrastructure)是一個軟件定義的 IT 基礎架構,它可虛擬化常見“硬件定義”系統的所有元素 。HCI 包含的最小集合是:虛擬化計算(hypervisor),虛擬存儲(SDS)和虛擬網絡 。HCI 通常運行在標準商用服務器之上 。
超融合架構出現的原因,是傳統存儲解決不了現在企業數據中心的問題 。據麥肯錫研究顯示 , 全球的 IT 數據每年在以 40% 的速度增加中 。數據正在逐步影響商業,企業通過數據的分析來做決策與管理 。完成快速的分析決策和管理,就需要借助強大的數據中心 。下圖為傳統 SAN 存儲:
超融合是什么,華為超融合是什么?

文章插圖
但是 , 光靠越來越快、核數越來越多的 CPU 是不夠的,瓶頸在于傳統存儲的硬盤太慢了,CPU 大部分計算能力都空閑或者說在等待存儲數據傳輸過來 。傳統存儲容量和性能不具備和計算能力匹配的可擴展性 , 不能滿足企業進行數據訪問的需求 。
超融合是什么,華為超融合是什么?

文章插圖
【超融合是什么,華為超融合是什么?】這個問題并不是現在才有 。Google 很早遇到這個問題 。那么 Google 是如何做的呢?
作為一個給全世界互聯網網民提供數據檢索的企業,Google 考慮過 EMC、IBM,還有當年的 SUN 存儲產品,但是都解決不了它的問題 。無論是容量還是性能 , 這些公司的產品都無法滿足 Google 的規模需求 。于是 Google 只能自己建立一個適合自己的數據搜索的存儲結構了 。
Google 優秀的計算機科學家們,打破了傳統的存儲思維,利用服務器的本地硬盤和軟件構建了一個容量和性能不斷可擴展的分布式文件系統,并在其上構建了其搜索和分析的計算引擎:
不用把數據從存儲端取出來,然后通過網絡傳輸到計算端,而是將計算直接分發到存儲上運行,將 “計算” 作為傳輸單元進行傳輸,這樣大量的存儲數據都是本地訪問 , 不需要再跨網絡上傳輸了,自然訪問很快 。于是乎,自然而然地,“計算” 和 “存儲” 運行(“融合”)在了一個服務器上,這里也看到超融合架構的一個優勢就是,本地訪問數據,不必跨網絡 。
超融合是什么,華為超融合是什么?

文章插圖
現代企業的數據量越來越大,應用越來越多,他們開始面臨當年 Google 遇到的問題 , CIO 要考慮怎么更高效的構建自己的計算和存儲的基礎架構,來滿足應用的數據訪問需求 。
虛擬化為更容易的管理應用而生 , 它解決了 CPU、內存資源閑置的問題 。但隨著虛擬化的大規模應用,虛擬機越來越多,虛擬機在傳統存儲上運行卻越來越慢了 ?!奥?造成 “體驗差”,“體驗差” 成為了限制虛擬化應用的最大的瓶頸 。這里面的最重要原因自然是,存儲的 I/O 性能不夠,大量的虛擬機和容器同時運行,I/O 的混合 , 使得隨機讀寫急劇增加,傳統存儲的結構無法承受大量的隨機 I/O,超融合恰恰是為了解決這個問題,才被帶到了虛擬化和容器領域 。同時,業內也存在不同的解決 I/O 問題的方法 , 我們先嘗試分析下其他的解決方法:
解決方法一:在存儲設備采用 SSD 做 Cache , 加速 I/O 。這在一定的規模下可能有效,但是存儲設備的 SSD Cache 通常比例較?。?不足 5% 的容量比的情況下,自然滿足不了用戶的熱數據的緩存需求 。另外 , 仍然無法隨需擴展 , 所有的數據仍然要從集中的存儲控制器流出,這個集中的 “收費站” 勢必堵塞 “高速公路” 。
解決方法二:使用服務器側 SSD 做 Cache,加速 I/O 。這種類似的解決方案,通常缺乏高可靠性軟件的支撐 , 服務器端的 Cache 如果用做寫 Cache,存在單點失效的問題,需要在多個服務器的 Cache 設備上,做副本來提供可靠性 , 可以說這是一個閹割版的超融合架構,將 Cache 放到服務器端,仍然使用傳統存儲,當 Cache 滿 , 需要被寫回傳統存儲的時候,仍然被傳統存儲的 “控制器” 限制整體性能 。
我們看到,上面的兩種方案都是受限于傳統存儲的結構 。超融合存儲則不一樣,通過完全去掉傳統存儲,利用分布式文件系統來提供 “不可限量” 的性能和容量 , 在這個基礎上,再通過 Cache 進行加速,甚至全部使用閃存(全閃存產品)來構建都是自然而然 , 不被限制了 。
因此,超融合架構不是為了讓單臺服務器的存儲飛快,而是為了讓每增加一臺服務器,存儲的性能就有線性的提升,這樣的存儲結構才不限制企業業務的運行,并保證業務的可靠性 。
超融合是什么,華為超融合是什么?

文章插圖
正因為這種擴展性很好的共享存儲,使得整個 Google 的業務得以順暢地運轉 。SmartX 在做的就是這樣的更好的、更穩定的基礎服務 。
另外,超融合近幾年得以快速發展的原因,這要歸功于硬件設備 。CPU 核數越來越多,服務器的內存容量越來越大 , SSD 設備和網絡互聯網設備越來越快,這意味著:
服務器的資源除了運行業務以外 , 仍然可以預留出來足夠的CPU,內存資源來運行存儲軟件 。將存儲軟件和業務運行到一塊,既減少了設備量,減少了電力使用,本地讀取也提高了 I/O 的存取效率 。這在幾年前是做不到的 , 因為 CPU 和內存太有限了 。
網絡互聯越來越快 , 無論是萬兆,40Gb 以太網 , 還是 Infiniband(無限寬帶技術),使得我們的軟件能夠將獨立的存儲設備進行互連,通過分布式文件系統形成共享的存儲池,供上層應用使用 。
如果說 SSD 等硬件廠商讓單個存儲設備跑的更快,我們的軟件的意義在于,讓超大量的這些存儲設備,一起工作 , 提供無止境的整體性能和容量 。

    推薦閱讀