複製鏈接
請複製以下鏈接發送給好友

集羣存儲

鎖定
集羣存儲是將多台存儲設備中的存儲空間聚合成一個能夠給應用服務器提供統一訪問接口和管理界面的存儲池,應用可以通過該訪問接口透明地訪問和利用所有存儲設備上的磁盤,可以充分發揮存儲設備的性能和磁盤利用率。數據將會按照一定的規則從多台存儲設備上存儲和讀取,以獲得更高的併發訪問性能。 [1] 
中文名
集羣存儲
外文名
Cluster storage
所屬學科
計算機學科
定    義
將多台存儲設備中的存儲空間聚合成能夠給應用服務器提供統一訪問接口和管理界面的存儲池

集羣存儲定義

集羣存儲是指:由若干個“通用存儲設備”組成的用於存儲的集羣,組成集羣存儲的每個存儲系統的性能和容量均可通過“集羣”的方式得以疊加和擴展。
傳統的存儲系統由於受到其物理組成(例如:控制器性能,總線性能,磁盤驅動器的數量,所連接服務器的數量,內存大小,NAS頭的性能等)的限制,以及功能上的侷限(例如:支持文件系統的容量,元數據和數據處理通路的耦合,快照或複製的數量等),造成了存儲系統瓶頸的出現。
一旦遇到存儲系統的瓶頸,就會有兩種選擇:一是:採用硬件更加強大的單個存儲系統;二是:採用若干個普通性能的存儲系統來組成“存儲的集羣”。“集羣”作為一項已被廣泛使用的體系結構,如果採用到存儲上組成“集羣存儲”,就可提供按比例增加的存儲資源的性能、容量、可靠性及可用性,突破了單機設備的種種限制。

集羣存儲誕生

集羣存儲是有別於傳統的SAN和NAS的一種新的存儲架構。傳統的SAN與NAS分別提供的是數據塊與文件兩個不同級別的存儲架構,而集羣存儲是主要面向文件級別的存儲系統。因此,也常常被稱為集羣NAS。
SAN系統具有很高的性能,但是構建和維護起來很複雜。由於數據塊和網絡需求的原因,SAN系統也很難擴容。NAS系統的構建和維護雖然比較簡單,但由於其聚合設備(又稱為NAS頭)是其架構上的瓶頸,造成其性能很有限。集羣存儲集中了SAN和NAS的優點,且具備它們不具有的優點。在大多數使用集羣存儲的案例中,隨着存儲系統的擴容,性能也隨之提升,理論上,一個大的集羣存儲的性能往往勝過一個SAN系統,但是價格卻比SAN更加具有優勢。集羣存儲和NAS的概念是在文件系統層面上的,而SAN是在LUN層面上的,集羣存儲可以利用SAN環境實現。因此,集羣存儲與SAN解決的問題不同。如果一定要比較這兩者的優缺點的話,可以説,SAN做到的是多個服務器節點可以同時看到SAN環境中的同一個LUN,還不能做到多服務器節點間的文件級共享。集羣存儲在性能、可靠性及擴展性等多個方面都遠遠優於傳統的NAS。 [2] 

集羣存儲主要特點

1. 開放式架構(高擴展性)
它針對集羣存儲內部構成元素而言。一般集羣存儲應該包括存儲節點、前端網絡、後端網絡等三個構成元素,每個元素都可以非常容易地採用業界最新技術而不用改變集羣存儲的架構,且擴展起來非常方便,像搭積木一樣進行存儲的擴展。特別是對於那些對數據增長趨勢較難預測的用户,可以先購買一部分存儲,當有需求的時候,隨時添加,而不會影響現有存儲的使用。
2. 分佈式操作系統
這是集羣存儲的靈魂所在。所有對集羣存儲的操作都經由分佈式操作系統統一調度和分發,分散到集羣存儲各個存儲節點上完成。使用分佈式操作系統帶來的好處是各節點之間沒有任何區別,沒有主次、功能上的區別,所有存儲節點功能完全一致,這樣才能真正做到性能最優。
3. 統一命名空間
統一命名空間在很多廠家的存儲概念中都出現過。在集羣存儲中,統一命名空間強調的是同一個文件系統下的統一命名空間。它同樣可以支持上PB級別的存儲空間。如果是通過將若干有空間上限的卷掛載到某一個根目錄的方式來達到統一命名空間,其效率和出現存儲熱點時的性能將會大大低於把上PB級別的存儲空間置於同一個文件系統下管理的統一命名空間。
4. 易管理性
目前存儲業界的管理方式都是通過各廠商的管理工具,或通過Web界面進行管理和配置,往往客户端還需要安裝相關軟件才能訪問到存儲上的空間。隨着需要管理的存儲空間逐漸增大,管理存儲的複雜度和管理人員的數量也將會隨之增加。而集羣存儲應該提供一種集中的、簡便易用的管理方式,對客户端沒有任何影響,採用業界標準的訪問協議(比如NFS,CIFS)訪問集羣存儲。
集羣存儲通過分佈式操作系統的作用,會在前端和後端都實現負載均衡。前端訪問集羣存儲的操作,通過幾種負載均衡策略,將訪問分散到集羣存儲的各個存儲節點上。後端訪問數據,通過開放式的架構和後端網絡,數據會分佈在所有節點上進行存放和讀取。
6. 高性能
關於高性能領域,目前對集羣存儲的討論還僅侷限在高帶寬、高併發訪問的應用模式下。毫無疑問,集羣存儲對於該類應用可以提供比傳統存儲架構更優的性能。但目前應用除了高帶寬、高併發訪問類的之外,還有高IOPS、隨機訪問、小文件訪問以及備份歸檔等其他類的應用,集羣存儲應該在以上領域同樣提供高性能的解決方案。

集羣存儲分類

塊級集羣存儲系統
IBM XIV集羣存儲系統
3PAR Inserv-T800集羣存儲系統
EMC Symmetrix V-MAX集羣存儲系統
Dell EqualLogic 虛擬化存儲系統
文件級集羣存儲系統
HP Ibrix集羣存儲系統
華賽 N8500集羣NAS系統
中科院計算所 BWStor 藍鯨集羣存儲系統
龍存科技 LoongStore 集羣存儲系統
北京初志 CZSS 集羣存儲系統
昆騰 Stornext集羣存儲
Panasas 集羣存儲系統
EMC Isilon 集羣存儲系統
聯創信安 PanaStor集羣存儲系統

集羣存儲優勢

傳統的SAN與NAS分別提供的是數據塊與文件兩個不同級別的存儲服務,集羣存儲也分為提供數據塊與文件兩個不同級別存儲服務的集羣存儲系統
集羣存儲的優勢主要體現在提高並行或分區I/O的整體性能,特別是工作流、讀密集型以及大型文件的訪問,通過採用更低成本的服務器來降低整體成本。
SAN系統具有很高的性能,但是構建和維護起來很複雜。由於數據塊和網絡需求的原因,SAN系統也很難擴容。NAS系統的構建和維護雖然比較簡單,但是由於其聚合設備(又叫做NAS頭)是其架構上的瓶頸,造成其性能很有限。集羣存儲提供了SAN和NAS結構的優點。在大多數使用集羣存儲的案例中,隨着存儲系統的擴容,性能也隨之提升。一個大的集羣存儲的性能往往勝過一個SAN系統,但是價格也會更高。集羣存儲系統像NAS系統一樣易於構建、操作和擴容。大多數集羣存儲系統沒有傳統NAS系統的固有瓶頸。
集羣存儲有兩種實現方式:一種是硬件基礎架構加上軟件,典型代表是SAN架構+IBM GPFS;另一種是專用集羣存儲,典型代表是Isilon、NetApp GX以及Panasas,其中NetApp GX是構建在NAS基礎架構之上的,但是通過操作系統實現集羣存儲。從這個角度講,集羣存儲與SAN或NAS不存在競爭關係,是實現不同存儲需求的解決方案。”
集羣存儲和NAS的概念是在文件系統層面上的,而SAN是在LUN層面上的,集羣存儲可以利用SAN環境實現。因此,集羣存儲與SAN解決的問題不同。如果一定要比較這兩者的優缺點的話,可以説SAN做到的是多個服務器節點可以同時看到SAN環境中的同一個LUN,還不能做到多服務器節點間的文件級共享。
集羣存儲在性能、可靠性及擴展性等多個方面都遠遠優於 NAS。
參考資料