複製鏈接
請複製以下鏈接發送給好友

分佈式存儲

鎖定
分佈式存儲是一種數據存儲技術,通過網絡使用企業中的每台機器上的磁盤空間,並將這些分散的存儲資源構成一個虛擬的存儲設備,數據分散的存儲在企業的各個角落。
中文名
分佈式存儲
外文名
Distributed storage
含    義
一種數據存儲技術
途    徑
網絡

分佈式存儲分佈式存儲系統

分佈式存儲系統,是將數據分散存儲在多台獨立的設備上。傳統的網絡存儲系統採用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分佈式網絡存儲系統採用可擴展的系統結構,利用多台存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。 [1] 

分佈式存儲關鍵技術

分佈式存儲元數據管理

大數據環境下,元數據的體量也非常大,元數據的存取性能是整個分佈式文件系統性能的關鍵。常見的元數據管理可以分為集中式和分佈式元數據管理架構。集中式元數據管理架構採用單一的元數據服務器,實現簡單.但是存在單點故障等問題。分佈式元數據管理架構則將元數據分散在多個結點上.進而解決了元數據服務器的性能瓶頸等問題.並提高了元數據管理架構的可擴展性,但實現較為複雜,並引入了元數據一致性的問題。另外,還有一種無元數據服務器的分佈式架構,通過在線算法組織數據,不需要專用的元數據服務器。但是該架構對數據一致性的保障很困難.實現較為複雜。文件目錄遍歷操作效率低下,並且缺乏文件系統全局監控管理功能。

分佈式存儲系統彈性擴展技術

在大數據環境下,數據規模和複雜度的增加往往非常迅速,對系統的擴展性能要求較高。實現存儲系統的高可擴展性首先要解決兩個方面的重要問題,包含元數據的分配和數據的透明遷移。元數據的分配主要通過靜態子樹劃分技術實現,後者則側重數據遷移算法的優化。此外,大數據存儲體系規模龐大.結點失效率高,因此還需要完成一定的自適應管理功能。系統必須能夠根據數據量和計算的工作量估算所需要的結點個數,並動態地將數據在結點間遷移。以實現負載均衡;同時.結點失效時,數據必須可以通過副本等機制進行恢復,不能對上層應用產生影響。

分佈式存儲存儲層級內的優化技術

構建存儲系統時.需要基於成本和性能來考慮,因此存儲系統通常採用多層不同性價比的存儲器件組成存儲層次結構。大數據的規模大,因此構建高效合理的存儲層次結構,可以在保證系統性能的前提下,降低系統能耗和構建成本,利用數據訪問局部性原理.可以從兩個方面對存儲層次結構進行優化。從提高性能的角度,可以通過分析應用特徵,識別熱點數據並對其進行緩存或預取,通過高效的緩存預取算法和合理的緩存容量配比,以提高訪問性能。從降低成本的角度,採用信息生命週期管理方法,將訪問頻率低的冷數據遷移到低速廉價存儲設備上,可以在小幅犧牲系統整體性能的基礎上,大幅降低系統的構建成本和能耗。

分佈式存儲針對應用和負載的存儲優化技術

傳統數據存儲模型需要支持儘可能多的應用,因此需要具備較好的通用性。大數據具有大規模、高動態及快速處理等特性,通用的數據存儲模型通常並不是最能提高應用性能的模型.而大數據存儲系統對上層應用性能的關注遠遠超過對通用性的追求。針對應用和負載來優化存儲,就是將數據存儲與應用耦合。簡化或擴展分佈式文件系統的功能,根據特定應用、特定負載、特定的計算模型對文件系統進行定製和深度優化,使應用達到最佳性能。這類優化技術在谷歌、Facebook等互聯網公司的內部存儲系統上,管理超過千萬億字節級別的大數據,能夠達到非常高的性能。 [2] 

分佈式存儲考慮因素

分佈式存儲一致性

分佈式存儲系統需要使用多台服務器共同存儲數據,而隨着服務器數量的增加,服務器出現故障的概率也在不斷增加。為了保證在有服務器出現故障的情況下系統仍然可用。一般做法是把一個數據分成多份存儲在不同的服務器中。但是由於故障和並行存儲等情況的存在,同一個數據的多個副本之間可能存在不一致的情況。這裏稱保證多個副本的數據完全一致的性質為一致性。

分佈式存儲可用性

分佈式存儲系統需要多台服務器同時工作。當服務器數量增多時,其中的一些服務器出現故障是在所難免的。我們希望這樣的情況不會對整個系統造成太大的影響。在系統中的一部分節點出現故障之後,系統的整體不影響客服端的讀/寫請求稱為可用性。

分佈式存儲分區容錯性

分佈式存儲系統中的多台服務器通過網絡進行連接。但是我們無法保證網絡是一直通暢的,分佈式系統需要具有一定的容錯性來處理網絡故障帶來的問題。一個令人滿意的情況是,當一個網絡因為故障而分解為多個部分的時候,分佈式存儲系統仍然能夠工作。 [2] 
參考資料
  • 1.    胡文波, 徐造林. 分佈式存儲方案的設計與研究[J]. 計算機技術與發展, 2010, 20(4):65-68.
  • 2.    侯孟書. 基於P2P的分佈式存儲及其相關技術研究[D]. 電子科技大學, 2005.