反饋

分佈式存儲架構

分佈式存儲架構由三個部分組成：客户端、元數據服務器和數據服務器。客户端負責發送讀寫請求，緩存文件元數據和文件數據。元數據服務器負責管理元數據和處理客户端的請求，是整個系統的核心組件。數據服務器負責存放文件數據，保證數據的可用性和完整性。該架構的好處是性能和容量能夠同時拓展，系統規模具有很強的伸縮性。^[1]

中文名: 分佈式存儲架構
外文名: Distributed storage architecture
組成: 客户端、元數據和數據服務器

優點: 系統規模具有很強的伸縮性
應用學科: 計算機科學
應用系統: 分佈式系統

分佈式存儲架構分佈式存儲架構的組成

分佈式存儲分為文件存儲、對象存儲和塊存儲，但它們三種存儲方式的基本架構都是大同小異的。即客户端或應用端、元數據（MDS）服務器和數據節點服務器。客户端和元數據服務器之間交互是“信令交互”，而客户端到數據節點是“媒體交互”。元數據服務器或通過數據節點服務器獲取各節點服務器的基本配置情況和狀態信息。

比如，客户端需要讀取某一個文件的信息，客户端會將相應的要求發給元數據服務器：“喂！我需要XXX，存在哪裏了”，元數據服務器查詢後回答“你到xxx服務器的xxx地址+xxx服務器的xxx地址取”。

客户端拿到這個指示後，向這2台服務器發出指令，數據節點獲得指令後，將相應的數據返回給客户端。^[2]

分佈式存儲架構塊存儲

典型設備：磁盤陣列，硬盤

塊存儲主要是將裸磁盤空間整個映射給主機使用的，就是説例如磁盤陣列裏面有5塊硬盤（為方便説明，假設每個硬盤1G），然後可以通過劃邏輯盤、做Raid、或者LVM（邏輯卷）等種種方式邏輯劃分出N個邏輯的硬盤。（假設劃分完的邏輯盤也是5個，每個也是1G，但是這5個1G的邏輯盤已經於原來的5個物理硬盤意義完全不同了。例如第一個邏輯硬盤A裏面，可能第一個200M是來自物理硬盤1，第二個200M是來自物理硬盤2，所以邏輯硬盤A是由多個物理硬盤邏輯虛構出來的硬盤。）

接着塊存儲會採用映射的方式將這幾個邏輯盤映射給主機，主機上面的操作系統會識別到有5塊硬盤，但是操作系統是區分不出到底是邏輯還是物理的，它一概就認為只是5塊裸的物理硬盤而已，跟直接拿一塊物理硬盤掛載到操作系統沒有區別的，至少操作系統感知上沒有區別。

此種方式下，操作系統還需要對掛載的裸硬盤進行分區、格式化後，才能使用，與平常主機內置硬盤的方式完全無異。

優點：

1、這種方式的好處當然是因為通過了Raid與LVM等手段，對數據提供了保護。

2、另外也可以將多塊廉價的硬盤組合起來，成為一個大容量的邏輯盤對外提供服務，提高了容量。

3、寫入數據的時候，由於是多塊磁盤組合出來的邏輯盤，所以幾塊磁盤可以並行寫入的，提升了讀寫效率。

4、很多時候塊存儲採用SAN架構組網，傳輸速率以及封裝協議的原因，使得傳輸速度與讀寫速率得到提升。

缺點：

1、採用SAN架構組網時，需要額外為主機購買光纖通道卡，還要買光纖交換機，造價成本高。

2、主機之間的數據無法共享，在服務器不做集羣的情況下，塊存儲裸盤映射給主機，再格式化使用後，對於主機來説相當於本地盤，那麼主機A的本地盤根本不能給主機B去使用，無法共享數據。

3、不利於不同操作系統主機間的數據共享：另外一個原因是因為操作系統使用不同的文件系統，格式化完之後，不同文件系統間的數據是共享不了的。例如一台裝了WIN7/XP，文件系統是FAT32/NTFS，而Linux是EXT4，EXT4是無法識別NTFS的文件系統的。就像一隻NTFS格式的U盤，插進Linux的筆記本，根本無法識別出來。所以不利於文件共享。

分佈式存儲架構文件存儲

典型設備：FTP、NFS服務器

為了克服上述文件無法共享的問題，所以有了文件存儲。

文件存儲也有軟硬一體化的設備，但是其實普通拿一台服務器/筆記本，只要裝上合適的操作系統與軟件，就可以架設FTP與NFS服務了，架上該類服務之後的服務器，就是文件存儲的一種了。

主機A可以直接對文件存儲進行文件的上傳下載，與塊存儲不同，主機A是不需要再對文件存儲進行格式化的，因為文件管理功能已經由文件存儲自己搞定了。

優點：

1、造價交低：隨便一台機器就可以了，另外普通以太網就可以，根本不需要專用的SAN網絡，所以造價低。

2、方便文件共享：例如主機A（WIN7，NTFS文件系統），主機B（Linux，EXT4文件系統），想互拷一部電影，本來不行。加了個主機C（NFS服務器），然後可以先A拷到C，再C拷到B就OK了。（例子比較膚淺，請見諒……）

缺點：

讀寫速率低，傳輸速率慢：以太網，上傳下載速度較慢，另外所有讀寫都要1台服務器裏面的硬盤來承擔，相比起磁盤陣列動不動就幾十上百塊硬盤同時讀寫，速率慢了許多。

分佈式存儲架構對象存儲

典型設備：內置大容量硬盤的分佈式服務器

對象存儲最常用的方案，就是多台服務器內置大容量硬盤，再裝上對象存儲軟件，然後再額外搞幾台服務作為管理節點，安裝上對象存儲管理軟件。管理節點可以管理其他服務器對外提供讀寫訪問功能。

之所以出現了對象存儲這種東西，是為了克服塊存儲與文件存儲各自的缺點，發揚它倆各自的優點。簡單來説塊存儲讀寫快，不利於共享，文件存儲讀寫慢，利於共享。能否弄一個讀寫快，利於共享的出來呢。於是就有了對象存儲。

首先，一個文件包含了了屬性（術語叫metadata，元數據，例如該文件的大小、修改時間、存儲路徑等）以及內容（以下簡稱數據）。

以往像FAT32這種文件系統，是直接將一份文件的數據與metadata一起存儲的，存儲過程先將文件按照文件系統的最小塊大小來打散（如4M的文件，假設文件系統要求一個塊4K，那麼就將文件打散成為1000個小塊），再寫進硬盤裏面，過程中沒有區分數據/metadata的。而每個塊最後會告知你下一個要讀取的塊的地址，然後一直這樣順序地按圖索驥，最後完成整份文件的所有塊的讀取。

這種情況下讀寫速率很慢，因為就算你有100個機械手臂在讀寫，但是由於你只有讀取到第一個塊，才能知道下一個塊在哪裏，其實相當於只能有1個機械手臂在實際工作。

而對象存儲則將元數據獨立了出來，控制節點叫元數據服務器（服務器+對象存儲管理軟件），裏面主要負責存儲對象的屬性（主要是對象的數據被打散存放到了那幾台分佈式服務器中的信息），而其他負責存儲數據的分佈式服務器叫做OSD，主要負責存儲文件的數據部分。當用户訪問對象，會先訪問元數據服務器，元數據服務器只負責反饋對象存儲在哪些OSD，假設反饋文件A存儲在B、C、D三台OSD，那麼用户就會再次直接訪問3台OSD服務器去讀取數據。

這時候由於是3台OSD同時對外傳輸數據，所以傳輸的速度就加快了。當OSD服務器數量越多，這種讀寫速度的提升就越大，通過此種方式，實現了讀寫快的目的。

另一方面，對象存儲軟件是有專門的文件系統的，所以OSD對外又相當於文件服務器，那麼就不存在文件共享方面的困難了，也解決了文件共享方面的問題。

所以對象存儲的出現，很好地結合了塊存儲與文件存儲的優點。

分佈式存儲架構塊存儲、對象和文件存儲架構區別

分佈式存儲架構塊存儲

塊存儲是一種裸設備，它是將存儲設備以“塊”的方式直接提供給客户，由客户自己的操作系統裏的文件系統進行管理。

華為的FusionStorage是一個典型的“塊”存儲。FusionStorage分成了MDC、OSD和Client三部分。和其他分佈式存儲重大的差別是:MDC是記錄、更新OSD服務器、磁盤等的狀態，並把這些狀態數據實時同步給Vbs，由Vbs計算出來數據所落的位置。MDC可以單獨部署，也可以集中部署，也可以分佈部署。

一般分佈式存儲的MDC採用的是數據庫或內存儲數據庫來記錄數據塊和物理位置關係。客户端向MDC發出詢問位置的請求，MDC查詢數據庫後返回請求數據的存儲位置。

這種方法存儲訪問的速度較慢，而且MDC作為交通的“樞紐”，絕對是整個存儲的核心，當MDC發生故障，會導致整個存儲都不能使用。但是採取這個方式，也有好處，比如可以根據不同需求設置不同的副本策略等。^[2]