複製鏈接
請複製以下鏈接發送給好友

磁盤陣列櫃

鎖定
磁盤陣列簡稱RAID(Redundant Array of Independent Disks),有“獨立磁盤冗餘陣列”之意。磁盤陣列是由很多便宜、容量較小、穩定性較高、速度較慢磁盤,組合成一個大型的磁盤組,利用個別磁盤提供數據所產生的加成效果來提升整個磁盤系統的效能。同時,在儲存數據時,利用這項技術,將數據切割成許多區段,分別存放在各個硬盤上。磁盤陣列還能利用同位檢查(Parity Check)的觀念,在數組中任一顆硬盤故障時,仍可讀出數據,在數據重構時,將故障硬盤內的數據,經計算後重新置入新硬盤中。而磁盤陣列櫃就是裝配了眾多硬盤的外置的RAID 。
磁盤陣列櫃原理是利用數組方式來作磁盤組,配合數據分散排列的設計,提升數據的安全性。
中文名
磁盤陣列
外文名
Redundant Array of Independent Disks
簡    稱
RAID
中文全稱
獨立磁盤冗餘陣列

磁盤陣列櫃設計挑戰

由於磁盤驅動器的技術以及傳輸接口的技術不斷的發展,磁盤陣列系統的設計隨時都面臨新的挑戰,以便符合與日俱增的要求。一個優質的磁盤陣列櫃,必須在設計階段,就要考慮到其規格必須符合更大容量、更高轉速磁盤驅動器的需求,提供:
穩定、高容量、容錯的電源供應系統
可靠、高性能、容錯的冷卻系統
能夠克服震動的機械結構
支持SCA2熱抽換接頭之被動背板
一體成型、無主動組件之磁盤載盒
數組櫃環境監控與警示功能
直接熱抽換且方便的維護操作功能
最佳的空間利用

磁盤陣列櫃滿足條件

1,磁盤驅動器以剛性方式固定於磁盤驅動器載盒〈不使用任何塑料或其它韌性支柱〉,塑料或其它韌性支柱會變成震動的放大器,讓磁盤驅動器震得更厲害。剛性方式固定,可以透過經由模態分析〈Model Analysis〉設計之陣列櫃,避開自然共振頻率〈Natural Resonance Frequency〉以及強迫共振頻率〈Forced Resonance Frequency〉,將系統震動降至最低,得到最佳性能,不會因震動造成磁頭偏移而需重新尋軌定位 (re-seek)。
2,磁盤驅動器載盒必須為一體成型之剛性合金製造,且緊密穩固地固定在機箱內。如果是以卡榫或螺絲方式接合,其防震效果可想而知,非常不理想。 [1] 

磁盤陣列櫃電源供應系統

磁盤驅動器馬達啓動時,需要很大的啓動電流〈約2A〉,約為平常讀寫時〈約0.66A〉的3倍;磁盤驅動器在SEEK時,需要很大的瞬間電流〈約2.1A〉,約為讀寫時〈約0.66A〉之3倍。因此,電源供應系統必須能提供足夠、穩定之瞬間電流,否則會造成磁盤驅動器無法啓動,甚至造成數據寫入錯誤〈此為導致RAID磁盤驅動器RAID控制器判定為Down,但磁盤驅動器送回原廠測試卻無故障之原因〉。當磁盤驅動器轉速越來越快,SEEK速度也越來越快時,電源供應器必須提供足夠的容量,以因應將來擴充的需求。
具備容錯,熱抽換、負載分享之雙電源供應器,是不可或缺的,更重要的是,如果電源供應器發生故障,要能不必下螺絲就能熱抽換電源供應〈使用螺絲起子解螺絲會造成震動及搖擺,會損害工作中之磁盤驅動器〉。
有了雙電源供應器,更要具備兩組電源輸入,一個接到市電,一個接到UPS。如此,無論突然斷電,或UPS故障,都不會造成RAID宕機。
好的電源供應系統,還須具備交流電壓與頻率自動選擇及調整,以適用不同電壓及頻率,更重要的是,要能克服電壓及頻率不穩之狀況。在用電尖峯時段,市電電壓可能降到100伏特以下,而在非用電尖峯時段,市電電壓可能升到120伏特以上,因此電源供應系統必須能夠容忍這些電壓變化,提供磁盤驅動器穩定的電壓和電流,否則可能造成磁盤驅動器故障,甚至數據寫入錯誤。磁盤陣列櫃的電源供應系統,最好能夠提供從85到260伏特無段自動調整,如此,無論插到哪種插座,市電品質如何變化,都不會影響磁盤陣列的功能。

磁盤陣列櫃冷卻系統

在許多案例中,我們發現冷卻系統設計不完善的磁盤陣列櫃,只能裝設7200轉的磁盤驅動器,若使用10,000轉的磁盤驅動器,系統就會過熱。Seagate已經推出15,000轉的磁盤驅動器了,如何挑選一個具備可靠、高性能、容錯之冷卻系統的磁盤陣列櫃,就更顯得重要了。
一般磁盤陣列櫃之設計,在每個磁盤驅動器載具上加裝小風扇,整個系統再裝數個大風扇,用邊吸邊吹的方式散熱,不但散熱效果不好,而且是產生磁盤驅動器故障的潛在因素:它帶來的危害有以下這些:
產生大量氣流將粉塵吹入系統,污染磁盤驅動器及風扇本身造成故障。
採用一般PC用小風扇,且數量多(轉動機械零件越多,故障機率越高),系統可靠度因而巨幅降低。
一旦有一個小風扇故障,相關磁盤驅動器便無法獲得足夠散熱而故障。
一個優質磁盤陣列櫃之冷卻系統的設計,必須完全符合熱力學理論之全方位冷卻:熱傳導、熱對流及熱輻射之三相散熱方式,才能更有效率、可靠度更高:
磁盤驅動器載盒必須採用黑色、高導熱係數之金屬(如鋁合金),並與載盒緊密接觸固定,如此可以最快最有效地將磁盤驅動器之熱能傳導至整個載盒,然後以最大輻射面積與最佳輻射顏色(黑色),將熱能輻射至機體內空氣中,再以中央系統渦輪抽風機將熱空氣以對流方式排出
磁盤驅動器載盒不能使用風扇,及其它任何主動組件,以免本身故障而損及磁盤驅動器
系統採用中央抽風排熱設計,須使用兩個以上之工業用渦輪抽風機(不可用一般PC用風扇),以提高可靠度與排熱效率。由於工業用渦輪抽風機本身可以防止軸承被粉塵污染,且抽氣效率極高,可將機體內熱空氣抽出,並在機體內產生很大的相對低壓,冷空氣便可由經過精密設計之對流孔,均勻地進入機體內,達到最佳對流散熱效果。
中央系統渦輪抽風機必須具備熱抽換功能,且能夠自動温控轉速,以達到最佳之排熱性能與能源使用效率只需一部渦輪抽風機就足以維持系統散熱之最低限度。工業用渦輪抽風機之出氣口面積只有一般PC用風扇1/10,因此即使有任何風扇因故停止運轉,也不致影響整個系統之熱對流結構。

磁盤陣列櫃防震機械結構

由於磁盤陣列的特性,當存取陣列中的數據時,陣列中所有的磁盤驅動器的磁頭,都幾乎在同時,往同一個方向SEEK,又幾乎同時在相同的位置煞車,其慣性動量非常之大。因此造成很大的震動問題。如果磁盤陣列櫃的機械結構不能克服這些震動問題,輕則造成Re-Seek,嚴重的話,會導致碟面受損,數據遺失。
一個好的磁盤陣列櫃的機械結構設計,必須克服上述震動問題:
磁盤驅動器以剛性方式固定於磁盤驅動器載盒(不使用任何塑料或其它韌性支柱):塑料或其它韌性支柱會變成震動的放大器,讓磁盤驅動器震得更厲害。剛性方式固定,可以透過經由模態分析設計之陣列櫃,避開自然共振頻率以及強迫共振頻率,將系統震動降至最低,得到最佳性能,不會因震動造成磁頭偏移而需重新尋軌定位(re-seek)。
磁盤驅動器載盒必須為一體成型之剛性合金製造,且緊密穩固地固定在機箱內。如果是以卡榫或螺絲方式接合,其防震效果可想而知,非常不理想。

磁盤陣列櫃被動背板

前面提到,磁盤陣列系統最重要的是可靠度,因此所有具備主動組件(包含電子組件和機械組件)都必須安裝在可熱抽換的模塊上,以便發生故障時可以隨時更換。一般來説,被動組件是不會壞的,除非暴力相向。
磁盤陣列櫃中,除了背板之外,其它所有模塊都可以是可熱抽換的。因此,背板上不可以有任何主動組件,以免有任一組件發生故障,必須停機更換,而且,一般來説,使用者是無法自行更換背板的。
磁盤陣列櫃背板的另一個重要規格,是必須使用SCA2接頭,以支持熱抽換。我們都知道,把磁盤驅動器從系統中拔出或插入,會造成很大的突波訊號,可能影響正在工作的Bus,甚至損壞磁盤驅動器接口組件,因此必須要有特殊的設計,來降低並防止突波可能造成的損害。
SCA2接頭的設計,是採用長、中、短等不同長度的接腳,將前期電源和地線、主電源、總線信號線等,依照先後順序接觸(插入)時或分離(拔出)時,如此可以將磁盤驅動器線路緩慢充電,將其電位提升以降低其與總線間之電位差,以減低突波訊號,保護電子接口組件以及避免干擾工作中的總線。

磁盤陣列櫃磁盤載盒

在實際的案例中,常發現用户把磁盤載盒送修,因為磁盤載盒蜂鳴器一直叫、風扇卡住不轉了。當然,磁盤驅動器也可能因此而過熱,毀了。這就是磁盤載盒設計不良所造成的。
一個好的磁盤載盒設計,必須沒有使用任何可動機械或主動電子組件,亦即,不要有小風扇,也不要任何控制線路。如此,磁盤載盒本身就是金剛不壞之身,不會造成故障,更不會成為磁盤驅動器殺手。
同時,磁盤驅動器的固定方式,也是一門學問。除了前述要將磁盤驅動器直接且緊密地固定在磁盤載盒上,以達到熱傳導散熱之外,磁盤驅動器最好是倒掛式固定。如果採取一般正面式固定,則磁盤驅動器所產生的熱,傳導至磁盤載盒之後,又輻射出來產生熱空氣,再往上升,剛好用來烤磁盤驅動器的線路板和組件,會加速組件的老化。如果採取倒掛式固定,則傳導到磁盤載盒的熱,會輻射到磁盤驅動器上部空間,由對流氣流帶走,不會烘烤到磁盤驅動器線路組件。
為求達到最佳熱輻射散熱效果,磁盤驅動器載盒之表面,最好漆上黑色,因為黑色是最容易吸收熱能,也是最容易輻射出熱能的顏色。磁盤驅動器載盒的材質,必須具備高導熱係數的特性,如鋁合金辨識理想的材料,導熱係數高,加工也方便。
而如前述,磁盤驅動器載盒必須是一體成型的剛性金屬合金製造,以達到最佳震動克服性能。我們非常不建議採用組合式磁盤載盒,一般這些組合式磁盤載盒,都是由一個架子和一個盒子組成;架子上有風扇和熱抽換控制電路,固定在機殼上,再接Cable;磁盤驅動器則裝在盒子,透過轉接接頭連到架子上。如此,不但造成前述震動問題,而且一旦架子的風扇或電子組件故障,就必須停機更換。

磁盤陣列櫃監控示警功能

磁盤陣列櫃中所有主動組件或機械組件,以及內部環境温度,都必須能夠監控且有適當的警示和通報功能:
陣列控制器必須能支持S.M.A.R.T.,以便預測可能發生的磁盤驅動器故障。妥善利用S.M.A.R.T.功能,能夠預先準備好備用磁盤驅動器,以便在第一時間把不穩的磁盤驅動器更換掉,如此可以把風險係數降至最低。
環境狀態監控器必須能隨時監視機櫃內部温度,以及控制排設裝置轉速,以達到最佳冷卻及能源利用效率
電源供應器的輸入與輸出,也必須隨時監控。同時異常狀況必須以兩種以上方式通報,至少包含在數組櫃本身的聲音與視覺燈光警示,以及遠程通報。
另外,非常重要的一點是,環境監視控制器本身也是主動組件,也可能發生故障,因此,磁盤陣列櫃的環境監控器,必須能夠支持熱抽換功能。

磁盤陣列櫃維護操作功能

磁盤陣列櫃中,所有可能發生故障的組件,包括主動電子組件、可動機械組件,都必須能夠支持熱抽換功能。不能抽換的組件,就必須是不會故障的被動組件。
具備可熱抽換功能,大家都知道,但是,要如何才能更方便、更安全地作熱抽換,可是一門學問。一個提供方便維護、安全熱抽換的磁盤陣列櫃,至少需具備以下功能:
所有可熱抽換的組件,都必須能由外部直接抽換,而不必先移除其它組件,如此才不會造成任何風險。試想,如果一個風扇壞了,你得先把一個電源供應器移除,才能抽換壞的風扇,你必須保證剩下那個電源供應器不會出問題,否則······
所有的熱抽換動作,都不需要將手或工具伸進機體內部,去拆解螺絲或拔接頭。把工具伸進機體內,可能誤觸線路造成短路,整個系統可能因此損壞或當機;把手伸入機體內,可能會觸電,人一觸電,反應是無法預期和控制的,可能會把整個磁盤陣列櫃甩到五公尺遠。
所有的熱抽換動作,都不需要使用任何工具。在操作中的系統上使用工具是非常危險的,用力轉螺絲會造成機體搖動,磁盤驅動器會受損;金屬工具也可能會造成短路。
所有可熱抽換的組件,都不可使用螺絲固定,因為如果不小心,螺絲很可能會掉進機體內,造成短路。如果一定要用螺絲,也要使用具有卡榫的螺絲,在解下後仍然能夠安全地卡在組件上,不會有脱落的危險。

磁盤陣列櫃空間利用

在機架式系統中,空間的利用以及散熱氣流的需求,是非常重要的因素。同樣可容納七台磁盤驅動器,一個只要佔3U空間的磁盤陣列櫃,當然比一個要佔6U空間的磁盤陣列櫃要來得有效率。
要能達到最佳化的空間利用,除了磁盤陣列櫃的體積要小之外,散熱氣流的需求也是決定性因素。一個只應用到單向對流散熱方式的磁盤陣列櫃,需要很大的氣流需求才能達到散熱效果,因此即使體積小,也不能在一個機架中裝設太多磁盤陣列櫃,否則散熱氣流就會不夠。
如果磁盤陣列櫃採用高效率的三相散熱〈熱傳導、熱輻射、熱對流〉系統,就只需要小量的氣流,便足以發揮散熱效果,因此可以在機架中高密度地裝置磁盤陣列櫃,大大地提高空間使用效率,當然也大大地降低了成本。這對大型企業、ISP、以及主機代管業者來説,是非常有經濟效益的規格。

磁盤陣列櫃應用場所

由於磁盤陣列櫃具有數據存儲速度快、存儲容量大等優點,所以磁盤陣列櫃通常比較適合在企業內部的中小型中央集羣網存儲區域進行海量數據存儲。
參考資料