-
FLOPS
鎖定
是“每秒所執行的浮點運算次數”(floating-point operations per second)的縮寫。
它常被用來估算電腦的執行效能,尤其是在使用到大量浮點運算的科學計算領域中。
正因為FLOPS字尾的那個S,代表秒,而不是複數,所以不能省略掉。
在這裏所謂的“浮點運算”,實際上包括了所有涉及小數的運算。
這類運算在某類應用軟件中常常出現,而它們也比整數運算更花時間。
也因此FLOPS所量測的,實際上就是FPU的執行速度。
而最常用來測量FLOPS的基準程式(benchmark)之一,就是Linpack。
FLOPS評價
許多專家對FLOPS有頗多微詞,
認為它並不是一個有意義的量度(measurement),
因為FLOPS並不能反應出許多對執行效能有影響的因素。
例如:I/O的效能、內存的架構、快取內存一致性(cache coherence)等。
這意味着電腦的實際計算容量,與FLOPS的理論峯值間會有一段不小的差距。
FLOPS換算
一個GFLOPS(gigaFLOPS)等於每秒十億(=10^9)次的浮點運算,
一個EFLOPS(exaFLOPS)等於每秒一百京(=10^18)次的浮點運算,
一個ZFLOPS(zettaFLOPS)等於每秒十萬京(=10^21)次的浮點運算。
FLOPS其他信息
也因此 FLOPS 所量測的,實際上就是 FPU 的執行速度。
現在家用的雙核計算機通常都能達到每秒 五十億次運算(2*2.5GHz)左右的水平,
浮點性能大約是上百億次浮點操作。超級計算機發展得很快,
目前劃分超級計算機的門檻是“每秒一萬億次浮點操作”,是家用微機的一百倍以上,
幾年以後這個門檻預計會提高到十萬億次。
超級計算機幾十、上百萬億次的 FLOPS 也是靠多個處理器(通常還是多核)堆起來的,
比如的IBM Roadrunner (走鵑,一種喜歡在地上飛快地走的小鳥)
有 6562 個 AMD Opteron雙核處理器,12240 個 PowerX Cell 8i 處理器,
其中主要的浮點運算能力是由 Cell 處理器提供的,
每個 Cell CPU 包括 8 個浮點處理核心,
總體來看,就是 2 * 6562 = 13124 個通用處理器核心; 8 * 12240 = 97920 個專用處理器核心。
你説這麼多錢堆出來的這麼十多萬個核心,速度能不快嗎? 它的速度是 1.026 P FLOPS,
也就是每秒超過 一千萬億次浮點操作
FLOPS運算能力
中國的一台叫做「天河2號」的超級計算機,
跑出了30.65PFlops的驚人紀錄,比當今世界上最快的那台還要快上 74%!
這份成績的驚人之處在與,這是基於Intel平台的天河2號(又稱銀河2號)還沒開足馬力的情況下取得的成績。
經過一次5小時的LINPACK測試,動用了16,000個節點中的14,336個,也就是90%的運算節點,
測到了前面提到的30.65PFlops(1 petaflop=1千萬億次浮點計算/秒)
有17.5PFlops的計算速度。天河2號的效能比是1.935GFlops/瓦,略遜於泰坦的2.143GFlops/瓦。
天河2號的數據,本週在田納西大學教授Jack Dongarra的論文中被披露,
他編寫了LINPACK軟件包,並且負責每年修訂500強排行榜兩次。
教授沒有説明,天河2號的戰績是否會正式提交,並被收錄到最新的排行榜中。
但不管怎麼樣,新榜單將在6月17日公佈。
天河2號計劃今年年底入駐廣州的國家超級計算機中心,
天河2號的組裝和測試主要由中國國防科技大學(NUDT)承擔。
一旦驗收通過,天河2號將對外開放平台,用於實驗和教育領域。
天河2號使用Intel Ivy Bridge和Xeon Phi 處理器,
「32,000顆Ivy Bridge的Xeon和48,000顆的Xeon Phi共計2,120,000個內核。」Dongarra寫道。
天河2擁有12.4PB的硬盤和1.4PB的內存。
NUDT採用自己的分佈式計算技術,
Dongarra描述為:「光電混合傳輸技術(optoelectronics hybrid transport technology),
上層採用主幹拓撲結構,通過13個路由,每個路由有576個端口連接。並運行麒麟LINUX系統。」
理論上,天河2號具備54.9PFlops的計算能力。
但Top500上的機器大多達不到理論值,但如果天河2號開足馬力,還有很大的提升空間。
天河2號是天河1號的後續產品,天河1號曾經在2010年11月登上過Top500的頭把交椅,
而且長時間排在前8位,運算能力2.57PFlops。[Junius_Lou via Ars]
- 詞條統計
-
- 瀏覽次數:次
- 編輯次數:38次歷史版本
- 最近更新: 不会说的段子手