複製鏈接
請複製以下鏈接發送給好友

藍色基因

(超級計算機的名字)

鎖定
藍色基因是IBM公司設計的一款超級計算機。在計算機體系結構中,在必須編程和控制整體並行系統的軟件中和我們在重要生物學的高級計算如蛋白質摺疊中應用。
中文名
藍色基因
外文名
Blue Gene/L
發佈公司
IBM
主要用途
生物學高級計算等
發佈時間
2003年
計算速度
每秒70萬億次符點運算

藍色基因基本情況

2003年,藍色基因的原型機經過三年研發問世,當年11月登上超級計算機“TOP500”第73名。日本NEC公司的“地球模擬機” (Earth Simulator)在三年前曾是世界最快超級計算機,其計算能力達35.867萬億次浮點運算速度,2004年11月被70萬億次浮點運算速度的藍色基因超過。
IBM藍色基因超級計算系統是全球速度最快的超級計算機,代表系統是藍色基因/L(Blue Gene/L)。在全球最著名的超級計算權威機構TOP500榜單上,他的峯值運算速度達到360 Teraflops(Linpark基準運算)。IBM的藍色基因/L憑藉空前的可持續計算性能,以每秒鐘280.6萬億次浮點運算速度奪得冠軍位置 [1] 

藍色基因架構設計

藍色基因系統是由大量運算節點組成,每個節點的時鐘頻率相對來説都不很快,以節省電力和降低成本。藍色基因採用IBM PowerPC嵌入式處理器、嵌入式DRAM和系統芯片技術,並整合所有系統功能,其中包括計算處理器、通訊處理器、三層高速緩存,在單一ASIC上有着複雜路徑的多重高速互聯網絡。因為處理器時鐘週期相比之下速度較為緩慢,因此就時鐘週期而言,內存近似於處理器。這對減少耗電量來説是一項優點,還能將1024個計算節點(內含2顆PowerPC嵌入式處理器)放在單一機架內進行密集封裝。藍色基因可以擴充到65536個計算節點(共計131072顆處理器),其峯值速度可達到367萬億次浮點運算速度,除了成本效益,還有低耗電、冷卻效果好及節省佔地面積等特色。
藍色基因是由下列組件構成:每計算節點2個處理器,每計算卡上有2個計算節點、每節點板上有16張計算卡、每機架有32個節點板、機架由上下兩部分組成,中間有2箇中間平面。
每個處理器在每個週期中可以執行4次浮點運算。依照在藍色基因上所執行應用程序性質的不同,程序設計人員可以選擇在單一運算節點上同時採用兩個處理器進行運算,或是以一個處理器專門處理通信。除了這些運算節點外,藍色基因系統還提供了可彈性決定使用數量的雙處理器I/O(輸入/輸出)節點,這些節點可以處理運算節點和其它系統間的通訊。
藍色基因的計算節點是通過5種網絡來互相連接,這5種網絡分別是:1個3D圓環面網絡,用在計算節點間以點對點的方式傳輸信息;1個總體集合網絡,用於整個應用中的總體運行;1個總體障礙和中斷網絡;1個千兆以太網,用來控制機器;還有另1個千兆以太網,用來連接到其它系統。3D 圓環面網絡讓每個節點都能和最近的6個相鄰節點以低延遲時間、高帶寬互連,3D圓環面網絡還支持一般的點對點通訊。圓環面網絡在使用區域通訊的應用程序上特別有效。總體集合網絡對提高平常使用的MPI總體通訊架構的速度相當有用。而總體障礙網絡能夠迅速地同步化系統內所有處理器的狀態。
藍色基因還需要一個服務節點,在這個節點上系統管理員可以管理儲存資料用的文件服務器。藍色基因還能管理複雜的前端節點,在這些前端節點上終端用户可以編譯資料併發出工作指令。藍色基因包含了多種設計創新,可以擴展到之前無法到達的性能水平,而且還能將客户系統的耗電量、散熱量和可用的佔用空間限制在合理範圍內。

藍色基因軟件環境

在軟件環境方面,藍色基因也有特別設計,強調遵守下列三項基本原則:簡單化、高效和廣泛性。在軟件設計時以簡單化的原則進行開發,且能夠利用硬件功能的優勢,既保證高效又兼顧穩定和安全性。而依據熟悉且被廣泛使用的程序語言、資料庫、工作管理工具和並行文件系統所建立的編程和管理環境,客户將能夠從藍色基因的創新設計要素中獲益,而不用面對陡峭的學習曲線。
藍色基因的前端節點是程序設計人員存取系統運算核心的入口。前端節點執行標準的SUSE SLES9版本Linux,能提供使用者熟悉的操作平台,讓使用者可以在該操作平台上編輯程序、進行程序糾錯等。支持藍色基因系統的語言為用在Power PC上標準的IBM XL Fortran、C和C++編輯器,這些還增加了一個能利用雙浮點運算單元優勢的末端,而這個雙浮點運算單元是藍色基因所獨有的。
程序設計人員可以運用廣受歡迎的IBM工程及科學子程序資料庫(Engineering and Scientific Subroutine Library,ESSL),這是一套最先進的資料庫,收集了超過400個數學子程序,能給Fortran、C或C++等語言所寫成的浮點工程和科學應用程序提供最佳性能。這些程序中有許多都已經調整成適用於藍色基因架構。
為了支持並行編寫程序,藍色基因還一併提供了一套MPI解決方案,這套解決方案可以利用美國Argonne國家實驗室的MPICH2數據庫,可生成一個利用運算節點通訊技術的執行方案。
在工作任務及平衡工作量方面,IBM LoadLeveler對藍色基因也提供支持。LoadLeveler已經過許多大規模集羣客户的考驗,能提供建立、提出和處理工作的設備,其設計是以可用資源來搭配應用程序處理過程中的需求。
藍色基因中還包括了IBM General Parallel File System (一般並行文件系統,GPFS),可以進一步強化藍色基因的軟件環境。GPFS是一個高性能的磁盤共享文件系統,它能從藍色基因的所有節點中提供快速數據存取功能。應用程序可以立即存取使用標準文件系統界面的共享文件,使用者將因此能從數個節點中存取同樣的文件。
藍色基因系統還包括一個讓系統管理員可以管理該系統的服務節點。管理員可使用的重要功能有系統設定、初始化、監督功能和運行。這些功能都已經整合到IBM Cluster Systems Management產品中,以提供額外的管理功能和在單一控制點上,在CSM支持的運行平台間進行管理。能在服務節點上執行的還有一個和DB2相關的數據庫,這個數據庫是靜態和動態狀態的信息儲存點。
總之,藍色基因系統軟件集合了諸多為用户考慮的因素,這些因素都為了達到高性能和高可靠性而加以調整,並符合許多現有集羣客户所熟悉的特性。在這種情況下,客户將能夠快速讓藍色基因發揮強大計算能力,還能從藍色基因的結構功能中獲益。

藍色基因性能情況

2005年11月,IBM正式向業界宣佈,安裝在美國勞倫斯·利弗摩爾國家實驗室的藍色基因/L超級計算機創造了每秒鐘280.6萬億次運算的性能紀錄,峯值速度甚至達到367萬億次。在同月發佈的世界超級計算機500強排行榜(TOP500)上,這台機器名列第一名,速度約是第二名的另一台藍色基因的三倍。所以被稱為上世界最快的計算機,IBM藍色基因當之無愧。2005年12月1日,IBM藍色基因的樣機來到中國。

藍色基因應用範圍

IBM將這一系統稱為eServerBlueGene,該系統的計算速度達到了每秒5.7萬億次,它的佔地面積不到1平方米。該系統的售價為150萬美元。用户也可以從IBM在美國或者歐洲的深度按需計算中心租用該計算系統。
IBM旗下eServer部門的副總裁ColinParris表示,該系統的推出使得IBM商用計算機系統的性能跨上了一個台階。在過去幾年,IBM一直和其合作伙伴致力於BlueGene計算系統適合處理不同的科研計算任務,涉及的領域包括生命科學、金融建模、流體力學、量子化學、天文學、氣象建模以及分子動力學
此外,IBM還致力於將Blue Gene計算系統應用於更廣泛的商業應用包括網格計算、商業智能、製造流程等等。
IBM耗費了5年的時間以及1億美元的成本才開發出了Blue Gene超級計算機系統。 [2] 
1.藍色基因能幫助美國國家大氣研究中心的研究人員建立大氣模型,並且能確保該中心在業內處於領先地位。使用藍色基因系統等超級計算機,美國國家大氣研究中心將能更快地建立模型和分析資料,還能估算引起大氣變化的天然因素和人類活動正如何影響氣候。
2.荷蘭ASTRON是領先的天文學組織。這個組織使用藍色基因作為新型射電望遠鏡的中央處理引擎。這款新型的射電望遠鏡叫做LOFAR,它能夠研究宇宙形成後,最早期的恆星和銀河在萌芽階段的狀況。
3.波士頓大學打算利用藍色基因來設立處理艱深科學問題的主機,這些科學問題包括核物理學、基因學、細胞生物學到宇宙氣候和海洋系統的模型建立。例如,波士頓大學的研究人員打算利用藍色基因來預測太陽表面上的活動(例如太陽耀斑)是如何影響地球的輻射帶、地球的上層大氣層和電離層。當許多科學家和研究人員將大規模集羣運算應用到不同的問題組,並在類似計劃發展中建立共同的專業知識時,藍色基因的相關性就變得更加清楚。

藍色基因研究成果

藍色基因首次運用

藍色基因計劃在2000年第一次獲得授權時,其目標就是發展能應用於生物分子現象(例如蛋白質摺疊)研究的大型並行計算機。這些努力的成果將能通過大量的模擬,對蛋白質摺疊的機制有更進一步的瞭解,此外還能探索在大型並行計算機架構和軟件方面的創新想法。藍色基因所能提供的性能等級能夠大幅度提高模擬的規模,並遠遠超越其它超級計算機。在此規模上,成功的蛋白質摺疊模擬研究可望在生物分子仿真的技術、模型和算法上能有更進一步的發展。
諸多不同應用層面的實踐經驗顯示,藍色基因架構適用於各學科間相互關聯的作業。IBM與許多機構正共同努力,擴展藍色基因架構上高性能計算應用的名單,這些應用包括了生命科學、金融模型、流體力學、量子化學、分子動力學、天文學和宇宙研究、材料科學和氣候模型。

藍色基因模擬貓腦

據PhysOrg網站報道,IBM的研究人員通過一個稱為“藍色項目”的新計算程序繪製了人類大腦內部大腦皮層和皮層下組織節點的系統連接圖。然後這個研究團隊建立了貓的大腦皮層模擬機構,其中包括10億腦細胞和10兆認知神經元突觸,信息的傳遞和連接就在這些神經元中間進行。貓腦數字模型的運行速度相當於真貓大腦實際運行速度的1/100。
2007年06月,根據科技新聞社區Slashdot援引IBM工程師Eric Van Hensbergen的消息,Plan 9操作系統成功運行於IBM的藍色基因(Blue Gene)超級計算機。
據TED(網易公開課)報道,藍色基因也在模擬人腦
參考資料