複製鏈接
請複製以下鏈接發送給好友

分佈式

(計算機的一種算法)

鎖定
分佈式計算是計算機科學中一個研究方向,它研究如何把一個需要非常巨大的計算能力才能解決的問題分成許多小的部分,然後把這些部分分配給多個計算機進行處理,最後把這些計算結果綜合起來得到最終的結果。分佈式網絡存儲技術是將數據分散地存儲於多台獨立的機器設備上。分佈式網絡存儲系統採用可擴展的系統結構,利用多台存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,不但解決了傳統集中式存儲系統中單存儲服務器的瓶頸問題,還提高了系統的可靠性、可用性和擴展性。
當計算機的程序和數據通過網絡分佈在多於一個的計算機上時,計算就成為“分佈式的”。以前的計算通常是由計算中心完成的。儘管仍存在這樣的計算中心,大小企業卻逐漸將應用程序移至(分佈到)企業中能最有效地完成計算的地點進行,通常是桌面工作站、局域網服務器、部門服務器、Web服務器和其他服務器的混合。比較流行的是客户/服務器模式,客户機只具有一定的功能,其他的功能需要從提供服務的服務器那裏獲得。HTTP協議就是一個例子。在分佈式計算環境中,數據的存儲和處理可在本地工作站上進行。
中文名
分佈式
外文名
distribution
類    別
計算機
學    科
計算機科學
應    用
分佈式計算、分佈式系統
特    點
可靠性、可用性和擴展性

分佈式分佈式計算

分佈式計算是近年提出的一種新的計算方式。所謂分佈式計算就是在兩個或多個軟件互相共享信息,這些軟件既可以在同一台計算機上運行,也可以在通過網絡連接起來的多台計算機上運行。分佈式計算是一種計算方法,和集中式計算是相對的。隨着計算技術的發展,有些應用需要非常巨大的計算能力才能完成,如採用集中式計算,需要耗費相當長的時間來完成。分佈式計算將該應用分解成許多小的部分,分配給多台計算機進行處理。這樣可以節約整體計算時間,大大提高計算效率 [1] 
分佈式計算比起其它算法具有以下幾個優點:
1、稀有資源可以共享;
2、通過分佈式計算可以在多台計算機上平衡計算負載;
3、可以把程序放在最適合運行它的計算機上;
其中,共享稀有資源和平衡負載是計算機分佈式計算的核心思想之一。
實際上,網格計算就是分佈式計算的一種。如果我們説某項工作是分佈式的,那麼,參與這項工作的一定不只是一台計算機,而是一個計算機網絡,顯然這種“螞蟻搬山”的方式將具有很強的數據處理能力。網格計算的實質就是組合與共享資源並確保系統安全。
分佈式計算的方法
分佈式產品選型 分佈式產品選型
分佈式計算是利用互聯網上的計算機的 CPU 的閒置處理能力來解決大型計算問題的一種計算科學。下面,我們看看它是怎麼工作的:
首先,要發現一個需要非常巨大的計算能力才能解決的問題。這類問題一般是跨學科的、極富挑戰性的、人類急待解決的科研課題。其中較為著名的是:
1.解決較為複雜的數學問題,例如:GIMPS(尋找最大的梅森素數)。
2.研究尋找最為安全的密碼系統,例如:RC-72(密碼破解)。
3.生物病理研究,例如:Folding@home(研究蛋白質摺疊,誤解,聚合及由此引起的相關疾病)。
4.各種各樣疾病的藥物研究,例如:United Devices(尋找對抗癌症的有效的藥物)。
5.信號處理,例如:SETI@Home(在家尋找地外文明)。
從這些實際的例子可以看出,這些項目都很龐大,需要驚人的計算量,僅僅由單個的電腦或是個人在一個能讓人接受的時間內計算完成是絕不可能的。在以前,這些問題都應該由超級計算機來解決。但是, 超級計算機的造價和維護非常的昂貴,這不是一個普通的科研組織所能承受的。隨着科學的發展,一種廉價的、高效的、維護方便的計算方法應運而生——分佈式計算!

分佈式分佈式計算與互聯網的普及

隨着計算機的普及,個人電腦開始進入千家萬户。與之伴隨產生的是電腦的利用問題。越來越多的電腦處於閒置狀態,即使在開機狀態下CPU的潛力也遠遠不能被完全利用。我們可以想象,一台家用的計算機將大多數的時間花費在“等待”上面。即便是使用者實際使用他們的計算機時,處理器依然是寂靜的消費,依然是不計其數的等待(等待輸入,但實際上並沒有做什麼)。互聯網的出現, 使得連接調用所有這些擁有閒置計算資源的計算機系統成為了現實。

分佈式分佈式計算項目

那麼,一些本身非常複雜的但是卻很適合於劃分為大量的更小的計算片斷的問題被提出來,然後由某個研究機構通過大量艱辛的工作開發出計算用服務端和客户端。服務端負責將計算問題分成許多小的計算部分,然後把這些部分分配給許多聯網參與計算的計算機進行並行處理,最後將這些計算結果綜合起來得到最終的結果。
當然,這看起來也似乎很原始、很困難,但是隨着參與者和參與計算的計算機的數量的不斷增加, 計算計劃變得非常迅速,而且被實踐證明是的確可行的。一些較大的分佈式計算項目的處理能力已經可以達到甚至超過世界上速度最快的巨型計算機
您也可以選擇參加某些項目以捐贈的 CPU內核處理時間,您將發現您所提供的 CPU 內核處理時間將出現在項目的貢獻統計中。您可以和其他的參與者競爭貢獻時間的排名,您也可以加入一個已經存在的計算團體或者自己組建一個計算小組。這種方法很利於調動參與者的熱情。

分佈式參與計算

隨着民間的組隊逐漸增多, 許多大型組織(例如公司、學校和各種各樣的網站)也開始了組建自己的戰隊。同時,也形成了大量的以分佈式計算技術和項目討論為主題的社區,這些社區多數是翻譯製作分佈式計算項目的使用教程及發佈相關技術性文章,並提供必要的技術支持。
那麼誰可能加入到這些項目中來呢? 當然是任何人都可以! 如果您已經加入了某個項目,而且曾經考慮加入計算小組, 您將在中國分佈式計算總站及論壇裏找到您的家。任何人都能加入任何由我站組建的分佈式計算小組。希望您在中國分佈式總站及論壇裏發現樂趣。
參與分佈式計算——一種能充分發揮您的個人電腦的利用價值的最有意義的選擇——只需要下載有關程序,然後這個程序會以最低的優先度在計算機上運行,這對平時正常使用計算機幾乎沒有影響。如果你想利用計算機的空餘時間做點有益的事情,還猶豫什麼?馬上行動起來吧,你的微不足道的付出或許就能使你在人類科學的發展史上留下不小的一筆呢。

分佈式分佈式存儲系統

分佈式存儲系統,是將數據分散存儲在多台獨立的設備上。傳統的網絡存儲系統採用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。大數據時代的來臨使得對分佈式存儲系統的研究具有重要的意義:
針對海量數據存儲,分佈式數據存儲以其良好的可擴展性。健壯性和高效性超越了傳統的集中式存儲技術,但針對其本身的許多性能指標比如數據冗餘度、數據存取速度、帶寬佔用率、存儲花費和可靠性等使得不同的系統和不同的個人、企業對存儲要求的側重點不同。數據存儲多考慮存取效率、存儲花費,對數據抗毀性研究甚少。
針對海量數據的管理和維護,維護數據一致性分佈式存儲系統維護數據的一個重點方向,由於互聯網環境千變萬化,數據更新速度和轉換頻率不斷加快,使得數據一致性維護面臨諸多問題,如可靠性問題、數據冗餘問題、網絡動盪問題和惡意攻擊等問題嚴重影響了一致性維護策略的制定和發展。

分佈式P2P 數據存儲系統

P2P數據存儲系統採用 P2P 網絡的特點,即每個用户都是數據的獲取者和提供者,沒有中心節點,所以每個用户都是對等存在的。利用這種特點建立而成的P2P 數據存儲系統可以將數據存放於多個對等節點上,當需要數據時,可以利用固定的資源搜索算法尋找數據資源,從而獲取想要的數據。
P2P 數據存儲系統的這種特點使得它非常適合存儲大量數據。首先,由於沒有中心服務器的存在,數據被分散存儲與各個對等節點上,這樣就不會出現某個節點負載過重的問題,可擴展性好;其次,對於網絡攻擊的抗打擊能力強,當存在網絡攻擊時,受打擊的節點損失的數據僅僅是整個數據存儲系統的一小部分,大部分資源仍然處於安全狀態;最後,得益於P2P網絡優良的可擴展性和易維護性,P2P 數據存儲系統也有着這些優點。

分佈式雲存儲系統

雲存儲系統是一種網絡存儲系統,通過將大量的數據存儲服務器集合起來,在內部表現為多個存儲服務器協同工作,共同承擔數據存儲的任務,將數據存儲任務劃分為多個子任務並行存儲,從而減小了數據存儲的時間,並增加數據安全性。簡單來説,雲存儲就是將數據或者文件存放到雲端,數據使用者可以在任意地方通過互聯網非常方便的存取數據,並且數據存儲在雲端有着高安全性、低花費等優點 [2] 

分佈式應用

所謂分佈式就是指數據和程序可以不位於一個服務器上,而是分散到多個服務器,以網絡上分散分佈的地理信息數據及受其影響的數據庫操作為研究對象的一種理論計算模型。分佈式有利於任務在整個計算機系統上進行分配與優化,克服了傳統集中式系統會導致中心主機資源緊張與響應瓶頸的缺陷,解決了網絡GIS 中存在的數據異構、數據共享、運算複雜等問題,是地理信息系統技術的一大進步。
傳統的集中式GIS 起碼對兩大類地理信息系統難以適用,需用分佈式計算模型。第一類是大範圍的專業地理信息系統、專題地理信息系統或區域地理信息系統。這些信息系統的時空數據來源、類型、結構多種多樣,只有靠分佈式才能實現數據資源共享和數據處理的分工合作。比如綜合市政地下管網系統,自來水、燃氣、污水的數據都分佈在各自的管理機構,要對這些數據進行採集、編輯、入庫、提取、分析等計算處理就必須採用分佈式,讓這些工作都在各自機構中進行,並建立各自的管理系統作為綜合系統的子系統去完成管理工作。而傳統的集中式提供不了這種工作上的必要性的分工。第二類是在一個範圍內的綜合信息管理系統。城市地理信息系統就是這種系統中一個很有代表性的例子。世界各國管理工作城市市政管理佔很大比例,城市信息的分佈特性及城市信息管理部門在地域上的分散性決定了多層次、多成份、多內容的城市信息必須採用分佈式的處理模式。
很明顯,傳統的集中式地理信息系統不能滿足分工明確的現代社會的需求,分佈式地理信息系統的進一步發展具有不可阻擋的勢頭。而且,分佈式GIS 與網絡GIS 、客户/服務器GIS計算模型、WWW計算模型的關係都很密切。分佈式GIS 是實現網絡GIS 的途徑,是實現NGIS的一種重要計算模型;CIS模型實際上是分佈式GIS 可供採用的一種具體化計算模型;WWW模型實際上也是分佈式GIS模型可採用的一種具體化模型,而且也是具有相當發展前途的分佈式GIS模型。分佈式GIS 與當今主導地理信息系統發展方向的技術的緊密聯繫使分佈式GIS相應地成為地理信息系統的主要發展趨勢。
參考資料