複製鏈接
請複製以下鏈接發送給好友

蒙特卡洛樹搜索

鎖定
蒙特卡洛樹搜索又稱隨機抽樣或統計試驗方法,屬於計算數學的一個分支,它是在上世紀四十年代中期為了適應當時原子能事業的發展而發展起來的。傳統的經驗方法由於不能逼近真實的物理過程,很難得到滿意的結果,而蒙特卡洛樹搜索方法由於能夠真實地模擬實際物理過程,故解決問題與實際非常符合,可以得到很圓滿的結果。這也是以概率和統計理論方法為基礎的一種計算方法,是使用隨機數(或更常見的偽隨機數)來解決很多計算問題的方法。將所求解的問題同一定的概率模型相聯繫,用電子計算機實現統計模擬或抽樣,以獲得問題的近似解。 [1] 
中文名
蒙特卡洛樹搜索
外文名
The monte carlo search tree
別    名
隨機抽樣或統計試驗方法
時    間
上世紀四十年代中期
學    科
數學

蒙特卡洛樹搜索理論發展

當科學家們使用計算機來試圖預測複雜的趨勢和事件時, 他們通常應用一類需要長串的隨機數的複雜計算。設計這種用來預測複雜趨勢和事件的數字模型越來越依賴於一種稱為蒙特卡洛樹搜索的統計手段, 而這種模擬進一步又要取決於可靠的無窮盡的隨機數目來源。
最近,由美國佐治亞大學的費倫博格博士作出的一份報告證明了最普遍用以產生隨機數串的計算機程序中有5個在用於一個簡單的模擬磁性晶體中原子行為的數學模型時出現錯誤。科學家們發現, 出現這些錯誤的根源在於這5個程序產生的數串其實並不隨機, 它們實際上隱藏了一些相互關係和樣式, 這一點只是在這種微小的非隨機性歪曲了晶體模型的已知特性時才表露出來。貝爾實驗室的裏德博士告誡人們記住偉大的諾伊曼的忠告:“任何人如果相信計算機能夠產生出真正的隨機的數序組都是瘋子。” [1] 

蒙特卡洛樹搜索基本原理

當所要求解的問題是某種事件出現的概率,或者是某個隨機變量的期望值時,它們可以通過某種“試驗”的方法,得到這種事件出現的頻率,或者這個隨機變數的平均值,並用它們作為問題的解。這就是蒙特卡羅方法的基本思想。蒙特卡羅方法通過抓住事物運動的幾何數量和幾何特徵,利用數學方法來加以模擬,即進行一種數字模擬實驗。它是以一個概率模型為基礎,按照這個模型所描繪的過程,通過模擬實驗的結果,作為問題的近似解。可以把蒙特卡羅解題歸結為三個主要步驟:構造或描述概率過程;實現從已知概率分佈抽樣;建立各種估計量 [1] 

蒙特卡洛樹搜索解題步驟

構造或描述概率過程
對於本身就具有隨機性質的問題,如粒子輸運問題,主要是正確描述和模擬這個概率過程,對於本來不是隨機性質的確定性問題,比如計算定積分,就必須事先構造一個人為的概率過程,它的某些參量正好是所要求問題的解。即要將不具有隨機性質的問題轉化為隨機性質的問題。
實現從已知概率分佈抽樣
構造了概率模型以後,由於各種概率模型都可以看作是由各種各樣的概率分佈構成的,因此產生已知概率分佈的隨機變量(或隨機向量),就成為實現蒙特卡羅方法模擬實驗的基本手段,這也是蒙特卡羅方法被稱為隨機抽樣的原因。最簡單、最基本、最重要的一個概率分佈是(0,1)上的均勻分佈(或稱矩形分佈)。隨機數就是具有這種均勻分佈的隨機變量。隨機數序列就是具有這種分佈的總體的一個簡單子樣,也就是一個具有這種分佈的相互獨立的隨機變數序列。產生隨機數的問題,就是從這個分佈的抽樣問題。在計算機上,可以用物理方法產生隨機數,但價格昂貴,不能重複,使用不便。另一種方法是用數學遞推公式產生。這樣產生的序列,與真正的隨機數序列不同,所以稱為偽隨機數,或偽隨機數序列。不過,經過多種統計檢驗表明,它與真正的隨機數,或隨機數序列具有相近的性質,因此可把它作為真正的隨機數來使用。由已知分佈隨機抽樣有各種方法,與從(0,1)上均勻分佈抽樣不同,這些方法都是藉助於隨機序列來實現的,也就是説,都是以產生隨機數為前提的。由此可見,隨機數是我們實現蒙特卡洛樹搜索的基本工具。
建立各種估計量
一般説來,構造了概率模型並能從中抽樣後,即實現模擬實驗後,我們就要確定一個隨機變量,作為所要求的問題的解,我們稱它為無偏估計。建立各種估計量,相當於對模擬實驗的結果進行考察和登記,從中得到問題的解。 [2] 

蒙特卡洛樹搜索搜索應用

通常蒙特卡洛樹搜索通過構造符合一定規則的隨機數來解決數學上的各種問題。對於那些由於計算過於複雜而難以得到解析解或者根本沒有解析解的問題,蒙特卡洛樹搜索是一種有效的求出數值解的方法。一般蒙特卡洛樹搜索在數學中最常見的應用就是蒙特卡羅積分。
蒙特卡羅算法表示採樣越多,越近似最優解。舉個例子,假如筐裏有100個蘋果,讓我每次閉眼拿1個,挑出最大的。於是我隨機拿1個,再隨機拿1個跟它比,留下大的,再隨機拿1個……我每拿一次,留下的蘋果都至少不比上次的小。拿的次數越多,挑出的蘋果就越大,但我除非拿100次,否則無法肯定挑出了最大的。這個挑蘋果的算法,就屬於蒙特卡羅算法。告訴我們樣本容量足夠大,則最接近所要求解的概率。
蒙特卡洛樹搜索在金融工程學宏觀經濟學,生物醫學,計算物理學(如粒子輸運計算、量子熱力學計算、空氣動力學計算)等領域也應用廣泛。
計算機技術的發展,使得蒙特卡洛樹搜索在最近10年得到快速的普及。現代的蒙特卡洛樹搜索,已經不必親自動手做實驗,而是藉助計算機的高速運轉能力,使得原本費時費力的實驗過程,變成了快速和輕而易舉的事情。它不但用於解決許多複雜的科學方面的問題,也被項目管理人員經常使用。
藉助計算機技術,蒙特卡洛樹搜索實現了兩大優點:
一是簡單,省卻了繁複的數學報導和演算過程,使得一般人也能夠理解和掌握;
二是快速。簡單和快速,是蒙特卡羅方法在現代項目管理中獲得應用的技術基礎。 [2] 
參考資料
  • 1.    郭生良. γ能譜的蒙特卡羅計算方法探討與模擬軟件設計[D].成都理工大學,2008.
  • 2.    楊衡. 蒙特卡羅模擬優化與風險決策分析的應用研究[D].天津大學,2004.