-
吉布斯採樣
鎖定
- 中文名
- 吉布斯採樣
- 外文名
- Gibbs sampling
- 領 域
- 人工智能
- 提出者
- 斯圖爾特·傑曼與唐納德·傑曼
- 目 的
- 聯合分佈的採樣
- 有關術語
- Metropolis–Hastings算法
吉布斯採樣簡介
採樣是以一定的概率分佈,看發生什麼事件。吉布斯採樣常用於統計推斷(尤其是貝葉斯推斷)之中。這是一種隨機化算法,與最大期望算法等統計推斷中的確定性算法相區別。與其他MCMC算法一樣,吉布斯採樣從馬爾科夫鏈中抽取樣本,可以看作是Metropolis–Hastings算法的特例,可以由馬爾科夫鏈和概率轉移矩陣的性質推出其採樣分佈最終收斂於聯合分佈。該算法的名稱源於約西亞·威拉德·吉布斯,由斯圖爾特·傑曼與唐納德·傑曼兄弟於1984年提出。吉布斯採樣適用於條件分佈比邊緣分佈更容易採樣的多變量分佈。在統計學和統計物理學中,gibbs抽樣是馬爾可夫鏈蒙特卡爾理論(MCMC)中用來獲取一系列近似等於指定多維概率分佈(比如2個或者多個隨機變量的聯合概率分佈)觀察樣本的算法。吉布斯採樣算法識別模體的基本原理通過隨機採樣不斷更新模體模型及其在各條輸入序列中出現的位置,優化目標函數,當滿足一定的迭代終止條件或者達到最大迭代次數時就得到了最終所求的模體。吉布斯採樣算法是一種啓發式學習方法,它假定每一條序列只包含一個特定長度的模體實例,在各條序列上隨機選取一個模體的起始位置,這樣便得到了初始訓練集,然後通過更新步驟和採樣步驟迭代改進模體模型
[1]
。假設我們需要從聯合分佈
中抽取
的
個樣本,記第i個樣本為
。吉布斯採樣的過程則為:
確定初始值
;假設已得到樣本
,記下一個樣本為
,於是可將其看作一個向量,對其中某一分量
,可通過在其他分量已知的條件下該分量的概率分佈來抽取該分量。對於此條件概率,我們使用樣本
,中已得到的分量
到
以及上一樣本
中的分量
到
,即
。重複上述過程 k次。如果僅考慮其中部分變量,則可以得到這些變量的邊緣分佈。此外,我們還可以對所有樣本求某一變量的平均值來估計該變量的期望。
吉布斯採樣馬爾科夫蒙特卡洛
馬爾科夫蒙特卡洛(Markov chain Monte Carlo,MCMC)方法(含隨機遊走蒙特卡洛方法)是一組用馬氏鏈從隨機分佈取樣的算法,之前步驟的作為底本。步數越多,結果越好。創建一個具有期望屬性的馬氏鏈並非難事,難的是如何決定通過多少步可以達到在許可誤差內的穩定分佈。一個好的馬氏鏈具有快速混合——從開始階段迅速獲得的一個穩定狀態。因於初始樣本,最常見的MCMC取樣只能近似得到分佈。複雜的MCMC改進算法如過往耦合,但是會消耗更多的計算資源和時間。典型用法是模擬一個隨機行走的行人來進行路徑優化等。每一步都算作是一個狀態。而統計經過次數最多的地方將在下一步中更有可能為目的地。馬氏蒙特卡洛方法是一種結合了蒙特卡羅法的解決方案。但不同於以往的蒙特卡洛integration是統計獨立的,MCMC中的是統計相關的。MCMC方法是使用馬爾科夫鏈的蒙特卡羅積分,其基本思想是:構造一條Markov鏈使其平穩分佈為待估參數的後驗分佈,通過這條馬爾科夫鏈產生後驗分佈的樣本,並基於馬爾科夫鏈達到平穩分佈時的樣本(有效樣本)進行蒙特卡羅積分。