複製鏈接
請複製以下鏈接發送給好友

隨機逼近

(隨機逼近)

鎖定
隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時,用逐步逼近的方式估計參數的方法。
中文名
隨機逼近
外文名
stochastic approximation
方    式
逐步逼近
背    景
隨機誤差干擾
作    用
估計某一特定值
屬    性
數理統計方法
研究時間
1951年

隨機逼近簡介

隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時,用逐步逼近的方式估計參數的方法。
1951年,H.羅賓斯和S.門羅首先研究了此問題的一種形式:設因素x的值可由試驗者控制,x的“響應”的指標值為Y ,當取x之值x進行試驗時,響應Y可表為Y=h(x)+ε ,式中h(x) 為一未知函數, ε 為隨機誤差。
設目標值為A ,要找這樣的x ,使h(x)=A。分別以Y-Ah(x)-A代替Yh(x) 。不妨設A=0 ,問題就在於找方程h(x)=0 的根x。例如若x為施藥量,Y為衡量藥物反應的某種生理指標,則問題在於找出施藥量x ,以使該生理指標控制於適當的值A

隨機逼近典型問題

典型的隨機逼近問題可描述為:
是同分布的隨機序列,已知εt 和 x 的某一函數
,欲求
的解,式中 E 表示對εt求數學期望,但並不知道
的分佈,函數
的確切形式也可能是未知的,然而,對任何選定的 x 值,都能得到(或觀測到)
的值。例如,觀測值為
,要求從觀測值估計出參數 x,則取隨機逼近算法
式中數列
1951年,羅賓斯(Robbins,H.) 和門羅(Monro,S.) 對
加了一定條件後證明
這時隨機逼近的奠基工作。
在有的問題中,要找到的不是 h(x) 的零點,而是
的極值點
,它滿足
這時觀測到的仍是
,而不是
,故上述算法已不能用於逼近
。基弗 (Kiefer,J.C.) 和維爾弗維茨 (Wolfowitz,J.) 給出求極值的逼近算法
數列 at 滿足上述同樣條件則可逼近極值點

隨機逼近深入的研究

1951年以來,隨機逼近的研究已取得了很大的進展。在理論上,討論了量測誤差不獨立的情形和帶約束條件的情形,以及h(x) 具有更一般性質的情形。也考慮了時間連續時的算法和修正係數bj 的選擇,並對算法的漸近性質作了深入的研究。在方法上,也從純概率發展到結合使用微分方程等工具。
從羅賓斯、門羅以來,隨機逼近的研究進一步取得了很大進展。討論了觀測誤差不獨立的情況和帶約束條件的情況,以及 h(x) 具有更一般性質的情形,並且把概率的方法結合使用了微分方程等工具。隨機逼近在最優化問題、系統辨識、適應控制器等方面都有應用。