複製鏈接
請複製以下鏈接發送給好友

最優性原理

鎖定
最優性原理是指“多階段決策過程的最優決策序列具有這樣的性質:不論初始狀態和初始決策如何,對於前面決策所造成的某一狀態而言,其後各階段的決策序列必須構成最優策略”。
中文名
最優性原理
外文名
optimality principle
方    法
反證法
內    容
多階段決策過程的最優決策序列
性    質
動態規劃的基礎
應用學科
數學術語

目錄

最優性原理概念

一個最優決策應具有這樣的性質,不管初始狀態和初始決策如何,剩下的決策(整個最優決策中的一部分)對於從這一級開始的後續多級過程,仍然是一個最優決策。應用最優性原理,可以把多級決策問題的求解過程看作是一個連續遞推過程,由後向前逐級推算。在求解過程中,前一級的決策和輸出狀態只是後一級的初始條件(初始狀態),並不影響後續子過程的最優決策。 [1] 

最優性原理基本原理

維離散系統為
要求確定最優控制
,使性能指標
最小。式中,
是固定的;
不受限制(或
)。
為達到終端狀態
的末級性能指標,即有
時,得到
由於控制變量
對當前狀態
無作用,只能改變後續狀態變量
的值,而且控制變量
必然是當前狀態
的函數,記最優控制得到的性能指標為
採用同樣的方法,得到遞推公式
上式稱為貝爾曼遞推方程,它是動態規劃的基本遞推關係式。由已知的
級過程的最優性能指標
,根據遞推公式確定最優控制,就可得到
級過程的最優性能指標
。動態規劃的尋優算法是從末級過程開始的,然後,根據
式子逐級倒推,最終得到多級過程的最優決策和最優性能指標。遞推公式明確指出,每一步倒推時,並不是孤立地考慮當前級的過程,而是從該級到最後一級所有過程的整體的最優決策,使“整體”的性能指標最優。
動態規劃的遞推公式再一次重申了一個重要概念——嵌入原理原理,就是説,
既然表示初始狀態為
的一個
級過程中,從第
級開始的最後
級過程的最優性能指標,又表示初始狀態為
級的最優性能指標。嵌入原理的內容是,當
時,一個
級過程的最優決策和最優性能指標是被嵌入在一個
級過程的最優決策過程之中的。 [1] 
參考資料
  • 1.    王曉陵,陸軍主編.最優化方法與最優控制:人民郵電出版社,2008.04