反饋

最大值原理

最優控制中的最大值原理，是在目標泛函的最大化問題中得到最優控制的必要條件是使哈密頓函數達最大值而得名的。它被廣泛應用於開放式捕魚以及日常實際問題求最優策略的解決過程中，但是雖然它解決了古典變分法所遇到的困難，給出了最優控制問題解的必要條件，卻絕非充分條件，在應用中也具有一定侷限性。

中文名: 最大值原理
外文名: principle of the maximum
學科: 控制科學與工程

基本釋義: 求某個參數最值的問題
主要函數: 哈密頓函數
類別: 最優控制

目錄

1 最大值原理的內涵
2 最大值原理與哈密頓函數

3 最大值原理求最優策略的步驟
4 最大值原理的侷限性

最大值原理最大值原理的內涵

設系統的狀態方程為:

控制u屬於

中的某個有界閉集U，最優控制問題是求u∈U，使得

最小。

假設f(x,u,t)的分量為

並假設

都是其自變量的連續函數。用u*、x*分別表示最優控制和最優軌跡，則u*使J(u)取最小值的必要條件是：

（1）存在協狀態向量λ*(t)，它和x*(t)，u *(t)一起滿足正則方程

（2）哈密頓函數作為u的函數在u=u*(t)取最小值，即

（3）正則方程的邊界條件：

a.若

是給定的，則邊界條件為

b.如果tf給定，x(tf)自由，那麼邊界條件為

c.如果tf也是自由的，還要加一個條件：

以確定tf。

d.如果要求x(tf)落在m維流型S上，

那麼邊界條件為

如果tf是自由的，再增加條件

可以看出，上述的正則方程和邊界條件與u無約束的情況用變分法導出的完全相同。

最大值原理最大值原理與哈密頓函數

如果最優控制問題是求u∈U，使得目標函數J(u)最大，在最大值原理中，最優控制u*應使哈密頓函數值最大，即

對區間[t0 ,tf]上的所有t成立，其含義是：對於由最優控制u=u*(t)引發的x*(t)和協狀態λ*（t），哈密頓函數作為u函數，在u=u*(t)處取最小值。

在u為標量的情況，必要條件的含義是：在特定的時刻t和特定的x*(t)、λ*（t）曲線，哈密頓函數的右端可以看做u的函數，最優控制u*(t)使它取最小值

當U為閉區間[a,b]時，允許的控制滿足

哈密頓函數僅作為u的函數，有如圖《函數情況》所示的三種情況：

函數情況

函數情況

第一種情況：哈密頓函數的最小值在區間[a,b]內的點達到。如果哈密頓函數關於u是可微的，則必要條件為

其他兩種情況是哈密頓函數的最小值在區間[a,b]的邊界點達到，這時則必須用更廣泛的條件

也就是用條件

來描述。

最大值原理最大值原理求最優策略的步驟

當x(tf)是自由的時，應用最大值原理求最優策略的具體步驟如下：

第1步：構造系統的哈密頓函數為

第2步：由

導出決策變量u與狀態變量x、協狀態變量λ的關係，記為u=u(x,λ)。

第3步：寫出以下正則（正規）方程組為

將u=u(x,λ)帶入正則方程，解出x=x*(t),λ=λ*(t)。

第4步：將x=x*(t),λ=λ*(t)代入u=u(x,λ)得到最優策略

如果決策問題還要求滿足邊界條件x(tf)=xf ，則以這個邊界條件取代正則方程組中的條件：

最大值原理最大值原理的侷限性

最大值原理雖然解決了古典變分法所遇到的困難，但是它也只給出了最優控制問題解的必要條件，而不是充分條件，所以由最大值原理所求的控制函數不一定是最優控制，因為有可能最優控制根本不存在。如果最優控制問題的解存在，但是從這方法得到的控制函數不止一個，就需要進行逐個檢驗，從中確定出最優解，如果該問題的實際物理背景有最優控制，而從最大值原理得到的解又只有一個，那麼這個解一定是最優控制^[1] 。

參考資料

1. 呂顯瑞，黃慶道編著.最優控制理論基礎[M].科學出版社.

最大值原理的概述圖

最大值原理的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：4次歷史版本
最近更新： liu910913z （2022-10-25）

1 最大值原理的內涵
2 最大值原理與哈密頓函數
3 最大值原理求最優策略的步驟
4 最大值原理的侷限性

百科協議隱私協議意見反饋

清除歷史記錄關閉