反饋

共軛梯度法

共軛梯度法（Conjugate Gradient）是介於最速下降法與牛頓法之間的一個方法，它僅需利用一階導數信息，但克服了最速下降法收斂慢的缺點，又避免了牛頓法需要存儲和計算Hesse矩陣並求逆的缺點，共軛梯度法不僅是解決大型線性方程組最有用的方法之一，也是解大型非線性最優化最有效的算法之一。在各種優化算法中，共軛梯度法是非常重要的一種。其優點是所需存儲量小，具有步收斂性，穩定性高，而且不需要任何外來參數。

中文名: 共軛梯度法
外文名: Conjugate gradient method
提出者: Hestenes和Stiefle

提出時間: 1952年
用於: 解正定係數矩陣的線性方程組
應用學科: 數學
定義: 介於最速下降法與牛頓法之間的一個方法

目錄

5 例子

共軛梯度法簡介

共軛梯度法最早是由Hestenes和Stiefle提出來的，在這個基礎上，Fletcher和Reeves （1964）^[1] 首先提出瞭解非線性最優化問題的共軛梯度法。由於共軛梯度法不需要矩陣存儲，且有較快的收斂速度和二次終止性等優點，現在共軛梯度法已經廣泛地應用於實際問題中。

共軛梯度法是一個典型的共軛方向法，它的每一個搜索方向是互相共軛的，而這些搜索方向d僅僅是負梯度方向與上一次迭代的搜索方向的組合，因此，存儲量少，計算方便。

共軛梯度法方法的表述

共軛梯度法簡述

設我們要求解下列線性系統^[2]

，

其中n-×-n矩陣A是對稱的（也即A^T=A），正定的（也即x^TAx> 0對於所有非0向量x屬於R），並且是實係數的。

將系統的唯一解記作x_*。

共軛梯度法最後算法

經過一些簡化，可以得到下列求解Ax=b的算法，其中A是實對稱正定矩陣。

x₀= 0

k= 0

r₀=b-Ax

直到r_k足夠小：

k=k+1

ifk = 1

p₁=r₀

else

end if

其中x_k=x_k-1+ α_kp_k，r_k=r_k-1- α_kAp_k。

end repeat

結果為x_k。

共軛梯度法作為直接法

我們説兩個非零向量u和v是共軛的（相對於A），如果

由於A是對稱和正定的，所以左側定義了內積：

當且僅當它們相對於該內積正交時，兩個向量是共軛的。共軛是一個對稱關係：如果u與v共軛，則v與u共軛。假設

是一組n維共軛向量。那麼P 組成了

的基，在此基礎上我們表述

解x_∗為：

基於這個擴展，我們計算：

其中：

這給出了求解方程的以下方法：Ax = b：找到n個共軛方向的序列，然後計算係數α_k。

共軛梯度法作為迭代法

如果我們仔細選擇共軛向量p_k，那麼我們可能不需要所有這些來獲得解x_*的好的近似值。因此，我們將共軛梯度法視為迭代法。這也使我們能夠大致解決n大到非常大的系統，因為直接方法花費太多時間。

我們假設x₀是x_∗的初始值，我們可以不失一般性的假設x₀=0(否則，考慮用系統Az=b−Ax₀代替)。

我們從x₀開始搜索解決方案，在每次迭代中，我們需要一個指標來告訴我們我們是否更接近解決方案x_*（這對我們來説是未知的）。

該度量來自於以下事實：解x *也是以下二次函數的唯一最小值：

這表明在x = x₀處採用第一基矢量p₀為f的梯度的負值。 f的梯度等於Ax-b。從“猜測的解決方案”x₀開始（如果我們沒有理由猜測其他任何東西，我們總是猜測x₀ = 0），這意味着我們取p₀ = b - Ax₀。

在此基礎上的其他向量將與梯度共軛，因此稱為共軛梯度法。

讓r_k成為第k步的殘差：

注意，r_k是x = x_k處的f的負梯度，因此梯度下降法將是沿r_k方向移動。在這裏，我們堅持方向p_k彼此共軛。我們還要求下一個搜索方向由當前的殘差和所有先前的搜索方向構成，這在實踐中是足夠合理的。

共軛約束是一種正交類型約束，因此該算法與Gram-Schmidt正交歸一化相似。

給出以下表達式：

按照這個方向，下一個最佳位置由下式給出：

其中

由於p_k和x_k是共軛的，所以最後一個等式成立。

共軛梯度法例子

考慮線性系統Ax = b由下式給出

我們將從初始猜測開始執行共軛梯度法的兩個步驟：

以便找到系統的近似解決方案。

作為參考，確切的解決方案是：

我們的第一步是計算與x₀相關的殘差向量r₀。該殘差由公式r₀ = b-Ax₀計算，在該情況下等於

由於這是第一次迭代，我們將使用剩餘向量r₀作為初始搜索方向p₀；選擇p_k的方法將在進一步的迭代中改變。

我們現在使用關係計算標量α₀：

我們現在可以使用公式計算x₁：

該結果完成了第一次迭代，結果是對系統的“改進”近似解。我們現在可以使用公式來移動並計算下一個殘差向量r₁：

我們的這個過程的下一步是計算最終用於確定下一個搜索方向p₁的標量β₀。

現在，使用這個標量β₀，我們可以使用關係計算下一個搜索方向p₁，

我們現在使用與用於α₀的方法相同的方法，使用我們新獲取的p₁來計算標量α₁。

最後，我們使用與用於查找x₁相同的方法計算x₂。

結果x₂是系統解決方案中比x₁和x₀更好的近似值。

如果在該示例中使用精確的算術而不是有限的精度，那麼在n = 2次迭代之後（n是系統的順序）理論上將達到精確的解。

參考資料

1. Magnus R. Hestenes and Eduard Stiefel（1952）,Methods of conjugate gradients for solving linear systems, J. Research Nat. Bur. Standards 49, 409–436.
2. Kendell A. Atkinson（1988）,An introduction to numerical analysis（2nd ed.）,Section 8.9, John Wiley and Sons. ISBN 0-471-50023-2.

共軛梯度法的概述圖

共軛梯度法的概述圖（2張）

詞條統計

瀏覽次數：次
編輯次數：33次歷史版本
最近更新：飞熊李李（2022-10-24）

1 簡介
2 方法的表述: 2.1 簡述; 2.2 最後算法
3 作為直接法
4 作為迭代法
5 例子

百科協議隱私協議意見反饋

清除歷史記錄關閉