複製鏈接
請複製以下鏈接發送給好友

梯度下降法

鎖定
梯度下降法(英語:Gradient descent)是一個一階最優化算法。 要使用梯度下降法找到一個函數的局部極小值,必須向函數上當前點對應梯度(或者是近似梯度)的反方向的規定步長距離點進行迭代搜索。如果相反地向梯度正方向迭代進行搜索,則會接近函數的局部極大值點;這個過程則被稱為梯度上升法
中文名
梯度下降法
外文名
Gradient descent

目錄

梯度下降法簡介

梯度下降法(英語:Gradient descent)是一個一階最優化算法,通常也稱為最速下降法。 要使用梯度下降法找到一個函數的局部極小值,必須向函數上當前點對應梯度(或者是近似梯度)的反方向的規定步長距離點進行迭代搜索。如果相反地向梯度正方向迭代進行搜索,則會接近函數的局部極大值點;這個過程則被稱為梯度上升法 [1] 

梯度下降法描述

梯度下降方法基於以下的觀察:如果實值函數
在點
可微且有定義,那麼函數
點沿着梯度相反的方向
下降最快。
因而,如果
對於
為一個夠小數值時成立,那麼
考慮到這一點,我們可以從函數F的局部極小值的初始估計
出發,並考慮如下序列
使得
因此可得到

  
如果順利的話序列
收斂到期望的極值。注意每次迭代步長可以改變。
右側的圖片示例了這一過程,這裏假設F定義在平面上,並且函數圖像是一個形。藍色的曲線是等高線水平集),即函數F為常數的集合構成的曲線。紅色的箭頭指向該點梯度的反方向。(一點處的梯度方向與通過該點的等高線垂直)。沿着梯度下降方向,將最終到達碗底,即函數F值最小的點。 [1] 

梯度下降法參閲

參考資料
  • 1.    Avriel, Mordecai (2003). Nonlinear Programming: Analysis and Methods. Courier Corporation. ISBN 978-0-486-43227-4.