複製鏈接
請複製以下鏈接發送給好友

HOG

(方向梯度直方圖)

鎖定
方向梯度直方圖(Histogram of Oriented Gradient, HOG)特徵是一種在計算機視覺和圖像處理中用來進行物體檢測的特徵描述子。HOG特徵通過計算和統計圖像局部區域的梯度方向直方圖來構成特徵。
中文名
方向梯度直方圖
外文名
Histogram of Oriented Gradient
外語縮寫
HOG
領    域
圖像處理,特徵提取
年    代
2005年
作    者
Navneet Dalal & Bill Triggs

HOGHOG特徵的簡介

1、主要思想:
在一副圖像中,局部目標的表象和形狀能夠被梯度或邊緣的方向密度分佈很好地描述。其本質為:梯度的統計信息,而梯度主要存在於邊緣的地方。
Hog特徵結合SVM分類器已經被廣泛應用於圖像識別中,尤其在行人檢測中獲得了極大的成功。
2、實現方法:
首先將圖像分成小的連通區域,這些連通區域被叫做細胞單元。然後採集細胞單元中各像素點的梯度的或邊緣的方向直方圖。最後把這些直方圖組合起來,就可以構成特徵描述符。
3、性能提高:
將這些局部直方圖在圖像的更大的範圍內(叫做區間)進行對比度歸一化,可以提高該算法的性能,所採用的方法是:先計算各直方圖在這個區間中的密度,然後根據這個密度對區間中的各個細胞單元做歸一化。通過這個歸一化後,能對光照變化和陰影獲得更好的效果。

HOGHOG特徵的優點

與其他的特徵描述方法相比,HOG有很多優點。
首先,由於HOG是 在圖像的局部方格單元上操作,所以它對圖像幾何的和光學的形變都能保持很好的不變性,這兩種形變只會出現在更大的空間領域上。
其次,在粗的空域抽樣、精細 的方向抽樣以及較強的局部光學歸一化等條件下,只要行人大體上能夠保持直立的姿勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響 檢測效果。
因此HOG特徵是特別適合於做圖像中的人體檢測的 。

HOGHOG特徵的提取與計算步驟

HOG特徵提取的流程圖 HOG特徵提取的流程圖
HOG特徵的具體提取步驟如下: [1] 
1、色彩和伽馬歸一化
為了減少光照因素的影響,首先需要將整個圖像進行規範化(歸一化)。在圖像的紋理強度中,局部的表層曝光貢獻的比重較大,所以,這種壓縮處理能夠有效地降低圖像局部的陰影和光照變化。
2、計算圖像梯度
計算圖像橫座標和縱座標方向的梯度,並據此計算每個像素位置的梯度方向值;求導操作不僅能夠捕獲輪廓,人影和一些紋理信息,還能進一步弱化光照的影響。
最常用的方法是:簡單地使用一個一維的離散微分模板在一個方向上或者同時在水平和垂直兩個方向上對圖像進行處理,更確切地説,這個方法需要使用濾波器核濾除圖像中的色彩或變化劇烈的數據
3、構建方向的直方圖
星型細胞單元 星型細胞單元
細胞單元中的每一個像素點都為某個基於方向的直方圖通道投票。投票是採取加權投票的方式,即每一票都是帶有權值的,這個權值是根據該像素點的梯度幅度計算出來。可以採用幅值本身或者它的函數來表示這個權值,實際測試表明: 使用幅值來表示權值能獲得最佳的效果,當然,也可以選擇幅值的函數來表示,比如幅值的平方根、幅值的平方、幅值的截斷形式等。細胞單元可以是矩形的,也可以是星形的。直方圖通道是平均分佈在0-1800(無向)或0-3600(有向)範圍內。經研究發現,採用無向的梯度和9個直方圖通道,能在行人檢測試驗中取得最佳的效果。
4、將細胞單元組合成大的區間
R-HOG R-HOG
由於局部光照的變化以及前景-背景對比度的變化,使得梯度強度的變化範圍非常大。這就需要對梯度強度做歸一化。歸一化能夠進一步地對光照、陰影和邊緣進行壓縮。
採取的辦法是:把各個細胞單元組合成大的、空間上連通的區間。這樣,HOG描述符就變成了由各區間所有細胞單元的直方圖成分所組成的一個向量。這些區間是互有重疊的,這就意味着:每一個細胞單元的輸出都多次作用於最終的描述器。
C-HOG C-HOG
區間有兩個主要的幾何形狀——矩形區間(R-HOG)和環形區間(C-HOG)。R-HOG區間大體上是一些方形的格子,它可以有三個參數來表徵:每個區間中細胞單元的數目、每個細胞單元中像素點的數目、每個細胞的直方圖通道數目。
5、收集HOG特徵
把提取的HOG特徵輸入到SVM分類器中,尋找一個最優超平面作為決策函數。

HOGR-HOG與C-HOG

R- HOG 跟SIFT描述器看起來很相似,但他們的不同之處是:R-HOG是在單一尺度下、密集的網格內、沒有對方向排序的情況下被計算出來;而SIFT描述器是在多尺度下、稀疏的圖像關鍵點上、對方向排序的情況下被計算出來。另外,R-HOG是各區間被組合起來用於對空域信息進行編碼,而SIFT的各描述器是單獨使用的。
C- HOG區間有兩種不同的形式,它們的區別在於:一個的中心細胞是完整的,一個的中心細胞是被分割的。經研究發現 C-HOG的這兩種形式都能取得相同的效果。C-HOG區間可以用四個參數來表徵:角度盒子的個數、半徑盒子個數、中心盒子的半徑、半徑的伸展因子。通過實驗,對於行人檢測,最佳的參數設置為:4個角度盒子、2個半徑盒子、中心盒子半徑為4個像素、伸展因子為2。此外,對於R- HOG,中間加一個高斯空域窗口是非常有必要的,但對於C-HOG,這顯得沒有必要。C-HOG看起來很像基於形狀上下文的方法,但不同之處是:C-HOG的區間中包含的細胞單元有多個方向通道,而基於形狀上下文的方法僅僅只用到了一個單一的邊緣存在數。

HOGHOG特徵的總結

Dalal提出的HOG特徵提取的過程:把樣本圖像分割為若干個像素的單元,把梯度方向平均劃分為多個區間,在每個單元裏面對所有像素的梯度方向在各個方向區間進行直方圖統計,得到一個多維的特徵向量,每相鄰的單元構成一個區間,把一個區間內的特徵向量聯起來得到多維的特徵向量,用區間對樣本圖像進行掃描,掃描步長為一個單元。最後將所有塊的特徵串聯起來,就得到了人體的特徵。至今雖然有很多行人檢測算法,但基本都是以HOG+SVM的思路為主。
參考資料
  • 1.    謝鳳英.數字圖像處理及應用:電子工業出版社,2014年