-
R-CNN
鎖定
- 外文名
- R-CNN
- 所屬學科
- 算法
- 全 稱
- Region-CNN
釋義
R-CNN的全稱是Region-CNN,它可以説是第一個成功將深度學習應用到目標檢測上的算法。
[1]
傳統的目標檢測方法大多以圖像識別為基礎。 一般可以在圖片上使用窮舉法選出所有物體可能出現的區域框,對這些區域框提取特徵並使用圖像識別方法分類, 得到所有分類成功的區域後,通過非極大值抑制(Non-maximumsuppression)輸出結果。
R-CNN遵循傳統目標檢測的思路,同樣採用提取框,對每個框提取特徵、圖像分類、 非極大值抑制四個步驟進行目標檢測。只不過在提取特徵這一步,將傳統的特徵(如 SIFT、HOG 特徵等)換成了深度卷積網絡提取的特徵。R-CNN 體框架如圖1所示。
[1]
對於一張圖片,R-CNN基於selective search方法大約生成2000個候選區域,然後每個候選區域被resize成固定大小,並送入一個CNN模型中,最後得到一個特徵向量。然後這個特徵向量被送入一個多類別SVM分類器中,預測出候選區域中所含物體的屬於每個類的概率值。每個類別訓練一個SVM分類器,從特徵向量中推斷其屬於該類別的概率大小。為了提升定位準確性,R-CNN最後又訓練了一個邊界框迴歸模型,通過邊框迴歸模型對框的準確位置進行修正。
[2]
- 參考資料
-
- 1. 何之源.21個項目玩轉深度學習.北京:電子工業出版社,2018年:88-90
- 2. 目標檢測 (Object Detection) 算法彙集 .CSDN.2018年08月06日[引用日期2018-12-07]