反饋

R-CNN

R-CNN的全稱是Region-CNN，是第一個成功將深度學習應用到目標檢測上的算法。R-CNN基於卷積神經網絡(CNN)，線性迴歸，和支持向量機(SVM)等算法，實現目標檢測技術。

外文名: R-CNN

所屬學科: 算法
全稱: Region-CNN

釋義

R-CNN的全稱是Region-CNN，它可以説是第一個成功將深度學習應用到目標檢測上的算法。^[1] 傳統的目標檢測方法大多以圖像識別為基礎。一般可以在圖片上使用窮舉法選出所有物體可能出現的區域框，對這些區域框提取特徵並使用圖像識別方法分類，得到所有分類成功的區域後,通過非極大值抑制(Non-maximumsuppression)輸出結果。

R-CNN遵循傳統目標檢測的思路，同樣採用提取框，對每個框提取特徵、圖像分類、非極大值抑制四個步驟進行目標檢測。只不過在提取特徵這一步，將傳統的特徵(如 SIFT、HOG 特徵等)換成了深度卷積網絡提取的特徵。R-CNN 體框架如圖1所示。^[1]

圖1

對於一張圖片，R-CNN基於selective search方法大約生成2000個候選區域，然後每個候選區域被resize成固定大小，並送入一個CNN模型中，最後得到一個特徵向量。然後這個特徵向量被送入一個多類別SVM分類器中，預測出候選區域中所含物體的屬於每個類的概率值。每個類別訓練一個SVM分類器，從特徵向量中推斷其屬於該類別的概率大小。為了提升定位準確性，R-CNN最後又訓練了一個邊界框迴歸模型，通過邊框迴歸模型對框的準確位置進行修正。^[2]

參考資料

1. 何之源．21個項目玩轉深度學習．北京：電子工業出版社，2018年：88-90
2. 目標檢測 (Object Detection) 算法彙集．CSDN．2018年08月06日[引用日期2018-12-07]

R-CNN的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：11次歷史版本
最近更新：君伟junwei521 （2023-06-21）