反饋

行人重識別

行人重識別（Person re-identification）也稱行人再識別，是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。廣泛被認為是一個圖像檢索的子問題。給定一個監控行人圖像，檢索跨設備下的該行人圖像。旨在彌補固定的攝像頭的視覺侷限，並可與行人檢測/行人跟蹤技術相結合，可廣泛應用於智能視頻監控、智能安保等領域。

由於不同攝像設備之間的差異，同時行人兼具剛性和柔性的特性，外觀易受穿着、尺度、遮擋、姿態和視角等影響，使得行人重識別成為計算機視覺領域中一個既具有研究價值同時又極具挑戰性的熱門課題。

中文名: 行人重識別
外文名: Person re-identification (Person re-ID)
所屬學科: 計算機科學

別名: 行人再識別
主要應用: 智能監控／智能安保
專業方向: 計算機視覺

行人重識別定義

行人重識別（Person re-identification）也稱行人再識別，是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。廣泛被認為是一個圖像檢索的子問題。^[1] 給定一個監控行人圖像，檢索跨設備下的該行人圖像。旨在彌補固定的攝像頭的視覺侷限，並可與行人檢測/行人跟蹤技術相結合^[2] ，可廣泛應用於智能視頻監控、智能安保等領域。^[3]

行人重識別發展歷史

行人重識別的研究起始於二十世紀九十年代中期。研究者們借鑑、引入了一些圖像處理、模式識別領域的成熟方法，側重研究了行人的可用特徵、簡單分類算法。自2014 年以來，行人重識別技術的訓練庫趨於大規模化，廣泛採用深度學習框架。隨着高校、研究所以及一些廠商的研究持續深入，行人重識別技術得到了飛速的發展。

海外主要的行人重識別系統的研究機構有悉尼科技大學（UTS）、倫敦瑪麗女王大學（QMUL）等；中國大陸及港澳台的主要有清華大學、北京大學、復旦大學、香港中文大學、西安交通大學、中國科學技術大學、中山大學，中科院自動化所等。

2020年，依圖科技在ReID領域取得新突破，刷新業界三大數據集當前最優成績(SOTA)，算法性能達到業界迄今最高標準，極大拓展了算法和應用的邊界^[4] ，加速行人重識別(ReID)大規模商業化落地^[4] 。

行人重識別技術難點

1. 能不能用人臉識別做重識別？

理論上是可以的。但是有兩個原因導致人臉識別較難應用：首先，廣泛存在後腦勺和側臉的情況，做正臉的人臉識別難。其次，攝像頭拍攝的像素可能不高，尤其是遠景攝像頭裏麪人臉截出來很可能都沒有32x32的像素。所以人臉識別在實際的重識別應用中很可能有限。^[5]

2.有些人靠衣服的顏色就可以判斷出來了，還需要行人重識別麼？

衣服顏色確實是行人重識別做出判斷一個重要因素，但光靠顏色是不足的。首先，攝像頭之間是有色差，並且會有光照的影響。其次，有撞衫（顏色相似）的人怎麼辦，要找細節，但比如顏色直方圖這種統計的特徵就把細節給忽略了。在多個數據集上的測試表明，光用顏色特徵是難以達到50%的top1正確率的。^[5]

行人重識別方法

行人重識別基於部件匹配的方法

基於人體在三維空間中的結構（結構信息），人體圖像可以進行分割，按部件來執行匹配。

1.常見方案是水平切割，就是將圖像切為幾個水平的條。由於人體身材往往差不多，所以可以用簡單的水平條來做一一比較。^[6]

2.在領域中做匹配，採用的是一個正方形的鄰域。^[7]

3.另一個較新的方案是先在人體上檢測部件（手，腿，軀幹等等）再進行匹配，這樣的話可以減少位置的誤差，但可能引入檢測部件的誤差。^[8]

4. 類似LSTM的attention匹配，但必須pair輸入，測試時間較長，不適合快速圖像檢索。^[9]

5. 如圖，類似人臉對齊，使用STN 將行人整個圖像先利用熱度圖對齊，再匹配。^[10-11]

行人匹配熱度圖

行人重識別基於損失函數的方法

基於高層語義信息，設置一些輔助任務，幫助模型學習到好的特徵表達。

1. 身份損失（Identification loss）直接拿身份label做多類分類。^[12]

2. 鑑定損失（Verification loss）比較兩個輸入圖像是否為同一人。^[7]

3. 身份損失（Identification loss）+鑑定損失（Verification loss），將以上兩種損失函數混合。^[13]

行人重識別

4. 三樣本損失（Triplet loss）以3個樣本為一組，同一人的圖像特徵距離應小於不同人。^[14]

5. 加入屬性任務（attribute）比如判斷是否揹包，是男生還是女生等等。人們遇見陌生人也是利用這些屬性來描述。^[15]

6. 數據增強混合多數據集訓練，加入訓練集上生成對抗網絡（GAN）生成的數據。^[16-17]

行人重識別

行人重識別數據集

行人重識別二維空間數據集

DukeMTMC-reID

該數據集在杜克大學內採集，圖像來自8個不同攝像頭。該數據集提供訓練集和測試集。訓練集包含16,522張圖像，測試集包含 17,661 張圖像。訓練數據中一共有702人，平均每類（每個人）有23.5 張訓練數據。是最大的行人重識別數據集，並且提供了行人屬性（性別/長短袖/是否揹包等）的標註。^[18]

DukeMTMC-reID數據集示例

DukeMTMC-attribute

該數據集基於DukeMTMC-reID數據集，加入了行人屬性（如性別gender/是否揹包bag等23種屬性），並且提升了DukeMTMC 行人重識別的效果。^[19]

行人重識別

Market-1501

該數據集在清華大學校園中採集，圖像來自6個不同的攝像頭，其中有一個攝像頭為低像素。同時該數據集提供訓練集和測試集。訓練集包含12,936張圖像，測試集包含19,732 張圖像。圖像由檢測器自動檢測並切割，包含一些檢測誤差（接近實際使用情況）。訓練數據中一共有751人，測試集中有750人。所以在訓練集中，平均每類（每個人）有17.2張訓練數據。^[20]