15日前
Top-DB-Net:Person Re-Identificationにおける活性化強化のためのTop DropBlock
Rodolfo Quispe, Helio Pedrini

要約
人物再識別(Person Re-Identification)は、重複しない複数のカメラから構成されるシステム内で、クエリ画像に該当するすべての人物インスタンスを検索するという困難なタスクである。視点の変化が極端に大きくなる場合、人物を照合するのに有用な局所領域が抑制されてしまうことが多く、その結果、情報量の少ない領域に基づいて画像間の類似性を評価しなければならない状況に陥る。本研究では、Top DropBlockに基づくTop-DB-Netを提案する。この手法は、ネットワークがシーンの前景に注目するよう促すとともに、特にタスクに最も関連性の高い領域に焦点を当てることを重視しつつ、情報量の少ない領域も高判別性を有する特徴で符号化することを可能にする。Top-DB-Netは3つのストリームから構成される:(i) グローバルストリームはバックボーンを通じて豊富な画像情報を符号化し、(ii) Top DropBlockストリームはバックボーンが情報量の少ない領域に対しても高判別性の特徴を学習するように促進し、(iii) 正則化ストリームは、第2のストリームのドロップ処理によって生じるノイズに対処する。テスト時には、第1および第2のストリームが使用され、第3のストリームがそのノイズを抑制する役割を果たす。3つの難易度の高いデータセットにおける広範な実験結果から、本手法が最先端の手法と比較して優れた性能を発揮することが示された。定性的な結果も、本手法が入力画像の信頼性の高い部分に集中したより優れた活性マップを生成することを示している。