15日前

Deep Miner: パーソン再識別のための豊富で多様な特徴をマイニングする深層かつマルチブランチネットワーク

Abdallah Benzine, Mohamed El Amine Seddik, Julien Desmarais
Deep Miner: パーソン再識別のための豊富で多様な特徴をマイニングする深層かつマルチブランチネットワーク
要約

最近の人物再識別(person re-identification)手法は、主に深層畳み込みニューラルネットワーク(CNN)の利用に基づいている。これらのネットワークは、分類や物体検出など多様なタスクにおいて有効である一方で、物体の最も判別力の高い部分にのみ注目しがちであり、すべての関連特徴を効果的に抽出するという点で限界がある。この挙動は、人物再識別タスクにおいては不利な影響を及ぼす。なぜなら、このタスクでは多様で細粒度な特徴を識別することが求められるからである。したがって、ネットワークが幅広い細部特徴を学習できるようにすることが、再識別プロセスの効果性と微細な変化に対するロバスト性を高めるために不可欠である。本稿では、CNNが人物の再識別に向けたより豊かで多様な特徴を「抽出(mine)」できるよう支援する手法である「Deep Miner」を提案する。Deep Minerは、以下の3種類のブランチから構成される:グローバルブランチ(Gブランチ)、ローカルブランチ(Lブランチ)、および入力消去ブランチ(IEブランチ)。Gブランチは初期のバックボーンに対応し、人物のグローバルな特徴を予測する。Lブランチは部位レベルの解像度の特徴を抽出する。一方、IEブランチは部分的に抑制された特徴マップを入力とし、Gブランチによって無視されがちな新たな特徴を出力として得ることを可能にする。この目的のために、特定のCNN内での特徴の識別と除去を実行する専用の抑制プロセスを導入した。この抑制プロセスは、実装が簡潔であるという大きな利点を有し、同時に最先端(SOTA)の再識別手法を顕著に上回る性能を発揮するモデルを生成する。具体的には、4つの標準的な人物再識別ベンチマークで実験を行い、SOTA手法と比較してmAPにおいて最大6.5%の絶対的な性能向上を確認した。

Deep Miner: パーソン再識別のための豊富で多様な特徴をマイニングする深層かつマルチブランチネットワーク | 最新論文 | HyperAI超神経