2ヶ月前

深層ニューラルネットワークモデルを用いた注目度と意味解析に基づく改善された人物再識別

Rodolfo Quispe; Helio Pedrini
深層ニューラルネットワークモデルを用いた注目度と意味解析に基づく改善された人物再識別
要約

カメラから取得した人物のビデオや画像を対象とし、異なる視点(非重複視野)のカメラで撮影されたビデオや画像から同一人物のすべてのインスタンスを検索するプロセスを、人物再識別(person re-identification)という。このタスクは、監視、鑑識、ロボティクス、マルチメディアなど様々な分野で応用されている。本論文では、注目度(saliency)と意味解析マップ(semantic parsing maps)の両方の手がかりを利用する新しいフレームワークである「注目度-意味解析再識別(Saliency-Semantic Parsing Re-Identification: SSP-ReID)」を提案する。このフレームワークは、バックボーンとなる畳み込みニューラルネットワーク(CNN)に補完的な表現学習を促進させることで、元のバックボーンよりも結果を改善することを目指している。複数の手がかりを融合するアイデアは、特定のシナリオにおいてある応答が他の応答より優れている場合があるという認識に基づいている。そのため、それらを組み合わせることにより性能向上が期待できる。本フレームワークは定義上、多様なネットワークに容易に適用可能であり、他の競合手法とは異なり、訓練プロセスは単純かつ標準的なプロトコルに従っている。我々は5つのバックボーンと3つのベンチマークを使用して本アプローチの広範な評価を行った。実験結果は、提案した人物再識別フレームワークの有効性を示している。さらに、ランキング再構成技術と組み合わせることで3つのベンチマークにおいて最先端の結果を得ていることを報告する。

深層ニューラルネットワークモデルを用いた注目度と意味解析に基づく改善された人物再識別 | 最新論文 | HyperAI超神経