深層学習による人物再識別:サーベイと今後の展望

人物再識別(Person Re-identification, Re-ID)は、複数の重複しないカメラ間で特定の人物を検索するタスクを目的としている。深層ニューラルネットワークの進展とスマートビデオ監視への需要の増加に伴い、コンピュータビジョン分野において注目が集まっている。人物Re-IDシステムの構築にあたって関与する要素を詳細に分析した結果、本研究では閉世界(closed-world)設定と開世界(open-world)設定の2つの枠組みに分類する。広く研究されてきた閉世界設定は、さまざまな研究仮定のもとで適用され、多数のデータセットにおいて深層学習技術を用いて著しい成果を上げている。本研究では、閉世界設定における人物Re-IDについて、深層特徴表現学習、深層マトリクス学習、ランク最適化の3つの視点から包括的かつ詳細なレビューと分析を行う。一方、閉世界設定における性能の飽和が進む中で、近年の研究の焦点はより現実的な状況に近い開世界設定へと移行している。この設定は、特定の実用シーンにおいてより現実的な課題を反映しており、より困難な課題を含んでいる。そこで、開世界Re-IDについて、5つの異なる側面から体系的にまとめた。既存手法の利点を分析した上で、12の異なるデータセットおよび4種類のRe-IDタスクにおいて、最先端(state-of-the-art)または同等の性能を達成する強力なAGWベースラインを提案した。さらに、正しいマッチングをすべて発見するために必要なコストを示す新たな評価指標(mINP: mean Inverse Number of Positions)を導入し、実用的なRe-IDシステムの評価に新たな基準を提供した。最後に、重要ではあるがまだ十分に検討されていないいくつかのオープンな課題についても議論した。