
人物検索(Person Search)は、現実的でクロップされていない画像から、クエリとして指定された人物を同時に局所化し、識別することを目的としています。この目的を達成するため、最先端のモデルは、Faster R-CNNなどの二段階検出器に再識別(re-id)ブランチを追加する手法を採用しています。ROI-Align処理により、再識別特徴量が対応する物体領域と明示的にアライメントされるため、高い精度が得られますが、同時に多数の物体アンカー(dense object anchors)による計算負荷の増大という課題も生じます。本研究では、この困難なタスクを効率的に解決するため、アンカーなし(anchor-free)アプローチを提示し、以下の独自の設計を導入しています。第一に、本フレームワークの基盤として、アンカーなし検出器(具体的にはFCOS)を採用しました。密集した物体アンカーが存在しないため、従来の人物検索モデルと比較して著しく高い効率性を発揮します。第二に、このアンカーなし検出器を直接人物検索に適用する際には、頑健な再識別特徴量を学習する上でいくつかの主要な課題が生じます。これらを、スケール、領域、タスクの各レベルにおけるアライメント不整合(misalignment issues)として整理しました。これらの課題に対処するため、より判別力と頑健性に優れた特徴埋め込みを生成する「アライメント特徴集約モジュール」を提案しました。これにより、本モデルを「特徴アライメント人物検索ネットワーク(Feature-Aligned Person Search Network, AlignPS)」と命名しました。第三に、アンカーありモデルとアンカーなしモデルの利点を調査した結果、AlignPSにROI-Alignヘッドを追加することで、再識別特徴量の頑健性が顕著に向上することを確認しました。同時に、モデルの高い効率性を維持しています。本研究では、2つの難易度の高いベンチマーク(CUHK-SYSUおよびPRW)上で広範な実験を実施した結果、最先端または競争力のある性能を達成しつつ、高い効率性を示しました。本研究のすべてのソースコード、データ、および学習済みモデルは、以下のURLから公開されています:https://github.com/daodaofr/alignps。