
要約
人物検索においては、あるシーンに存在する照合対象人物を、他のギャラリー・シーン群から特定することを目指す。この検索処理のコストはギャラリー・シーンの数に依存するため、候補となるシーンのプールを小さくすることが重要となる。本研究では、効率的に検索プロセスから不適切なギャラリー・シーンを除外できる新規モジュール「ギャラリー・フィルター・ネットワーク(Gallery Filter Network: GFN)」を提案し、その有効性を実証する。GFNは、残存するシーン内で検出された人物に対するスコアリング性能の向上にも寄与する。異なるリトリーバル・セット(クロスカメラ、遮蔽、低解像度など)を用いた実験により、GFNが多様な条件下でも堅牢であることを示した。さらに、元のSeqNetモデルを改善・簡素化したベースラインモデルとして「SeqNeXt」を構築した。標準的なPRWおよびCUHK-SYSU人物検索データセットにおいて、SeqNeXt+GFNの組み合わせが、他の最先端手法と比較して顕著な性能向上を達成することを実証した。本研究および他のモデルの実験を支援するため、人物検索研究で一般的に用いられるデータ処理および評価パイプラインを標準化したツールキットも提供している。