
要約
適応型オブジェクト検出の進展は、検出パイプラインにおける分布シフトを軽減するため、自律走行などの応用分野に著しい改善をもたらす可能性がある。従来の研究では、画像特徴をグローバルおよびローカルレベルで敵対的学習により統合する手法が採用されてきたが、個々のインスタンス特有の不整合は依然として残存している。さらに、背景シーンの視覚的多様性やオブジェクトの複雑な組み合わせにより、適応型オブジェクト検出は依然として困難な課題である。構造的重要性に着目し、本研究では、個々のインスタンスに特有の重要な領域に注目することにより、特徴の不整合問題を克服することを目指す。そこで、適応型オブジェクト検出を目的とした新しいリサイダル自己注意特徴統合手法(ResIduaL seLf-attentive featUre alignMEnt, ILLUME)を提案する。ILLUMEは、自己注意特徴マップ(Self-Attention Feature Map, SAFM)モジュールを含み、オブジェクト関連領域に対する構造的注目を強化することで、ドメイン不変な特徴を生成する。本手法は、インスタンスの特徴統合を改善し、ドメイン間距離を顕著に低減する。定性的な結果から、ILLUMEが統合に必要な重要なオブジェクトインスタンスに適切に注目できることを示している。複数のベンチマークデータセットにおける実験結果から、本手法が既存の最先端手法を上回ることを確認した。