
要約
最近、クロスドメインオブジェクト検出の問題がコンピュータビジョン分野において注目を集めつつある。本論文では、ソースドメインのアノテーション付きデータを活用して、異なるターゲットドメイン向けのオブジェクト検出器を学習する、新たな非教師ありクロスドメイン検出モデルを提案する。提案モデルは、チャネル層の深さ次元と空間層の空間次元の両方においてクロスドメイン特徴の整合を実現することで、オブジェクト検出におけるドメイン間表現の乖離を緩和する。深さ次元(チャネル層)では、チャネル間の情報を利用して、画像スタイルの整合性を保つことでドメイン間の乖離を補完する。空間次元(空間層)では、空間アテンションモジュールを導入し、クロスドメイン特徴の整合性を考慮して検出に有用な領域を強調し、無関係な領域を抑制する。本手法は多数のベンチマーククロスドメイン検出データセット上で実験評価が行われ、実証結果から、既存の最先端手法を上回る性能を示した。