
要約
クロスドメインの弱教師あり物体検出は、完全にラベル付けされたソースドメインデータセット(すなわち、物体のバウンディングボックスが付与されたもの)から得られる物体レベルの知識を、弱教師ありのターゲットドメイン(画像レベルのラベルのみが付与されたもの)に適応させ、そのドメイン用の物体検出器を学習することを目的としている。従来の研究で広く採用されているドメインレベルの分布マッチングではなく、より精度の高い知識転送を実現するため、ピクセル単位のクロスドメイン対応関係を学習する手法を提案する。この手法は、領域競合として学習される新しいクロスドメイン相互注意機構によって実現される。この機構では、クロスドメイン対応モジュールがターゲットドメイン画像上の情報量の多い特徴を探索し、それをソースドメイン画像に変換した際に、そのラベル付けを最もよく説明できるようにする。一方、協調的なマスク生成器は、ターゲット画像の関連領域をマスクして、残りの特徴が情報量を持たない状態にすることを競う。この競合学習により、クロスドメイン画像ペアにおける前景全体の正確な対応関係が強調され、ターゲットドメインにおける物体の正確な範囲が明らかになる。ドメイン間対応関係学習における曖昧性を軽減するために、より信頼性の高いドメイン内対応関係を活用するためのドメインサイクル一貫性正則化項も提案する。実験により、様々なデータセット上で既存手法と比較して、提案手法が著しい改善を示している。