2ヶ月前
対象検出の改善を目的とした局所-全局対比学習
Triantafyllidou, Danai ; Parisot, Sarah ; Leonardis, Ales ; McDonagh, Steven

要約
視覚ドメインのギャップはしばしば物体検出の性能に影響を与えます。画像間変換はこの影響を軽減することができ、コントラスティブアプローチは非監督体制下での画像間マッピング学習を可能にします。しかし、既存の方法では、複数の物体インスタンスが含まれるコンテンツ豊富なシーンを処理することがしばしば困難であり、これが不十分な検出性能につながることがあります。このようなインスタンスレベルのコンテンツに対する感度は通常、物体アノテーションを通じてのみ得られますが、アノテーションを得ることはコストがかかります。この問題に対処するために、クロスドメイン物体検出を特に対象とした新しい画像間変換手法を提案します。当手法は空間注意マスクを使用して物体インスタンスの外観を最適化する帰納的先験知識を持つコントラスティブ学習フレームワークとして定式化されます。これにより、シーンがターゲットとなる物体インスタンスに関連する前景領域と背景の非物体領域に暗黙的に分割されます。当手法では、翻訳中に物体インスタンスを明示的に考慮するために物体アノテーションに依存することなく、局所-全体情報のコントラストによって物体表現を学習します。これにより、未探索の課題であるドメインシフト下での高性能な検出を実現し、物体アノテーションや検出器モデルの微調整に依存せずに調査することができます。我々は3つの挑戦的なベンチマークで複数のクロスドメイン物体検出設定について実験を行い、最先端の性能を報告しています。プロジェクトページ: https://local-global-detection.github.io