2ヶ月前

コントラストとミックス:背景ミックスを用いた時系列コントラスト動画ドメイン適応

Aadarsh Sahoo; Rutav Shah; Rameswar Panda; Kate Saenko; Abir Das
コントラストとミックス:背景ミックスを用いた時系列コントラスト動画ドメイン適応
要約

無教師ドメイン適応は、ラベル付きのソースドメインで学習したモデルを完全にラベルなしのターゲットドメインに適応することを目指しており、近年大きな注目を集めています。画像に対する多くのドメイン適応手法が提案されている一方で、ビデオにおける無教師ドメイン適応の問題はまだ十分に研究されていません。本論文では、Contrast and Mix (CoMix)と呼ばれる新しい対照的学習フレームワークを紹介します。このフレームワークは、無教師ビデオドメイン適応のために判別的な不変特徴表現を学習することを目的としています。まず、既存の方法が敵対的学習に依存して特徴量をアライメントするのとは異なり、時間的な対照的学習を利用することで、異なる速度で再生された同一のラベルなしビデオの符号化表現間の類似性を最大化し、異なるビデオ間の類似性を最小化することでドメインギャップを埋めます。次に、背景ミキシングを使用して各アンカーに対して追加の正例を得られるようにするという新たな時間的対照的損失関数への拡張を提案します。これにより、両ドメイン間に共有される動作意味論を利用して対照的学習を適用することが可能になります。さらに、ターゲット疑似ラベルを使用した監督下での対照的学習目標も統合することで、ビデオドメイン適応における潜在空間の判別力を向上させます。複数のベンチマークデータセットでの広範な実験結果から、我々が提案する手法が最先端の方法よりも優れていることが示されています。プロジェクトページ: https://cvir.github.io/projects/comix