1ヶ月前

大規模ビデオドメイン適応のための時間的注意アライメント

Min-Hung Chen; Zsolt Kira; Ghassan AlRegib; Jaekwon Yoo; Ruxin Chen; Jian Zheng
大規模ビデオドメイン適応のための時間的注意アライメント
要約

近年、さまざまな画像ベースのドメイン適応(DA)技術が提案されてきましたが、ビデオにおけるドメインシフトはまだ十分に研究されていません。これまでの多くの研究では、性能評価が小規模で飽和状態のデータセットに限定されています。そこで、本研究では、より大きなドメイン乖離を持つ大規模なビデオDAデータセット2つを提案します:UCF-HMDB_fullおよびKinetics-Gameplay。次に、異なるビデオ用のDA統合手法を調査し、時系列動態を同時にアラインメントと学習することで、複雑なDA手法を使用せずに効果的なアラインメントが達成できることを示します。最後に、Temporal Attentive Adversarial Adaptation Network (TA3N) を提案します。このネットワークは、ドメイン乖離を利用して時系列動態に明示的に注目することで、より効果的なドメインアラインメントを実現し、4つのビデオDAデータセットにおいて最先端の性能を達成しています(例:「HMDB → UCF」では、「ソースのみ」からの精度向上率が7.9%で73.9%から81.8%へ向上し、「Kinetics → Gameplay」では10.3%の向上)。コードとデータは http://github.com/cmhungsteve/TA3N で公開されています。