2ヶ月前
階層的なドメイン適応特徴学習によるビデオ注目度予測
Giovanni Bellitto; Federica Proietto Salanitri; Simone Palazzo; Francesco Rundo; Daniela Giordano; Concetto Spampinato

要約
本研究では、異なる抽象レベルで抽出された特徴を用いて中間マップ(注目度マップ)を生成し、その上に階層的な監督を行う3次元完全畳み込みアーキテクチャを提案します。この基本的な階層学習メカニズムには、ドメイン適応とドメイン固有の学習のための2つの手法を提供しています。前者については、勾配逆転を複数のスケールで行い、階層的な一般的な特徴を無教師学習で学習することを促進することで、訓練中にアノテーションが提供されないデータセットでの汎化能力を向上させます。後者については、ドメイン固有の操作(具体的には、事前情報、平滑化、バッチ正規化)を使用して、個々のデータセット上で学習した特徴を専門化し、性能最大化を目指します。実験結果は、提案されたモデルが教師あり注目度予測において最先端の精度を達成していることを示しています。基本的な階層モデルにドメイン固有のモジュールが追加されると、性能が向上し、DHF1Kベンチマークにおいて5つの評価指標中の3つで最先端モデルを超える結果となりました。残りの2つの指標でも2番目に優れた結果を得ています。一方、無教師ドメイン適応設定でテストする場合、階層的な勾配逆転層を有効にすると、教師あり最先端モデルと同等の性能を得ることができました。