2ヶ月前

進化する損失関数を用いた教師なし動画表現学習

AJ Piergiovanni; Anelia Angelova; Michael S. Ryoo
進化する損失関数を用いた教師なし動画表現学習
要約

大規模のラベルなしビデオデータからビデオ表現を学習する新しい手法を提案します。理想的には、この表現は汎用性が高く、転移可能であり、行動認識やゼロショットまたはファーソット学習などの新規タスクに直接利用できることが望まれます。我々は、無教師表現学習をマルチモーダルかつマルチタスクの学習問題として定式化し、異なるモーダル間で表現を共有するためにディスティレーションを利用します。さらに、進化的探索アルゴリズムを使用して損失関数の最適な組み合わせを自動的に見つけることで、損失関数の進化という概念を導入します。これにより多くの(自己監督的な)タスクとモーダルを捉えることができます。また、ジップフの法則に基づいて大規模なラベルなしデータセットへの分布マッチングを事前制約として用いることによって、無教師表現評価指標を提案します。この無教師制約は、任意のラベリングによるガイドを受けないにもかかわらず、弱い教師ありでタスク固有のものと同様の結果を生み出します。提案された無教師表現学習手法は単一のRGBネットワークを生成し、従来の手法よりも優れた性能を示しました。特に、大規模な完全にラベル付けされたビデオデータセット以外では、いくつかのラベルベースの手法(例:ImageNet)よりも効果的であることが示されています。

進化する損失関数を用いた教師なし動画表現学習 | 最新論文 | HyperAI超神経