8日前
マスクされた事前学習と協調的自己学習を用いた教師なし動画ドメイン適応
Arun Reddy, William Paul, Corban Rivera, Ketul Shah, Celso M. de Melo, Rama Chellappa

要約
本研究では、動画行動認識における非教師付きドメイン適応(UDA)問題に取り組む。提案手法であるUNITEは、画像用の教師モデルを用いて、動画用の学生モデルをターゲットドメインに適応させるアプローチである。UNITEはまず、教師モデルを用いたマスク付き蒸留(masked distillation)目的関数に基づく自己教師付き事前学習を実施し、ターゲットドメインの動画において判別力のある特徴の学習を促進する。次に、マスクされたターゲットデータに対して自己学習を実行し、動画学生モデルと画像教師モデルを併用して、ラベルなしのターゲット動画に対するより精度の高い偽ラベル(pseudolabels)を生成する。この自己学習プロセスにより、両モデルの強みを効果的に活かすことで、ドメイン間での強力な転移性能を達成している。本手法は複数の動画ドメイン適応ベンチマーク上で評価され、従来報告された結果に対して顕著な性能向上が確認された。