HyperAIHyperAI

Command Palette

Search for a command to run...

Adaptation de domaine vidéo non supervisée avec pré-entraînement masqué et auto-entraînement collaboratif

Arun Reddy William Paul Corban Rivera Ketul Shah Celso M. de Melo Rama Chellappa

Résumé

Dans ce travail, nous abordons le problème de l’adaptation de domaine non supervisée (UDA) pour la reconnaissance d’actions vidéo. Notre approche, que nous appelons UNITE, utilise un modèle enseignant image pour adapter un modèle élève vidéo au domaine cible. UNITE commence par une pré-formation auto-supervisée, visant à promouvoir l’apprentissage de caractéristiques discriminatives sur les vidéos du domaine cible grâce à une objectif de distillation masquée guidée par l’enseignant. Ensuite, nous réalisons une auto-formation sur les données cibles masquées, en combinant le modèle élève vidéo et le modèle enseignant image pour générer des pseudo-étiquettes améliorées pour les vidéos cibles non étiquetées. Notre processus d’auto-formation exploite efficacement les forces des deux modèles, permettant ainsi d’obtenir de fortes performances de transfert entre domaines. Nous évaluons notre approche sur plusieurs benchmarks d’adaptation de domaine vidéo et observons des améliorations significatives par rapport aux résultats précédemment rapportés.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Adaptation de domaine vidéo non supervisée avec pré-entraînement masqué et auto-entraînement collaboratif | Articles | HyperAI