HyperAIHyperAI

Command Palette

Search for a command to run...

GroPrompt : Un système efficace de prompting et d'adaptation ancrés pour la segmentation d'objets vidéo par référence

Ci-Siang Lin I-Jieh Liu Min-Hung Chen Chien-Yi Wang Sifei Liu Yu-Chiang Frank Wang

Résumé

La segmentation d'objets par référence vidéo (RVOS) vise à segmenter l'objet mentionné dans la phrase de requête tout au long de la vidéo. La plupart des méthodes existantes nécessitent une formation de bout en bout avec des annotations de masques denses, ce qui peut être coûteux en termes de calcul et moins évolutif. Dans cette étude, nous visons à adapter efficacement les modèles de segmentation fondamentaux pour résoudre le problème RVOS à partir d'une supervision faible grâce au cadre proposé appelé Grounded Prompting (GroPrompt). Plus précisément, nous proposons l'apprentissage contrastif de prompts textuels (TAP-CL) pour renforcer l'association entre les prompts positionnels et les phrases de référence en utilisant uniquement des supervisions par boîtes englobantes. Cela inclut l'apprentissage contrastif de prompts textuels (TextCon) et l'apprentissage contrastif de prompts multimodaux (ModalCon) au niveau des images et au niveau des vidéos, respectivement. Grâce à TAP-CL proposé, notre cadre GroPrompt peut générer des prompts positionnels temporellement cohérents mais sensibles au texte, décrivant les emplacements et les mouvements de l'objet référencé dans la vidéo. Les résultats expérimentaux sur les benchmarks standards RVOS (Ref-YouTube-VOS, Ref-DAVIS17, A2D-Sentences et JHMDB-Sentences) montrent les performances compétitives de notre cadre GroPrompt avec seulement des supervisions faibles par boîtes englobantes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp