HyperAIHyperAI

Command Palette

Search for a command to run...

Attention aux Prototypes Dual pour la Segmentation d'Objets Vidéo Non Supervisée

Suhwan Cho$^1,*$ Minhyeok Lee$^1,*$ Seunghoon Lee$^1$ Dogyoon Lee$^1$ Heeseung Choi$^2$ Ig-Jae Kim$^2$ Sangyoun Lee$^1$

Résumé

La segmentation d'objets vidéo non supervisée (VOS) vise à détecter et segmenter l'objet le plus saillant dans les vidéos. Les principales techniques utilisées en VOS non supervisée sont : 1) la collaboration des informations d'apparence et de mouvement ; et 2) la fusion temporelle entre différentes images. Cet article propose deux nouveaux mécanismes d'attention basés sur des prototypes, l'attention inter-modalité (IMA) et l'attention inter-images (IFA), pour intégrer ces techniques par une propagation dense à travers différentes modalités et images. L'IMA intègre de manière dense les informations contextuelles provenant de différentes modalités grâce à un affinement mutuel. L'IFA injecte le contexte global d'une vidéo dans l'image requête, permettant une utilisation complète des propriétés utiles provenant de plusieurs images. Les résultats expérimentaux sur des jeux de données de référence publics montrent que notre approche proposée surpassent toutes les méthodes existantes avec une marge considérable. Les deux composants proposés sont également validés de manière approfondie par une étude ablationnelle.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp