il y a 8 mois

Résumé

Nous présentons le cadre Modular interactive VOS (MiVOS), qui dissocie l'interaction-masque et la propagation du masque, permettant une meilleure généralisation et de meilleures performances. Formés séparément, le module d'interaction convertit les interactions de l'utilisateur en un masque d'objet, qui est ensuite propagé temporellement par notre module de propagation à l'aide d'une nouvelle stratégie de filtrage top- $k$ pour lire la mémoire espace-temps. Pour prendre efficacement en compte l'intention de l'utilisateur, nous proposons un nouveau module difference-aware visant à apprendre comment fusionner correctement les masques avant et après chaque interaction, ces dernières étant alignées avec les images cibles grâce à la mémoire espace-temps. Nous évaluons notre méthode tant qualitativement que quantitativement avec différentes formes d'interactions utilisateur (par exemple, des griffonnages, des clics) sur DAVIS pour montrer que notre méthode surpasses les algorithmes actuels de pointe tout en nécessitant moins d'interactions par image, avec l'avantage supplémentaire de se généraliser à différents types d'interactions utilisateur. Nous contribuons également à la recherche future en fournissant un vaste ensemble de données synthétiques VOS comprenant une segmentation précise au pixel de 4,8 millions d'images, accompagné de nos codes sources.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Segmentation D'images

Suivi D'objets

Traitement Vidéo

Vision Par Ordinateur

Tâche

Ho Kei Cheng Yu-Wing Tai Chi-Keung Tang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Segmentation D'images

Suivi D'objets

Traitement Vidéo

Vision Par Ordinateur

Tâche

Ho Kei Cheng Yu-Wing Tai Chi-Keung Tang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Segmentation d'Objets Vidéo Interactive Modulaire : De l'Interaction à la Masque, Propagation et Fusion Consciente des Différences

Ho Kei Cheng Yu-Wing Tai Chi-Keung Tang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Segmentation d'Objets Vidéo Interactive Modulaire : De l'Interaction à la Masque, Propagation et Fusion Consciente des Différences

Ho Kei Cheng Yu-Wing Tai Chi-Keung Tang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Segmentation d'Objets Vidéo Interactive Modulaire : De l'Interaction à la Masque, Propagation et Fusion Consciente des Différences

Ho Kei Cheng Yu-Wing Tai Chi-Keung Tang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters