HyperAIHyperAI

Command Palette

Search for a command to run...

Segmentation d'instances vidéo

Linjie Yang* ByteDance AI Lab [email protected] Yuchen Fan UIUC [email protected] Ning Xu Adobe Research [email protected]

Résumé

Dans cet article, nous présentons une nouvelle tâche en vision par ordinateur nommée segmentation d'instances vidéo. L'objectif de cette nouvelle tâche est la détection, la segmentation et le suivi simultanés des instances dans les vidéos. Autrement dit, il s'agit de la première extension du problème de segmentation d'instances d'images au domaine vidéo. Pour faciliter la recherche sur cette nouvelle tâche, nous proposons un benchmark à grande échelle appelé YouTube-VIS, qui comprend 2883 vidéos YouTube en haute résolution, un ensemble de 40 catégories d'étiquettes et 131 000 masques d'instances de haute qualité. De plus, nous proposons un nouvel algorithme appelé MaskTrack R-CNN pour cette tâche. Notre nouvelle méthode introduit une nouvelle branche de suivi à Mask R-CNN afin d'exécuter conjointement les tâches de détection, de segmentation et de suivi simultanément. Enfin, nous évaluons la méthode proposée ainsi que plusieurs baselines solides sur notre nouveau jeu de données. Les résultats expérimentaux montrent clairement les avantages de l'algorithme proposé et révèlent des pistes pour des améliorations futures. Nous croyons que la tâche de segmentation d'instances vidéo stimulera la communauté dans le domaine de la compréhension vidéo.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp