HyperAIHyperAI

Command Palette

Search for a command to run...

Aggrégation de sémantique au niveau des séquences pour la détection d'objets vidéo

Haiping Wu Yuntao Chen Naiyan Wang Zhaoxiang Zhang

Résumé

La détection d'objets dans les vidéos (VID) est une direction de recherche en pleine expansion ces dernières années. Un problème central de la VID est la dégradation de l'apparence des images vidéo causée par des mouvements rapides. Ce problème est fondamentalement mal posé pour une seule image. Par conséquent, l'agrégation de caractéristiques à partir d'autres images devient un choix naturel. Les méthodes existantes s'appuient fortement sur le flux optique ou les réseaux neuronaux récurrents pour l'agrégation de caractéristiques. Cependant, ces méthodes mettent davantage l'accent sur les images temporellement proches. Dans ce travail, nous soutenons que l'agrégation de caractéristiques au niveau de la séquence complète conduira à des caractéristiques plus discriminantes et robustes pour la détection d'objets dans les vidéos. Pour atteindre cet objectif, nous avons conçu un nouveau module d'Agrégation Sémantique au Niveau de la Séquence (SELSA). Nous montrons également le lien étroit entre la méthode proposée et la méthode classique de clustering spectral, offrant ainsi une nouvelle perspective pour comprendre le problème de la VID. Nous testons notre méthode sur les jeux de données ImageNet VID et EPIC KITCHENS et obtenons des résultats nouveaux et en pointe. Notre méthode n'a pas besoin de méthodes complexes de post-traitement telles que Seq-NMS ou le recalage des tubelets, ce qui permet de maintenir le pipeline simple et propre.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp