il y a 8 mois

Résumé

La localisation temporelle d'actions faiblement supervisée vise à localiser les instances d'actions dans des vidéos en utilisant uniquement des étiquettes d'actions au niveau de la vidéo. Les méthodes existantes adoptent principalement un pipeline de localisation par classification qui optimise la prédiction au niveau des segments grâce à une perte de classification vidéo. Cependant, cette formulation souffre de l'écart entre la classification et la détection, entraînant une séparation imprecise des segments avant-plan et arrière-plan (F&B). Pour atténuer ce problème, nous proposons d'explorer la structure sous-jacente parmi les segments en recourant au regroupement non supervisé des segments, plutôt que de s'appuyer fortement sur la perte de classification vidéo. Plus précisément, nous proposons un nouvel algorithme de séparation F&B basé sur le regroupement. Il comprend deux composants essentiels : un composant de regroupement de segments qui classe les segments en plusieurs clusters latents et un composant de classification de clusters qui classe ensuite chaque cluster comme avant-plan ou arrière-plan. Comme il n'existe pas d'étiquettes véritables pour former ces deux composants, nous introduisons un mécanisme d'autolabellisation unifié basé sur le transport optimal pour générer des étiquettes pseudo-haute qualité qui correspondent à plusieurs distributions a priori plausibles. Ceci garantit que les affectations de clusters aux segments peuvent être associées avec précision à leurs étiquettes F&B, améliorant ainsi la séparation F&B. Nous évaluons notre méthode sur trois benchmarks : THUMOS14, ActivityNet v1.2 et v1.3. Notre méthode obtient des performances prometteuses sur tous ces benchmarks tout en étant significativement plus légère que les méthodes précédentes. Le code est disponible à l'adresse suivante : https://github.com/Qinying-Liu/CASE

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Compréhension Vidéo

Reconnaissance D'action

Vision Par Ordinateur

Tâche

Qinying Liu Zilei Wang* Shanghai Rong Junjie Li Yixin Zhang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Compréhension Vidéo

Reconnaissance D'action

Vision Par Ordinateur

Tâche

Qinying Liu Zilei Wang* Shanghai Rong Junjie Li Yixin Zhang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Réexamen de la séparation du premier plan et de l'arrière-plan dans la localisation temporelle d'actions faiblement supervisée : une approche basée sur le clustering

Qinying Liu Zilei Wang* Shanghai Rong Junjie Li Yixin Zhang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Réexamen de la séparation du premier plan et de l'arrière-plan dans la localisation temporelle d'actions faiblement supervisée : une approche basée sur le clustering

Qinying Liu Zilei Wang* Shanghai Rong Junjie Li Yixin Zhang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Réexamen de la séparation du premier plan et de l'arrière-plan dans la localisation temporelle d'actions faiblement supervisée : une approche basée sur le clustering

Qinying Liu Zilei Wang* Shanghai Rong Junjie Li Yixin Zhang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters