il y a 8 mois

Résumé

Nous proposons une nouvelle approche pour la tâche de segmentation d'actions dans des vidéos longues et non rognées, basée sur la résolution d'un problème de transport optimal. En intégrant un a priori de cohérence temporelle dans un problème de Gromov-Wasserstein, nous sommes capables de décoder une segmentation temporellement cohérente à partir d'une matrice de coût d'affinité/matching bruyante entre les images vidéo et les classes d'actions. Contrairement aux approches précédentes, notre méthode ne nécessite pas de connaître l'ordre des actions dans une vidéo pour atteindre la cohérence temporelle. De plus, notre problème Gromov-Wasserstein (fusionné) résultant peut être résolu efficacement sur des GPU en utilisant quelques itérations de descente miroir projetée. Nous démontrons l'efficacité de notre méthode dans un cadre d'apprentissage non supervisé, où elle est utilisée pour générer des pseudo-étiquettes pour l'auto-entraînement. Nous évaluons notre approche de segmentation et notre pipeline d'apprentissage non supervisé sur les jeux de données Breakfast, 50-Salads, YouTube Instructions et Desktop Assembly, obtenant des résultats à l'état de l'art pour la tâche de segmentation d'actions dans les vidéos non supervisées.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Compréhension Vidéo

Reconnaissance D'action

Traitement Vidéo

Vision Par Ordinateur

Tâche

Ming Xu; Stephen Gould

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Compréhension Vidéo

Reconnaissance D'action

Traitement Vidéo

Vision Par Ordinateur

Tâche

Ming Xu; Stephen Gould

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Transport optimal non équilibré temporalement cohérent pour la segmentation d'actions non supervisée

Ming Xu; Stephen Gould

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Transport optimal non équilibré temporalement cohérent pour la segmentation d'actions non supervisée

Ming Xu; Stephen Gould

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Transport optimal non équilibré temporalement cohérent pour la segmentation d'actions non supervisée

Ming Xu; Stephen Gould

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters