il y a 8 mois

Résumé

La localisation temporelle d'actions faiblement supervisée vise à localiser et reconnaître des actions dans des vidéos non tronquées en utilisant uniquement des étiquettes de catégories au niveau de la vidéo pendant l'entraînement. En l'absence d'annotations au niveau des instances, la plupart des méthodes existantes suivent le cadre d'apprentissage par multiples instances basé sur les segments (S-MIL), où les prédictions des segments sont supervisées par les étiquettes des vidéos. Cependant, l'objectif d'obtention de scores au niveau des segments pendant l'entraînement n'est pas cohérent avec celui d'obtention de scores au niveau des propositions pendant les tests, ce qui entraîne des résultats sous-optimaux. Pour résoudre ce problème, nous proposons un nouveau cadre d'apprentissage par multiples instances basé sur les propositions (P-MIL) qui classe directement les propositions candidates à la fois pendant les phases d'entraînement et de test. Ce cadre comprend trois conceptions clés : 1) un module d'extraction de caractéristiques contrastives environnantes pour réduire l'influence des propositions courtes discriminantes en prenant en compte les informations contrastives environnantes, 2) un module d'évaluation de la complétude des propositions pour inhiber les propositions de faible qualité grâce aux étiquettes pseudo-complètes, et 3) une perte de cohérence du rang au niveau des instances pour obtenir une détection robuste en exploitant le complémentarité des modalités RGB et FLOW. Des résultats expérimentaux approfondis sur deux benchmarks difficiles, THUMOS14 et ActivityNet, démontrent la supériorité de notre méthode.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Compréhension Vidéo

Reconnaissance D'action

Multimodal

Vision Par Ordinateur

Tâche

Huan Ren¹, Wenfei Yang¹, Tianzhu Zhang¹,², Yongdong Zhang¹

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Compréhension Vidéo

Reconnaissance D'action

Multimodal

Vision Par Ordinateur

Tâche

Huan Ren¹, Wenfei Yang¹, Tianzhu Zhang¹,², Yongdong Zhang¹

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Apprentissage par apprentissage à partir de propositions pour la localisation temporelle d'actions faiblement supervisée

Huan Ren¹, Wenfei Yang¹, Tianzhu Zhang¹,², Yongdong Zhang¹

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprentissage par apprentissage à partir de propositions pour la localisation temporelle d'actions faiblement supervisée

Huan Ren¹, Wenfei Yang¹, Tianzhu Zhang¹,², Yongdong Zhang¹

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprentissage par apprentissage à partir de propositions pour la localisation temporelle d'actions faiblement supervisée

Huan Ren¹, Wenfei Yang¹, Tianzhu Zhang¹,², Yongdong Zhang¹

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters