HyperAIHyperAI
il y a 2 mois

Utilisation de la perte triplet pour le segmention d'actions non supervisée

E. Bueno-Benito; B. Tura; M. Dimiccoli
Utilisation de la perte triplet pour le segmention d'actions non supervisée
Résumé

Dans cet article, nous proposons un cadre novateur entièrement non supervisé qui apprend des représentations d'actions adaptées à la tâche de segmentation d'actions à partir d'une seule vidéo en entrée, sans nécessiter aucune donnée d'entraînement. Notre méthode est une approche de métrique profonde basée sur un réseau peu profond utilisant une perte triplet opérant sur les distributions de similarité et une stratégie de sélection de triplets innovante qui modélise efficacement les a priori temporels et sémantiques pour découvrir les actions dans l'espace représentationnel nouveau. Dans ces conditions, nous réussissons à récupérer les frontières temporelles dans les représentations d'actions apprises avec une qualité supérieure par rapport aux approches non supervisées existantes. La méthode proposée est évaluée sur deux ensembles de données de référence largement utilisés pour la tâche de segmentation d'actions, et elle obtient des performances compétitives en appliquant un algorithme de clustering générique sur les représentations apprises.