HyperAIHyperAI
il y a 2 mois

Désentrelacement non supervisé basé sur les parties de la forme et de l'apparence des objets

Dominik Lorenz; Leonard Bereska; Timo Milbich; Björn Ommer
Désentrelacement non supervisé basé sur les parties de la forme et de l'apparence des objets
Résumé

La grande variabilité intra-classe est le résultat de modifications de multiples caractéristiques d'objets. Les images, cependant, ne montrent que la superposition de différents facteurs variables tels que l'apparence ou la forme. Par conséquent, apprendre à dissocier et représenter ces différentes caractéristiques représente un défi majeur, en particulier dans le cas non supervisé. De plus, une grande articulation des objets nécessite un modèle flexible basé sur les parties. Nous présentons une approche non supervisée pour dissocier l'apparence et la forme en apprenant des parties de manière cohérente sur toutes les instances d'une catégorie. Notre modèle pour l'apprentissage d'une représentation d'objet est formé en exploitant simultanément des contraintes d'invariance et d'équivariance entre des images transformées synthétiquement. Comme aucune annotation de partie ou information préalable sur une classe d'objets n'est nécessaire, cette approche peut être appliquée à des classes arbitraires. Nous évaluons notre approche sur une large gamme de catégories d'objets et diverses tâches, notamment la prédiction de la posture, la synthèse d'images dissociées et la traduction vidéo-vidéo. L'approche surpassent l'état de l'art pour la prédiction non supervisée de points clés et se compare favorablement même aux approches supervisées pour la tâche de transfert de forme et d'apparence.Note: - "large intra-class variation" a été traduit par "grande variabilité intra-classe".- "object articulation" a été traduit par "articulation des objets".- "keypoint prediction" a été traduit par "prédiction de points clés".