Command Palette
Search for a command to run...
Machines à pose par convolution
Machines à pose par convolution
Wei Shih-En Ramakrishna Varun Kanade Takeo Sheikh Yaser
Résumé
Les Machines à pose proposent un cadre de prédiction séquentielle pour l'apprentissage de modèles spatiaux implicites riches. Dans ce travail, nous présentons une conception systématique permettant d'intégrer des réseaux de convolution dans le cadre des Machines à pose afin d'apprendre des caractéristiques d'image ainsi que des modèles spatiaux dépendants de l'image pour la tâche d'estimation de posture. La contribution principale de cet article réside dans la modélisation implicite des dépendances à longue portée entre les variables dans des tâches de prédiction structurée telles que l'estimation de posture articulée. Cela est réalisé en concevant une architecture séquentielle composée de réseaux de convolution qui opèrent directement sur les cartes de croyance issues des étapes précédentes, produisant des estimations de plus en plus précises des positions des parties, sans nécessiter d'inférence explicite de type modèle graphique. Notre approche surmonte le problème caractéristique des gradients qui s'effacent durant l'entraînement en proposant une fonction objectif naturelle qui impose une supervision intermédiaire, renforçant ainsi les gradients rétropropagés et conditionnant le processus d'apprentissage. Nous démontrons des performances de pointe et surpassons les méthodes concurrentes sur des benchmarks standards, notamment les jeux de données MPII, LSP et FLIC.