Analyse des Instances Humaines par Parsing R-CNN

L'analyse humaine au niveau des instances est courante dans les scénarios réels et se manifeste de plusieurs manières, telles que la segmentation des parties du corps humain, l'estimation de pose dense, les interactions homme-objet, etc. Les modèles doivent être capables de distinguer différentes instances humaines dans un panneau d'image et d'apprendre des caractéristiques riches pour représenter les détails de chaque instance. Dans cet article, nous présentons une pipeline complète pour résoudre l'analyse humaine au niveau des instances, nommée Parsing R-CNN. Elle traite simultanément un ensemble d'instances humaines en prenant en compte de manière exhaustive les caractéristiques de l'approche basée sur les régions et l'apparence du corps humain, permettant ainsi de représenter les détails des instances. Le Parsing R-CNN est très flexible et efficace, ce qui le rend applicable à de nombreux problèmes d'analyse d'instances humaines. Notre approche surpasses toutes les méthodes de pointe sur les jeux de données CIHP (Crowd Instance-level Human Parsing), MHP v2.0 (Multi-Human Parsing) et DensePose-COCO. Sur la base du Parsing R-CNN proposé, nous avons obtenu la première place dans la tâche d'estimation de pose dense du défi COCO 2018. Le code source et les modèles sont disponibles publiquement.