HMOR : Relations Ordinales Hiérarchiques Multipersonnes pour l'Estimation de la Pose 3D Multipersonne à Partir d'une Vue Monoculaire

Des progrès remarquables ont été réalisés dans l'estimation de la posture humaine 3D à partir d'une caméra RGB monoculaire. Cependant, peu d'études se sont penchées sur les cas multi-personnes en 3D. Dans cet article, nous tentons de remédier au manque de perspective globale des approches descendantes (top-down) en introduisant une nouvelle forme de supervision - les Relations Ordinales Hiérarchiques Multi-personnes (ROHMP) (Hierarchical Multi-person Ordinal Relations). Les ROHMP codent les informations d'interaction sous forme de relations ordinales entre profondeurs et angles, hiérarchiquement, ce qui capture les sémantiques au niveau des parties du corps et des articulations tout en maintenant la cohérence globale. Notre approche repose sur un modèle intégré descendante conçu pour exploiter ces relations ordinales lors de l'apprentissage. Ce modèle intégré estime simultanément les boîtes englobantes des personnes, leurs profondeurs et leurs postures 3D relatives à la racine, avec une architecture allant du grossier au fin pour améliorer la précision de l'estimation de profondeur. La méthode proposée dépasse significativement les méthodes de pointe actuelles sur des jeux de données publics multi-personnes en 3D. En plus d'une performance supérieure, notre méthode présente une complexité computationnelle inférieure et nécessite moins de paramètres de modèle.