HyperAIHyperAI
il y a 17 jours

InsPose : Réseaux Sensibles aux Instances pour l'Estimation de Posture Multi-Personnes en Une Seule Phase

Dahu Shi, Xing Wei, Xiaodong Yu, Wenming Tan, Ye Ren, Shiliang Pu
InsPose : Réseaux Sensibles aux Instances pour l'Estimation de Posture Multi-Personnes en Une Seule Phase
Résumé

L’estimation de posture pour plusieurs personnes est une tâche à la fois attrayante et complexe. Les méthodes existantes reposent principalement sur des cadres à deux étapes, comprenant des approches haut-bas (top-down) et bas-haut (bottom-up). Ces méthodes à deux étapes souffrent soit d’une redondance computationnelle élevée due aux détecteurs supplémentaires de personnes, soit d’un regroupement heuristique des points clés après la prédiction de tous les points indépendants des instances. Le paradigme à une seule étape vise à simplifier le pipeline d’estimation de posture multi-personnes et suscite un intérêt croissant. Toutefois, les méthodes récentes à une seule étape présentent une performance limitée, en raison de la difficulté à prédire diverses postures corporelles complètes à partir d’un seul vecteur de caractéristiques. Contrairement aux solutions antérieures qui impliquent des conceptions heuristiques complexes, nous proposons une solution simple mais efficace en utilisant des réseaux dynamiques sensibles aux instances. Plus précisément, nous introduisons un module sensible aux instances qui ajuste de manière adaptative (une partie des) paramètres du réseau pour chaque instance. Notre approche permet d’augmenter significativement la capacité et l’adaptabilité du réseau pour reconnaître diverses postures, tout en maintenant un pipeline compact et entièrement entraînable en end-to-end. Des expériences étendues sur le jeu de données MS-COCO montrent que notre méthode obtient une amélioration notable par rapport aux méthodes à une seule étape existantes, tout en offrant un meilleur compromis entre précision et efficacité par rapport aux approches à deux étapes de pointe. Le code et les modèles sont disponibles à l’adresse \url{https://github.com/hikvision-research/opera}.

InsPose : Réseaux Sensibles aux Instances pour l'Estimation de Posture Multi-Personnes en Une Seule Phase | Articles de recherche récents | HyperAI