EfficientPose : estimation de posture à personne unique évolutive et efficace

L’estimation de posture humaine à une seule personne facilite l’analyse du mouvement sans marqueurs en milieu sportif comme en contexte clinique. Toutefois, les modèles d’avant-garde en estimation de posture humaine ne répondent généralement pas aux exigences des applications réelles. La prolifération des techniques d’apprentissage profond a conduit au développement de nombreuses approches avancées. Toutefois, au fur et à mesure des progrès réalisés dans ce domaine, des modèles de plus en plus complexes et inefficaces ont été introduits, entraînant une augmentation considérable des besoins en calcul. Pour faire face à ces défis liés à la complexité et à l’inefficacité, nous proposons une nouvelle architecture de réseau de neurones convolutifs, appelée EfficientPose, qui exploite les EfficientNets récemment introduits afin de fournir une estimation de posture à une seule personne à la fois efficace et évolutif. EfficientPose est une famille de modèles qui met à profit un extracteur de caractéristiques multi-échelle performant ainsi que des blocs de détection à faible coût computationnel basés sur des convolutions mobile inverted bottleneck, tout en assurant une amélioration continue de la précision des configurations de posture. Grâce à sa faible complexité et à son efficacité, EfficientPose permet des applications dans le monde réel sur des dispositifs embarqués, en limitant à la fois la consommation mémoire et le coût computationnel. Les résultats de nos expériences, réalisées sur le benchmark difficile MPII à une seule personne, montrent que les modèles EfficientPose proposés surpassent de manière significative le modèle largement utilisé OpenPose en termes de précision et d’efficacité computationnelle. En particulier, notre modèle de meilleure performance atteint une précision de pointe sur le benchmark MPII à une seule personne, tout en utilisant des ConvNets à faible complexité.