Lite-HRNet : un réseau à haute résolution léger

Nous présentons un réseau à haute résolution efficace, Lite-HRNet, pour l'estimation de la posture humaine. Nous commençons par appliquer simplement le bloc de permutation efficace issu de ShuffleNet au cadre HRNet (réseau à haute résolution), ce qui permet d'obtenir des performances supérieures par rapport à des réseaux légers populaires tels que MobileNet, ShuffleNet et Small HRNet.Nous constatons que les convolutions ponctuelles (1×1), largement utilisées dans les blocs de permutation, constituent un goulot d'étranglement computationnel. Nous introduisons une unité légère, appelée pondération conditionnelle des canaux, afin de remplacer les convolutions ponctuelles coûteuses dans les blocs de permutation. La complexité de cette pondération est linéaire par rapport au nombre de canaux, ce qui est inférieur à la complexité quadratique des convolutions ponctuelles. Notre approche apprend les poids à partir de tous les canaux et de plusieurs résolutions, disponibles naturellement dans les branches parallèles de HRNet. Ces poids servent de pont pour échanger l'information entre canaux et résolutions, compensant ainsi le rôle joué par les convolutions ponctuelles (1×1). Lite-HRNet obtient des résultats supérieurs sur la tâche d'estimation de la posture humaine par rapport aux réseaux légers courants. De plus, Lite-HRNet peut être facilement appliqué à la tâche de segmentation sémantique de manière également légère. Le code et les modèles sont disponibles publiquement à l'adresse suivante : https://github.com/HRNet/Lite-HRNet.