H2ONet : Réseau sensible aux occlusions manuelles et à l'orientation pour la reconstruction en temps réel de maillages 3D de main

La reconstruction en temps réel de maillages 3D de main est un défi, particulièrement lorsque la main tient un objet. Au-delà des méthodes précédentes, nous proposons H2ONet, conçu pour exploiter pleinement les informations non occluées provenant de plusieurs trames afin d’améliorer la qualité de la reconstruction. Premièrement, nous décomposons la reconstruction du maillage de main en deux branches : l’une exploitant les informations non occluées au niveau des doigts, l’autre capturant l’orientation globale de la main, chacune étant munie d’une structure légère pour favoriser l’inférence en temps réel. Deuxièmement, nous introduisons une fusion de caractéristiques sensible à l’occlusion au niveau des doigts, utilisant les informations prédites d’occlusion au niveau des doigts comme guide pour fusionner les informations au fil du temps. Par ailleurs, nous concevons une fusion de caractéristiques sensible à l’occlusion au niveau de la main, permettant d’extraire des informations non occluées provenant des trames voisines dans le temps. Nous menons des expériences sur les jeux de données Dex-YCB et HO3D-v2, comprenant des cas complexes d’occlusion main-objet, démontrant que H2ONet fonctionne en temps réel et atteint des performances de pointe tant sur la précision du maillage de main que sur celle de la pose. Le code source sera publié sur GitHub.