HyperAIHyperAI

Command Palette

Search for a command to run...

TriHorn-Net : Un modèle pour une estimation précise de la posture 3D de la main à partir de la profondeur

Mohammad Rezaei Razieh Rastgoo Vassilis Athitsos

Résumé

Les méthodes d’estimation de la pose 3D de la main ont connu des progrès significatifs récemment. Toutefois, leur précision reste souvent insuffisante pour certaines applications concrètes dans le monde réel, laissant ainsi une importante marge d’amélioration. Ce papier propose TriHorn-Net, un nouveau modèle qui intègre des innovations spécifiques afin d’améliorer la précision de l’estimation de la pose 3D à partir d’images profondeur. La première innovation consiste à décomposer l’estimation de la pose 3D en deux étapes : l’estimation des positions 2D des articulations dans l’espace de l’image profondeur (UV), et l’estimation de leurs profondeurs, aidée par deux cartes d’attention complémentaires. Cette décomposition empêche l’estimation de profondeur — une tâche plus difficile — d’interférer avec l’estimation des coordonnées UV, tant au niveau des prédictions qu’au niveau des caractéristiques extraites. La seconde innovation est PixDropout, qui, à notre connaissance, constitue la première méthode d’augmentation de données basée sur l’apparence spécifiquement conçue pour les images profondeur de mains. Les résultats expérimentaux démontrent que le modèle proposé surpasser les méthodes de pointe sur trois jeux de données publics. Notre implémentation est disponible à l’adresse suivante : https://github.com/mrezaei92/TriHorn-Net.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp