il y a 7 mois

Résumé

L'estimation de la posture de la main en 3D à partir d'une seule image de profondeur est un sujet essentiel dans le domaine de la vision par ordinateur et de l'interaction homme-machine. Bien que l'émergence des méthodes d'apprentissage profond ait considérablement amélioré la précision, le problème reste difficile à résoudre en raison de la structure complexe de la main humaine. Les méthodes existantes basées sur l'apprentissage profond perdent soit les informations spatiales de la structure de la main, soit manquent d'une supervision directe des coordonnées articulaires. Dans cet article, nous proposons une nouvelle méthode de régression pixel par pixel, qui utilise une représentation sous forme spatiale (SFR) et un décodeur différentiable (DD) pour résoudre ces deux problèmes. Pour utiliser notre méthode, nous avons construit un modèle dans lequel nous avons conçu une SFR spécifique et son DD correspondant, divisant les coordonnées articulaires 3D en deux parties : les coordonnées planaires et les coordonnées de profondeur, et utilisant deux modules nommés Régression Planaire (PR) et Régression Profonde (DR) pour traiter chacune d'elles respectivement. Nous avons mené une expérience d'ablation pour montrer que notre méthode obtient des résultats supérieurs aux méthodes précédentes. Nous avons également exploré l'influence de différentes stratégies d'entraînement sur les SFR apprises et les résultats. Les expériences réalisées sur trois jeux de données publics montrent que notre modèle est comparable aux modèles existants les plus performants, et qu'il peut réduire l'erreur moyenne des coordonnées articulaires 3D de 25% dans l'un d'eux.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Apprentissage Profond

Réseau De Neurones Convolutif

Domaine De Recherche

Approche/Framework

Vision Par Ordinateur

Tâche

Yuehao Wang Zhenyu Zhang Xiaowei Xu Jian Yang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Apprentissage Profond

Réseau De Neurones Convolutif

Domaine De Recherche

Approche/Framework

Vision Par Ordinateur

Tâche

Yuehao Wang Zhenyu Zhang Xiaowei Xu Jian Yang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Régression pixel par pixel : Estimation de la pose 3D de la main via une représentation en forme spatiale et un décodeur différentiable | Articles | HyperAI

Command Palette

Régression pixel par pixel : Estimation de la pose 3D de la main via une représentation en forme spatiale et un décodeur différentiable

Yuehao Wang Zhenyu Zhang Xiaowei Xu Jian Yang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Régression pixel par pixel : Estimation de la pose 3D de la main via une représentation en forme spatiale et un décodeur différentiable

Yuehao Wang Zhenyu Zhang Xiaowei Xu Jian Yang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Régression pixel par pixel : Estimation de la pose 3D de la main via une représentation en forme spatiale et un décodeur différentiable

Yuehao Wang Zhenyu Zhang Xiaowei Xu Jian Yang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters