HyperAIHyperAI

Command Palette

Search for a command to run...

Sur la puissance de l'augmentation de données pour l'estimation de la pose de la tête

Welter Michael

Résumé

L'apprentissage profond a connu un succès impressionnant au cours de la dernière décennie pour prédire les poses de tête humaine à partir d'images monoculaires. Cependant, pour des entrées réelles et non contrôlées, la communauté de recherche dépend principalement d'un seul ensemble de données d'entraînement, 300W-LP, qui est de nature semi-synthétique et qui manque d'alternatives. Cet article se concentre sur l'extension progressive et l'amélioration des données afin d'explorer davantage les performances obtenables grâce aux stratégies d'augmentation et de synthèse. Sur le plan de la modélisation, une nouvelle conception multitâche de la tête/perte incluant l'estimation de l'incertitude est proposée. Dans l'ensemble, les modèles ainsi obtenus sont petits, efficaces, adaptés à l'estimation complète des poses en 6 degrés de liberté (6 DoF) et présentent une précision très compétitive.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp