HyperAIHyperAI
il y a 2 mois

Sur la puissance de l'augmentation de données pour l'estimation de la pose de la tête

Welter, Michael
Sur la puissance de l'augmentation de données pour l'estimation de la pose de la tête
Résumé

L'apprentissage profond a connu un succès impressionnant au cours de la dernière décennie pour prédire les poses de tête humaine à partir d'images monoculaires. Cependant, pour des entrées réelles et non contrôlées, la communauté de recherche dépend principalement d'un seul ensemble de données d'entraînement, 300W-LP, qui est de nature semi-synthétique et qui manque d'alternatives. Cet article se concentre sur l'extension progressive et l'amélioration des données afin d'explorer davantage les performances obtenables grâce aux stratégies d'augmentation et de synthèse. Sur le plan de la modélisation, une nouvelle conception multitâche de la tête/perte incluant l'estimation de l'incertitude est proposée. Dans l'ensemble, les modèles ainsi obtenus sont petits, efficaces, adaptés à l'estimation complète des poses en 6 degrés de liberté (6 DoF) et présentent une précision très compétitive.

Sur la puissance de l'augmentation de données pour l'estimation de la pose de la tête | Articles de recherche récents | HyperAI