HyperAIHyperAI

Command Palette

Search for a command to run...

Les sols sont plats : Exploitation des sémantiques pour la prédiction en temps réel des normales de surface

Steven Hickson Karthik Raveendran Alireza Fathi Kevin Murphy Irfan Essa

Résumé

Nous proposons quatre observations qui contribuent à améliorer de manière significative les performances des modèles d'apprentissage profond prédisant les normales de surface et les étiquettes sémantiques à partir d'une seule image RGB. Ces observations sont : (1) débruiter les normales de surface « ground truth » dans l'ensemble d'entraînement pour garantir leur cohérence avec les étiquettes sémantiques ; (2) entraîner simultanément sur un mélange de données réelles et synthétiques, plutôt que de pré-entraîner sur des données synthétiques puis de fine-tuner sur des données réelles ; (3) prédire conjointement les normales et les sémantiques en utilisant un modèle partagé, mais ne rétropropager les erreurs que sur les pixels ayant des étiquettes d'entraînement valides ; (4) alléger le modèle et utiliser des entrées en niveaux de gris au lieu de couleurs. Malgré la simplicité de ces étapes, nous démontrons une amélioration constante des résultats sur plusieurs jeux de données, en utilisant un modèle qui fonctionne à 12 images par seconde sur un téléphone mobile standard.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Les sols sont plats : Exploitation des sémantiques pour la prédiction en temps réel des normales de surface | Articles | HyperAI