HyperAIHyperAI

Command Palette

Search for a command to run...

PAD-Net : Réseau de prédiction et de distillation guidé par plusieurs tâches pour l'estimation simultanée de la profondeur et l'analyse de scène

Dan Xu Wanli Ouyang Xiaogang Wang Nicu Sebe

Résumé

L'estimation de profondeur et l'analyse de scène sont deux tâches particulièrement importantes dans la compréhension visuelle des scènes. Dans cet article, nous abordons le problème de l'estimation simultanée de la profondeur et de l'analyse de scène au sein d'un CNN conjoint. Cette tâche peut généralement être traitée comme un problème d'apprentissage profond multi-tâches [42]. Contrairement aux méthodes précédentes qui optimisent directement plusieurs tâches à partir des données d'entraînement fournies, cet article propose un nouveau réseau de prédiction guidée multi-tâches et de distillation (PAD-Net), qui prédit d'abord un ensemble de tâches intermédiaires auxiliaires allant du niveau bas au niveau élevé, puis utilise les prédictions issues de ces tâches intermédiaires auxiliaires comme entrées multimodales via nos modules de distillation multimodale proposés pour les tâches finales. Au cours de l'apprentissage conjoint, les tâches intermédiaires non seulement agissent comme une supervision pour apprendre des représentations profondes plus robustes, mais fournissent également des informations multimodales riches pour améliorer les tâches finales. Des expériences approfondies ont été menées sur deux ensembles de données difficiles (à savoir NYUD-v2 et Cityscapes) pour les tâches d'estimation de profondeur et d'analyse de scène, démontrant ainsi l'efficacité de l'approche proposée.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
PAD-Net : Réseau de prédiction et de distillation guidé par plusieurs tâches pour l'estimation simultanée de la profondeur et l'analyse de scène | Articles | HyperAI