il y a 7 mois

Résumé

L'estimation de profondeur et l'analyse de scène sont deux tâches particulièrement importantes dans la compréhension visuelle des scènes. Dans cet article, nous abordons le problème de l'estimation simultanée de la profondeur et de l'analyse de scène au sein d'un CNN conjoint. Cette tâche peut généralement être traitée comme un problème d'apprentissage profond multi-tâches [42]. Contrairement aux méthodes précédentes qui optimisent directement plusieurs tâches à partir des données d'entraînement fournies, cet article propose un nouveau réseau de prédiction guidée multi-tâches et de distillation (PAD-Net), qui prédit d'abord un ensemble de tâches intermédiaires auxiliaires allant du niveau bas au niveau élevé, puis utilise les prédictions issues de ces tâches intermédiaires auxiliaires comme entrées multimodales via nos modules de distillation multimodale proposés pour les tâches finales. Au cours de l'apprentissage conjoint, les tâches intermédiaires non seulement agissent comme une supervision pour apprendre des représentations profondes plus robustes, mais fournissent également des informations multimodales riches pour améliorer les tâches finales. Des expériences approfondies ont été menées sur deux ensembles de données difficiles (à savoir NYUD-v2 et Cityscapes) pour les tâches d'estimation de profondeur et d'analyse de scène, démontrant ainsi l'efficacité de l'approche proposée.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Apprentissage Multi-tâches

Estimation De Profondeur

Multimodal

Approche/Framework

Multimodal

Vision Par Ordinateur

Tâche

Dan Xu Wanli Ouyang Xiaogang Wang Nicu Sebe

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Apprentissage Multi-tâches

Estimation De Profondeur

Multimodal

Approche/Framework

Multimodal

Vision Par Ordinateur

Tâche

Dan Xu Wanli Ouyang Xiaogang Wang Nicu Sebe

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

PAD-Net : Réseau de prédiction et de distillation guidé par plusieurs tâches pour l'estimation simultanée de la profondeur et l'analyse de scène | Articles | HyperAI

Command Palette

PAD-Net : Réseau de prédiction et de distillation guidé par plusieurs tâches pour l'estimation simultanée de la profondeur et l'analyse de scène

Dan Xu Wanli Ouyang Xiaogang Wang Nicu Sebe

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

PAD-Net : Réseau de prédiction et de distillation guidé par plusieurs tâches pour l'estimation simultanée de la profondeur et l'analyse de scène

Dan Xu Wanli Ouyang Xiaogang Wang Nicu Sebe

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

PAD-Net : Réseau de prédiction et de distillation guidé par plusieurs tâches pour l'estimation simultanée de la profondeur et l'analyse de scène

Dan Xu Wanli Ouyang Xiaogang Wang Nicu Sebe

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters