il y a 8 mois

Résumé

Nous présentons une méthode de conditionnement à usage général pour les réseaux de neurones appelée FiLM : Feature-wise Linear Modulation (Modulation Linéaire par Caractéristique). Les couches FiLM influencent le calcul des réseaux de neurones par une transformation affine simple, appliquée caractéristique par caractéristique, basée sur l'information de conditionnement. Nous démontrons que les couches FiLM sont particulièrement efficaces pour la raisonnement visuel - répondre à des questions liées aux images qui nécessitent un processus à plusieurs étapes et de haut niveau - une tâche qui s'est avérée difficile pour les méthodes d'apprentissage profond standard qui ne modélisent pas explicitement le raisonnement. Plus précisément, nous montrons sur des tâches de raisonnement visuel que les couches FiLM 1) divisent par deux l'erreur de l'état de l'art pour le benchmark CLEVR, 2) modulent les caractéristiques d'une manière cohérente, 3) sont robustes aux ablations et aux modifications architecturales, et 4) généralisent bien à des données nouvelles et difficiles, même avec peu d'exemples ou en zero-shot.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Réponse À Des Questions Visuelles

Vision Par Ordinateur

Transformer

Approche/Framework

Multimodal

Vision Par Ordinateur

Tâche

Ethan Perez Florian Strub Harm de Vries Vincent Dumoulin Aaron Courville

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Réponse À Des Questions Visuelles

Vision Par Ordinateur

Transformer

Approche/Framework

Multimodal

Vision Par Ordinateur

Tâche

Ethan Perez Florian Strub Harm de Vries Vincent Dumoulin Aaron Courville

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

FiLM : Raisonnement visuel avec une couche de conditionnement générale

Ethan Perez Florian Strub Harm de Vries Vincent Dumoulin Aaron Courville

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

FiLM : Raisonnement visuel avec une couche de conditionnement générale

Ethan Perez Florian Strub Harm de Vries Vincent Dumoulin Aaron Courville

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

FiLM : Raisonnement visuel avec une couche de conditionnement générale

Ethan Perez Florian Strub Harm de Vries Vincent Dumoulin Aaron Courville

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters