HyperAIHyperAI

Command Palette

Search for a command to run...

DDRprog : Un programmeur de raisonnement dynamique différentiable pour CLEVR

Joseph Suarez Justin Johnson Li Fei-Fei

Résumé

Nous présentons un nouveau cadre de Raisonnement Différentiable Dynamique (DDR) pour l'apprentissage conjoint de programmes à branches et des fonctions qui les composent ; cela résout une nondifférentiabilité significative entravant les architectures dynamiques récentes. Nous appliquons notre cadre à deux configurations dans deux architectures très compactes et efficaces en termes de données : DDRprog pour le CLEVR Visual Question Answering et DDRstack pour l'évaluation d'expressions en notation polonaise inverse. DDRprog utilise un contrôleur récurrent pour prédire et exécuter conjointement des programmes neuronaux modulaires qui correspondent directement à la logique sous-jacente de la question ; il bifurque explicitement des sous-processus pour gérer le branchement logique. En exploitant efficacement une supervision structurelle supplémentaire, nous obtenons une amélioration importante par rapport aux approches précédentes en cohérence des sous-tâches et une légère amélioration en précision globale. Nous démontrons également les avantages de la supervision structurelle dans le contexte RPN : l'inclusion d'une hypothèse de pile dans DDRstack permet à notre approche de généraliser aux expressions longues où un LSTM échoue à accomplir la tâche.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp