Command Palette
Search for a command to run...
DDRprog : Un programmeur de raisonnement dynamique différentiable pour CLEVR
DDRprog : Un programmeur de raisonnement dynamique différentiable pour CLEVR
Joseph Suarez Justin Johnson Li Fei-Fei
Résumé
Nous présentons un nouveau cadre de Raisonnement Différentiable Dynamique (DDR) pour l'apprentissage conjoint de programmes à branches et des fonctions qui les composent ; cela résout une nondifférentiabilité significative entravant les architectures dynamiques récentes. Nous appliquons notre cadre à deux configurations dans deux architectures très compactes et efficaces en termes de données : DDRprog pour le CLEVR Visual Question Answering et DDRstack pour l'évaluation d'expressions en notation polonaise inverse. DDRprog utilise un contrôleur récurrent pour prédire et exécuter conjointement des programmes neuronaux modulaires qui correspondent directement à la logique sous-jacente de la question ; il bifurque explicitement des sous-processus pour gérer le branchement logique. En exploitant efficacement une supervision structurelle supplémentaire, nous obtenons une amélioration importante par rapport aux approches précédentes en cohérence des sous-tâches et une légère amélioration en précision globale. Nous démontrons également les avantages de la supervision structurelle dans le contexte RPN : l'inclusion d'une hypothèse de pile dans DDRstack permet à notre approche de généraliser aux expressions longues où un LSTM échoue à accomplir la tâche.