Apprentissage de la recombinaison algébrique pour une généralisation compositionnelle

Les modèles séquentiels neuronaux présentent une capacité limitée à la généralisation compositionnelle dans les tâches de parssage sémantique. La généralisation compositionnelle exige une récombinaison algébrique, c’est-à-dire une réorganisation dynamique d’expressions structurées de manière récursive. Toutefois, la plupart des travaux antérieurs se concentrent principalement sur la récombinaison d’unités lexicales, qui constitue une partie importante mais insuffisante de la récombinaison algébrique. Dans cet article, nous proposons LeAR, un modèle neuronal end-to-end conçu pour apprendre la récombinaison algébrique afin de favoriser la généralisation compositionnelle. L’idée centrale consiste à modéliser la tâche de parssage sémantique comme un homomorphisme entre une algèbre syntaxique latente et une algèbre sémantique, ce qui encourage naturellement la récombinaison algébrique. Plus précisément, nous apprenons conjointement deux modules : un Composer, chargé de générer la syntaxe latente, et un Interprète, chargé d’attribuer des opérations sémantiques. Des expériences menées sur deux benchmarks réalistes et complets pour la généralisation compositionnelle démontrent l’efficacité de notre modèle. Le code source est disponible publiquement à l’adresse suivante : https://github.com/microsoft/ContextualSP.