Une relaxation différentiable de la segmentation et de l’alignement de graphes pour l’analyse AMR

Les représentations sémantiques abstraites (AMR) constituent un formalisme sémantique à couverture large, qui modélise le sens d'une phrase sous la forme d'un graphe orienté acyclique. Pour entraîner la plupart des parseurs AMR, il est nécessaire de segmenter le graphe en sous-graphes et d'aligner chaque sous-graphe à un mot de la phrase ; cette opération est généralement effectuée en prétraitement, à l’aide de règles manuelles. À la différence de cette approche, nous traitons à la fois l’alignement et la segmentation comme des variables latentes dans notre modèle, et les induisons comme partie intégrante de l’entraînement end-to-end.Étant donné qu’effectuer la marginalisation sur les variables latentes structurées est impossible en pratique, nous adoptons un cadre d’auto-encodeur variationnel. Afin de garantir une optimisation différentiable end-to-end, nous introduisons une relaxation différentiable des problèmes de segmentation et d’alignement. Nous observons que l’induction de la segmentation conduit à des gains significatifs par rapport à l’utilisation d’une heuristique de segmentation « gloutonne ». Les performances de notre méthode se rapprochent également de celles d’un modèle qui repose sur les règles de segmentation proposées par \citet{lyu-titov-2018-amr}, spécifiquement conçues pour traiter des constructions AMR individuelles.