Analyse de la RMR comme prédiction de graphe avec alignement latent

Les représentations sémantiques de niveau phrase à couverture large (Représentations de Sens Abstraites, RSA) sont des modèles qui capturent le sens des phrases. Les RSA représentent les phrases sous forme de graphes dirigés acycliques étiquetés et enracinés. Le défi du parsing RSA est partiellement dû au manque d'alignements annotés entre les nœuds des graphes et les mots des phrases correspondantes. Nous présentons un analyseur neuronal qui traite ces alignements comme des variables latentes dans un modèle probabiliste conjoint de concepts, de relations et d'alignements. Comme l'inférence exacte nécessite la marginalisation sur les alignements et est irréalisable, nous utilisons le cadre de l'auto-encodeur variationnel et une relaxation continue des alignements discrets. Nous montrons que le modèle conjoint est préférable à l'utilisation d'une chaîne de traitement séquentielle pour l'alignement et le parsing. L'analyseur obtient les meilleurs résultats rapportés sur le banc d'essai standard (74,4 % sur LDC2016E25).