Ré-évaluation pour l'analyse sémantique neuronale

La lecture sémantique consiste à transduire des énoncés en langage naturel (LN) en représentations sémantiques exécutables par une machine (MR). Bien que les parseurs sémantiques basés sur les réseaux de neurones aient obtenu des progrès remarquables par rapport aux méthodes antérieures, leurs résultats restent encore loin d’être parfaits, et une inspection manuelle rapide permet facilement d’identifier des problèmes évidents, tels qu’un manque d’adéquation ou de cohérence dans les MR générées. Ce papier présente une approche simple permettant d’itérer rapidement et d’améliorer les performances d’un parseur sémantique neuronal existant en réordonnant une liste des n meilleures hypothèses de MR prédites, en utilisant des caractéristiques spécifiquement conçues pour corriger les défauts observés chez les modèles de base. Nous implémentons notre réordonnanceur dans un parseur neuronal compétitif et évaluons sa performance sur quatre tâches : deux tâches de lecture sémantique (GEO, ATIS) et deux tâches de génération de code Python (Django, CoNaLa). Nos résultats montrent une amélioration de jusqu’à 5,7 % en BLEU (CoNaLa) et de 2,9 % en précision (Django) par rapport au modèle de base, surpassant ainsi les meilleurs résultats publiés pour les parseurs neuronaux sur les quatre jeux de données.