vor 13 Tagen
Der Einfluss der lexikalischen und grammatischen Verarbeitung auf die Generierung von Code aus natürlicher Sprache
Nathanaël Beau, Benoît Crabbé

Abstract
Angesichts der seq2seq-Architektur von TranX für die Übersetzung natürlicher Sprache in Code identifizieren wir vier entscheidende Komponenten: grammatische Einschränkungen, lexikalische Vorverarbeitung, Eingaberepräsentationen und Copy-Mechanismen. Um die Auswirkung dieser Komponenten zu untersuchen, verwenden wir eine state-of-the-art-Architektur, die auf einem BERT-Encoder und einem grammatisch basierten Decoder beruht, für den eine formale Beschreibung bereitgestellt wird. Die Studie unterstreicht die Bedeutung der lexikalischen Substitution im aktuellen Kontext von Systemen zur Übersetzung natürlicher Sprache in Code.