HyperAIHyperAI
vor 13 Tagen

Strukturierte Vorhersage als Übersetzung zwischen erweiterten natürlichen Sprachen

Giovanni Paolini, Ben Athiwaratkun, Jason Krone, Jie Ma, Alessandro Achille, Rishita Anubhai, Cicero Nogueira dos Santos, Bing Xiang, Stefano Soatto
Strukturierte Vorhersage als Übersetzung zwischen erweiterten natürlichen Sprachen
Abstract

Wir schlagen einen neuen Rahmenwerkansatz, Translation between Augmented Natural Languages (TANL), vor, um eine Vielzahl strukturierter Vorhersageaufgaben in der Sprachverarbeitung zu lösen, darunter gemeinsame Entität- und Relationsextraktion, geschachtelte Namensentitätserkennung, Relationsklassifikation, semantische Rollenbeschriftung, Ereignisextraktion, Coreferenzauflösung sowie Dialogzustandsverfolgung. Anstatt das Problem durch die Schaffung aufgaben-spezifischer diskriminativer Klassifikatoren anzugehen, formulieren wir es als Übersetzungsproblem zwischen erweiterten natürlichen Sprachen, aus dem die aufgabenrelevanten Informationen leicht extrahiert werden können. Unser Ansatz erreicht auf allen Aufgaben Ergebnisse, die mit oder sogar über denen aufgaben-spezifischer Modelle liegen, und erzielt insbesondere neue SOTA-Ergebnisse bei der gemeinsamen Entität- und Relationsextraktion (auf den Datensätzen CoNLL04, ADE, NYT und ACE2005), der Relationsklassifikation (FewRel und TACRED) sowie der semantischen Rollenbeschriftung (CoNLL-2005 und CoNLL-2012). Dies gelingt uns, während wir für alle Aufgaben dieselbe Architektur und Hyperparameter verwenden – sogar dann, wenn ein einzelnes Modell gleichzeitig alle Aufgaben löst (Multi-Task-Lernen). Schließlich zeigen wir, dass unser Rahmenwerk zudem die Leistung in einer Low-Resource-Situation erheblich verbessern kann, was auf eine effizientere Nutzung der Label-Semantik zurückzuführen ist.