AGIF: Ein adaptives grapheninteraktives Framework für die gemeinsame Detektion mehrerer Absichten und die Slot-Füllung

In real-world-Szenarien haben Benutzer in der Regel mehrere Absichten innerhalb derselben Äußerung. Leider konzentrieren sich die meisten Modelle für spoken language understanding (SLU) entweder hauptsächlich auf den Einzelabsichts-Fall oder integrieren lediglich einen globalen Absichtskontextvektor für alle Tokens, wodurch die feinabgestimmte Berücksichtigung mehrerer Absichten auf Token-Ebene bei der Slot-Vorhersage vernachlässigt wird. In diesem Artikel stellen wir einen adaptiven Graph-Interaktions-Framework (AGIF) für die gemeinsame Erkennung mehrerer Absichten und die Slot-Füllung vor, bei dem wir eine Absicht-Slot-Graph-Interaktions-Schicht einführen, um die starke Korrelation zwischen Slots und Absichten zu modellieren. Diese Interaktions-Schicht wird adaptiv auf jeden Token angewendet, wodurch sichergestellt wird, dass automatisch relevante Absichtsinformationen extrahiert werden, was eine feinabgestimmte Integration von Absichtsinformationen für die Token-basierte Slot-Vorhersage ermöglicht. Experimentelle Ergebnisse auf drei Multi-Absicht-Datensätzen zeigen, dass unser Framework erhebliche Verbesserungen erzielt und die derzeit beste Leistung erreicht. Zudem erzielt unser Framework neue SOTA-Leistungen auf zwei Einzelabsicht-Datensätzen.