HyperAIHyperAI
vor 2 Monaten

Eine Hybride Architektur für die Erkennung und Entdeckung von Intentionen außerhalb des Domains

Masoud Akbari; Ali Mohades; M. Hassan Shirali-Shahreza
Eine Hybride Architektur für die Erkennung und Entdeckung von Intentionen außerhalb des Domains
Abstract

Die Absichtserkennung ist eine der Aufgaben der Einheit für die Verarbeitung natürlicher Sprache (Natural Language Understanding, NLU) in taskorientierten Dialogsystemen. Eingaben außerhalb des Bereichs (Out of Scope, OOS) und außerhalb des Domains (Out of Domain, OOD) können diese Systeme in Schwierigkeiten bringen. Andererseits wird ein annotiertes Datensatz benötigt, um ein Modell für die Absichtserkennung in taskorientierten Dialogsystemen zu trainieren. Die Erstellung eines annotierten Datensatzes ist zeitaufwendig und erfordert menschliche Ressourcen. Der Zweck dieses Artikels besteht darin, die genannten Probleme anzusprechen. Die Aufgabe der Identifizierung von OOD/OOS-Eingaben wird als OOD/OOS-Absichtserkennung bezeichnet. Zudem sind das Entdecken neuer Absichten und das Pseudo-Labeln von OOD-Eingaben unter dem Begriff Absichtsentdeckung (Intent Discovery) bekannt. Im Teil der OOD-Absichtserkennung nutzen wir einen variationsautoencoder, um zwischen bekannten und unbekannten Absichten unabhängig von der Verteilung der Eingabedaten zu unterscheiden. Anschließend wird eine unsupervisierte Clustermethode angewendet, um verschiedene unbekannte Absichten hinter den OOD/OOS-Eingaben zu entdecken. Wir führen zudem eine nichtlineare Dimensionsreduktion auf den OOD/OOS-Darstellungen durch, um die Distanzen zwischen den Darstellungen für das Clustern sinnvoller zu gestalten. Unsere Ergebnisse zeigen, dass das vorgeschlagene Modell sowohl für die OOD/OOS-Absichtserkennung als auch für die Absichtsentdeckung ausgezeichnete Ergebnisse erzielt und Baselines in den Sprachen Englisch und Persisch übertrifft.