Mehraufgaben-Satzcodierungsmodell für semantische Abfrage in Frage-Antwort-Systemen

Frage-Antwort-Systeme (QA-Systeme) werden eingesetzt, um automatisch angemessene Antworten auf Benutzerfragen bereitzustellen. Die Satzübereinstimmung ist eine zentrale Aufgabe innerhalb von QA-Systemen und wird häufig als Aufgabe der Paraphrasenidentifikation (PI) formuliert. Gegeben eine Frage soll dabei die ähnlichste Frage aus einer QA-Wissensbasis identifiziert werden. In diesem Artikel stellen wir ein mehrfach aufgabenbasiertes Satz-Encoding-Modell (MSEM) für das PI-Problem vor, bei dem ein verbundener Graph zur Darstellung der Beziehungen zwischen Sätzen verwendet wird, während ein mehrfach aufgabenbasiertes Lernmodell sowohl die Satzübereinstimmung als auch die Klassifikation der Satzabsicht adressiert. Zudem implementieren wir einen allgemeinen semantischen Retrieval-Framework, der unser vorgeschlagenes Modell mit der Approximate Nearest Neighbor (ANN)-Technologie kombiniert, wodurch die schnelle Identifizierung der ähnlichsten Frage aus allen verfügbaren Kandidaten während des Online-Betriebs ermöglicht wird. Experimente zeigen die Überlegenheit unseres vorgeschlagenen Ansatzes gegenüber bestehenden Modellen zur Satzübereinstimmung.