Wissensbasierte Antwortauswahl mit semantischen Grundlagen mehrschrittiger offener Domänen-Konversationen
Die Auswahl von Antworten ist eine zentrale Herausforderung in der KI-Community mit bedeutenden Anwendungen im Web. Die Genauigkeit der ausgewählten Antworten ist jedoch aufgrund mangelnder Kontextbewusstheit oft unzureichend, insbesondere in offenen Domänen, in denen Wörter je nach Kontext mehrere Bedeutungen haben können. Unser Ansatz, SemSol, ist ein wissensbasiertes Modell zur Antwortauswahl, das dieses Problem durch die Nutzung kontextspezifischer Semantik hinter Wörtern anspricht, die implizit über den Verlauf des Dialogs zwischen den Nutzern geteilt werden. SemSol lernt gleichzeitig die Wortbedeutungsdisambiguierung (WSD) für Wörter im Dialog basierend auf einem offenen Domänen-Wissensgraphen – nämlich WordNet – und gleichzeitig die Übereinstimmung zwischen Kontext und Antwortkandidaten. Anschließend verbessert SemSol die Genauigkeit der Antwortauswahl, indem es semantische Informationen aus einem Wissensgraphen im Einklang mit dem Dialogkontext nutzt. Unser Modell lernt die Themen der Äußerungen im Kontext des gesamten Trainingsdatensatzes. Diese themenbasierte Wissensbasis liefert im Dialogkontext themenspezifische Informationen, was die WSD und die Genauigkeit der Antwortauswahl verbessert. Experimente mit zwei offenen Domänen-Datensätzen, Douban (chinesisch) und Reddit (englisch), zeigten, dass das SemSol-Modell die derzeit besten Ansätze übertrifft. SemSol belegt derzeit den ersten Platz auf dem Douban-Leaderboard.