Multi-hop Selector Network für die Multi-turn-Antwortauswahl in abfragebasierten Chatbots

Die mehrfach turn-basierte Retrieval-basierte Konversation ist eine zentrale Aufgabe bei der Entwicklung intelligenter Dialogsysteme. Bisherige Ansätze konzentrieren sich hauptsächlich darauf, Kandidatentexte mit jeder Äußerung im Kontext auf mehreren Granularitätsstufen zu verknüpfen, wodurch jedoch die Nebenwirkungen der Nutzung übermäßiger Kontextinformationen vernachlässigt werden. Äußerungen im Kontext liefern reichhaltige Informationen zur Extraktion zusätzlicher Übereinstimmungsmerkmale, bergen jedoch gleichzeitig Rauschsignale und unnötige Informationen. In dieser Arbeit analysieren wir die negativen Auswirkungen einer zu umfangreichen Nutzung von Kontextäußerungen und stellen ein Multi-Hop-Selector-Netzwerk (MSN) vor, um dieses Problem zu mildern. Konkret verwendet MSN zunächst einen Multi-Hop-Selector, um relevante Äußerungen als Kontext auszuwählen. Anschließend passt das Modell den gefilterten Kontext mit dem Kandidatentext an und ermittelt eine Übereinstimmungsscore. Experimentelle Ergebnisse zeigen, dass MSN auf drei öffentlichen Datensätzen für mehrfach turn-basierte Dialoge einige state-of-the-art-Methoden übertrifft.