Antwort-Ranking mit mehreren Typen tiefen interaktiver Darstellungen in abfragebasierten Dialogen
Die Entwicklung eines intelligenten Dialogsystems, das in der Lage ist, basierend auf einem mehrschrittigen Kontext eine geeignete Antwort auszuwählen, stellt in drei Hinsichten eine Herausforderung dar: (1) Die Bedeutung eines Kontext-Antwort-Paares beruht auf Spracheinheiten unterschiedlicher Granularität (z. B. Wörter, Phrasen, Sub-Sätze usw.); (2) In Dialogdaten können sowohl lokale (z. B. ein kleiner Fensterbereich um ein Wort) als auch langreichweitige (z. B. Wörter über den gesamten Kontext und die Antwort hinweg) Abhängigkeiten bestehen; und (3) Die Beziehung zwischen Kontext und Antwortkandidat basiert in manchen realen Fällen auf mehreren relevanten semantischen Hinweisen oder relativ impliziten semantischen Signalen. Bisherige Ansätze kodieren den Dialog jedoch meist mit einer einheitlichen Darstellungsform, und die Interaktionsprozesse zwischen Kontext und Antwortkandidat werden in einer eher oberflächlichen Weise ausgeführt, was zu einer unzureichenden Verständnis der Dialoginhalte führen und die Erkennung der semantischen Relevanz zwischen Kontext und Antwort behindern kann. Um diese Herausforderungen zu bewältigen, schlagen wir einen Rahmenwerk [K]-Interaktion [L]-Matching vor, der mehrere Arten tiefer interaktiver Darstellungen nutzt, um Kontext-Antwort-Übereinstimmungsmodelle für die Antwortauswahl zu entwickeln. Insbesondere konstruieren wir verschiedene Darstellungsformen für Sprechakt-Antwort-Paare und vertiefen diese durch alternierendes Kodieren und Interagieren. Auf diese Weise kann das Modell sowohl Beziehungen zwischen benachbarten Elementen, Phrasenmuster als auch langreichweitige Abhängigkeiten in der Darstellung erfassen und durch mehrere Schichten der Interaktion zwischen Kontext und Antwort präzisere Vorhersagen treffen. Experimentelle Ergebnisse auf drei öffentlichen Benchmarks zeigen, dass das vorgeschlagene Modell die bisherigen herkömmlichen Kontext-Antwort-Übereinstimmungsmodelle erheblich übertrifft und leicht bessere Ergebnisse als das BERT-Modell für die mehrschrittige Antwortauswahl in retrievalbasierten Dialogsystemen erzielt.