Verbesserung der Diskursanalyse mehrerer Gesprächspartner durch Domänenintegration

Während mehrparteiliche Gespräche oft weniger strukturiert sind als Monologe oder Dokumente, sind sie implizit durch semantische Korrelationen über die interaktiven Äußerungen hinweg organisiert, und die Dialogdiskursanalyse kann angewendet werden, um die Abhängigkeitsstruktur und Beziehungen zwischen den elementaren Diskurs-Einheiten vorherzusagen und reichhaltige strukturelle Informationen für nachgeschaltete Aufgaben bereitzustellen. Allerdings stammen die bestehenden Korpora mit Dialogdiskursannotierung aus spezifischen Domänen und weisen begrenzte Stichprobengrößen auf, was die Leistung datengetriebener Ansätze bei neuen Dialogen ohne Domänenanpassung schlecht macht. In diesem Artikel führen wir zunächst einen auf Transformers basierenden Parser ein und bewerten dessen Leistung über Domänen hinweg. Anschließend integrieren wir Domänenwissen aus zwei Perspektiven – sowohl aus datenbasierter als auch aus sprachmodellbasiertener Sicht – mittels dreier Methoden, um die Generalisierungsfähigkeit zu verbessern. Empirische Ergebnisse zeigen, dass der neuronale Parser von unseren vorgeschlagenen Methoden profitieren kann und auf über-Domänen-Dialogbeispielen eine bessere Leistung erzielt.