Strukturierte Dialog-Diskursanalyse

Die Analyse des Dialogdiskurses zielt darauf ab, die interne Struktur eines mehrteilnehmenden Gesprächs durch die Identifizierung aller Diskurs-\emph{Verbindungen} und entsprechender \emph{Beziehungen} aufzudecken. Frühere Arbeiten behandeln diese Aufgabe entweder als eine Reihe unabhängiger Multiple-Choice-Probleme, bei denen die Existenz von Verbindungen und Beziehungen getrennt dekodiert werden, oder das Codieren wird auf lokale Interaktionen beschränkt, wobei die gesamte strukturelle Information ignoriert wird. Im Gegensatz dazu schlagen wir eine präzise Methode vor, die sich aus zwei Perspektiven verbessert: dem Codieren und dem Dekodieren. Beim Codieren führen wir eine strukturierte Kodierung der Adjazenzmatrix durch, gefolgt vom Matrix-Tree-Lernalgorithmus, bei dem alle Diskursverbindungen und -beziehungen im Dialog basierend auf einer latenten baustufigen Verteilung gemeinsam optimiert werden. Beim Dekodieren führen wir eine strukturierte Inferenz mit dem modifizierten Chiu-Liu-Edmonds-Algorithmus durch, der explizit den etikettierten multi-wurzeligen nicht-projektiven Spannbaum generiert, der die Diskursstruktur am besten erfasst. Darüber hinaus verzichten wir im Gegensatz zu früheren Arbeiten auf manuell erstellte Merkmale; dies erhöht die Robustheit des Modells. Experimente zeigen, dass unsere Methode neue Standarts erreicht und das vorherige Modell um 2,3 Punkte auf STAC und 1,5 Punkte auf Molweni (F1-Werte) übertrifft. \footnote{Der Code wurde veröffentlicht unter~\url{https://github.com/chijames/structured_dialogue_discourse_parsing}.}