HyperAIHyperAI
vor 11 Tagen

Ein neuartiger Diskursparser basierend auf der Support Vector Machine-Klassifikation

{Helmut Prendinger, David duVerle}
Ein neuartiger Diskursparser basierend auf der Support Vector Machine-Klassifikation
Abstract

Diese Arbeit stellt einen neuen Algorithmus zur Analyse von Diskursstrukturen im Rahmen der rhetorischen Strukturtheorie (Rhetorical Structure Theory, RST) vor. Unser Ansatz basiert auf jüngsten Fortschritten im Bereich des statistischen maschinellen Lernens (insbesondere den multivariaten Fähigkeiten von Support Vector Machines) sowie auf einem umfassenden Merkmalsraum. Die RST bietet ein formales Gerüst für hierarchische Textorganisation und weist starke Anwendungen in der Diskursanalyse und Textgenerierung auf. Wir zeigen, dass ein Text automatisiert mit hierarchisch organisierten RST-Beziehungen annotiert werden kann, wobei die Ergebnisse mit denen von speziell geschulten menschlichen Annotatoren vergleichbar sind. Unter Verwendung einer reichen Menge an oberflächlichen lexikalischen, syntaktischen und strukturellen Merkmalen aus dem Eingabetext erreicht unser Parser in linearer Zeit eine Übereinstimmung mit professionellen Annotatoren von 73,9 % F-Score. Der Parser ist zwischen 5 % und 12 % genauer als aktuelle state-of-the-art-Parsertools.

Ein neuartiger Diskursparser basierend auf der Support Vector Machine-Klassifikation | Neueste Forschungsarbeiten | HyperAI