HyperAI

Automatische Zusammenfassung

Bei der automatischen Zusammenfassung werden Textdokumente mithilfe einer Software gekürzt, um eine Zusammenfassung zu erstellen, die die wichtigsten Punkte des Originaldokuments enthält. Es ist derzeit Teil des Bereichs des maschinellen Lernens und des Data Mining und sein Ziel besteht darin, Teilmengen von Daten zu finden, die relevante „Informationen“ enthalten.

Derzeit gibt es zwei Methoden zur automatischen Zusammenfassung: Extraktion und Abstraktion. Beim Extrahieren wird eine Zusammenfassung auf der Grundlage einer Teilmenge von Wörtern, Ausdrücken oder Sätzen im Originaltext erstellt. Abstraktion besteht darin, eine interne semantische Darstellung zu erstellen und dann mithilfe der Technologie zur natürlichen Sprachgenerierung eine Zusammenfassung zu erstellen, die dem menschlichen Ausdruck nahe kommt.

Es gibt im Wesentlichen zwei Arten von extrahierenden Zusammenfassungsaufgaben, je nachdem, worauf sich der Zusammenfasser konzentriert: Die erste ist die allgemeine Zusammenfassung, bei der es darum geht, eine allgemeine Zusammenfassung einer Sammlung oder eine Zusammenfassung eines Artikels usw. zu erhalten. Die zweite ist die abfrageabhängige Zusammenfassung, bei der für eine Abfrage spezifische Objekte zusammengefasst werden.

Eine gängige Methode zur Bewertung automatischer Zusammenfassungen besteht darin, diese mit menschlichen Zusammenfassungen zu vergleichen. Diese lassen sich hauptsächlich in interne und externe Bewertungen sowie zwischen Texten und innerhalb von Texten unterteilen.

Interne und externe Bewertungen

Die interne Evaluation dient dazu, das Zusammenfassungssystem selbst zu testen, wobei vor allem die Kohärenz und Aussagekraft der Zusammenfassung bewertet wird. Die externe Bewertung basiert auf der Auswirkung der Zusammenfassung auf die Erledigung anderer Aufgaben, einschließlich der Auswirkung der Zusammenfassung auf die Relevanzbewertung, das Leseverständnis und andere Aufgaben.

Intertextuell und intratextuell

Intratextmethoden bewerten die Ausgabe eines bestimmten Zusammenfassungssystems. Intertextmethoden konzentrieren sich auf die vergleichende Analyse der Ergebnisse mehrerer Zusammenfassungssysteme.