Dokumentenlayoutanalyse
Dokumentenlayoutanalyse (DLA) ist eine Unterdisziplin im Bereich der Computer Vision, die darauf abzielt, die physische Struktur eines Dokuments zu bestimmen. Dabei geht es darum, verschiedene Komponenten innerhalb des Dokuments zu identifizieren. Diese Komponenten können einzelne zusammenhängende Bereiche sein, die durch benachbarte Pixel gebildet werden, oder Gruppen von Textzeilen. Textzeilen beziehen sich auf eine Sammlung von Zeichen, Symbolen und Wörtern, die sich relativ nahe beieinander befinden und durch eine gerade Linie verbunden werden können, meistens in horizontaler oder vertikaler Ausrichtung. Diese Aufgabe hat erhebliche Anwendungswerte für die automatisierte Dokumentenverarbeitung, Informationsextraktion und Inhaltsanalyse.