HyperAIHyperAI
vor 17 Tagen

Tabellenerkennung in der Wildnis: Ein neuartiges, vielfältiges Datensatz- und Erkennungsverfahren für Tabellen

Mrinal Haloi, Shashank Shekhar, Nikhil Fande, Siddhant Swaroop Dash, Sanjay G
Tabellenerkennung in der Wildnis: Ein neuartiges, vielfältiges Datensatz- und Erkennungsverfahren für Tabellen
Abstract

Neuere Ansätze der tiefen Lernens im Bereich der Tabellenerkennung erzielten herausragende Leistungen und haben sich als effektiv bei der Identifizierung von Dokumentenlayouts erwiesen. Derzeit bestehen die verfügbaren Benchmarks zur Tabellenerkennung jedoch zahlreicher Einschränkungen, darunter mangelnde Vielfalt der Stichproben, einfache Tabellenstrukturen, fehlende Trainingsbeispiele sowie unzureichende Stichprobengüte. In diesem Beitrag stellen wir ein vielfältiges, großskaliges Datenset für die Tabellenerkennung vor, das über siebentausend Stichproben umfasst und eine breite Vielfalt an Tabellenstrukturen aus vielen unterschiedlichen Quellen enthält. Zusätzlich präsentieren wir Baseline-Ergebnisse, die mit einem auf künstlichen neuronalen Netzen basierenden Verfahren zur Erkennung von Tabellenstrukturen in Dokumenten erzielt wurden. Experimentelle Ergebnisse zeigen die Überlegenheit von convolutionalen tiefen Lernmethoden gegenüber klassischen, auf Computer Vision basierenden Ansätzen. Die Einführung dieses vielfältigen Datensets wird der Forschungsgemeinschaft ermöglichen, hochdurchsatzfähige tiefen Lernmethoden zur Verständnis von Dokumentenlayouts und zur Verarbeitung tabellarischer Daten zu entwickeln. Das Datenset ist verfügbar unter:1. https://www.kaggle.com/datasets/mrinalim/stdw-dataset2. https://huggingface.co/datasets/n3011/STDW