HyperAIHyperAI

Command Palette

Search for a command to run...

PingAn-VCGroup's Lösung für den ICDAR 2021 Wettbewerb zur Analyse wissenschaftlicher Literatur, Aufgabe B: Tabellenerkennung zu HTML

Jiaquan Ye; Xianbiao Qi; Yelin He; Yihao Chen; Dengyi Gu; Peng Gao; Rong Xiao

Zusammenfassung

Dieses Papier präsentiert unsere Lösung für die ICDAR 2021 Wettbewerbsaufgabe zur Verarbeitung wissenschaftlicher Literatur, Task B: Tabellenerkennung und Konvertierung in HTML. In unserer Methode gliedern wir die Aufgabe der Tabelleninhalts-Erkennung in vier Teilprobleme: Tabellestrukturerkennung, Textzeilen-Detektion, Textzeilen-Erkennung und Kastenzuordnung. Unser Algorithmus zur Tabellestrukturerkennung basiert auf einer angepassten Version von MASTER [1], einem robusten Bildtext-Erkennungsverfahren. PSENet [2] wird verwendet, um jede Textzeile im Tabellenbild zu detektieren. Für die Textzeilen-Erkennung bauen wir unser Modell ebenfalls auf MASTER auf. Schließlich ordnen wir in der Phase der Kastenzuordnung die durch PSENet detektierten Textfelder den durch die Tabellestrukturerkennung rekonstruierten Strukturkomponenten zu und füllen den erkannten Textinhalt in das entsprechende Element ein. Unsere vorgeschlagene Methode erreicht einen TEDS-Score von 96,84 % bei 9.115 Validierungsbeispielen in der Entwicklungsphase und einen TEDS-Score von 96,32 % bei 9.064 Beispielen in der abschließenden Evaluierungsphase.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
PingAn-VCGroup's Lösung für den ICDAR 2021 Wettbewerb zur Analyse wissenschaftlicher Literatur, Aufgabe B: Tabellenerkennung zu HTML | Paper | HyperAI