vor 6 Monaten

Zusammenfassung

Die Lokalisierung von Seitenelementen oder -objekten wie Tabellen, Abbildungen, Gleichungen usw. stellt den zentralen ersten Schritt bei der Informationsextraktion aus Dokumentbildern dar. Wir schlagen ein neuartiges, end-to-end trainierbares tiefes Netzwerk (CDeC-Net) zur Erkennung von Tabellen in Dokumenten vor. Das vorgeschlagene Netzwerk basiert auf einer mehrstufigen Erweiterung von Mask R-CNN mit einem dualen Backbone, das deformierbare Konvolutionen verwendet, um Tabellen unterschiedlicher Skalierung mit hoher Erkennungsgenauigkeit bei höheren IoU-Schwellenwerten zu detektieren. Wir evaluieren CDeC-Net empirisch an allen öffentlich verfügbaren Benchmark-Datensätzen – ICDAR-2013, ICDAR-2017, ICDAR-2019, UNLV, Marmot, PubLayNet und TableBank – anhand umfangreicher Experimente.Unsere Lösung weist drei wesentliche Eigenschaften auf: (i) ein einziger, vortrainiertes Modell (CDeC-Net‡) erzielt hervorragende Ergebnisse auf allen gängigen Benchmark-Datensätzen; (ii) wir berichten über exzellente Leistungen bei mehreren, einschließlich höheren, IoU-Schwellenwerten; (iii) indem wir das gleiche Evaluationsprotokoll wie die jüngsten Arbeiten für jeden einzelnen Benchmark befolgen, zeigen wir konsistent überlegene quantitative Ergebnisse. Unsere Code-Implementierung und die Modelle werden öffentlich verfügbar gemacht, um die Reproduzierbarkeit unserer Ergebnisse zu gewährleisten.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Dokumentenverstehen

Ansatz/Rahmenwerk

Natürliche Sprachverarbeitung

Computervision

Aufgabe

Madhav Agarwal Ajoy Mondal C. V. Jawahar

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Dokumentenverstehen

Ansatz/Rahmenwerk

Natürliche Sprachverarbeitung

Computervision

Aufgabe

Madhav Agarwal Ajoy Mondal C. V. Jawahar

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

CDeC-Net: Composite Deformable Cascade Network für die Tabellenerkennung in Dokumentbildern | Paper | HyperAI

Command Palette

CDeC-Net: Composite Deformable Cascade Network für die Tabellenerkennung in Dokumentbildern

Madhav Agarwal Ajoy Mondal C. V. Jawahar

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

CDeC-Net: Composite Deformable Cascade Network für die Tabellenerkennung in Dokumentbildern

Madhav Agarwal Ajoy Mondal C. V. Jawahar

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

CDeC-Net: Composite Deformable Cascade Network für die Tabellenerkennung in Dokumentbildern

Madhav Agarwal Ajoy Mondal C. V. Jawahar

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters