vor 6 Monaten

Zusammenfassung

Die Aufnahme von Dokumentenbildern ist eine der einfachsten und am häufigsten angewendeten Methoden zur Dokumentation. Diese Bilder weisen jedoch oft unerwünschte Verzerrungen auf, die durch die Nutzung handhabbarer Geräte verursacht werden und schwer zu beseitigen sind. Wir stellen ein überwachtes, gatingsbasiertes und verzweigtes gestapeltes U-Net-Modul vor, das ein Entverzerrungsnetz vorhersagt und ein verzerrungsfreies Bild aus dem Eingabebild erzeugt. Während das Netzwerk auf synthetisch verzerrenden Dokumentenbildern trainiert wird, werden die Ergebnisse anhand realer Weltbilder bewertet. Der Innovationsgehalt unserer Methode liegt nicht nur in der Verzweigung des U-Net, die das Verwischen der Netzkoordinaten verhindert, sondern auch in der Verwendung eines gatingsbasierten Netzwerks, das der Modellarchitektur Rand- und andere feine Linieninformationen hinzufügt. Die von uns vorgeschlagene end-to-end-Pipeline erreicht nach Training mit nur 8 Prozent der Daten, die in früheren Methoden verwendet wurden, eine state-of-the-art-Leistung auf dem DocUNet-Datensatz.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Faltungsneuronales Netzwerk

Dokumentenverstehen

Ansatz/Rahmenwerk

Natürliche Sprachverarbeitung

Computervision

Aufgabe

Hmrishav Bandyopadhyay Tanmoy Dasgupta Nibaran Das Mita Nasipuri

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Faltungsneuronales Netzwerk

Dokumentenverstehen

Ansatz/Rahmenwerk

Natürliche Sprachverarbeitung

Computervision

Aufgabe

Hmrishav Bandyopadhyay Tanmoy Dasgupta Nibaran Das Mita Nasipuri

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Ein gatemodulierter und bifurkierter gestapelter U-Net-Modul für die Entverzerrung von Dokumentenbildern

Hmrishav Bandyopadhyay Tanmoy Dasgupta Nibaran Das Mita Nasipuri

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein gatemodulierter und bifurkierter gestapelter U-Net-Modul für die Entverzerrung von Dokumentenbildern

Hmrishav Bandyopadhyay Tanmoy Dasgupta Nibaran Das Mita Nasipuri

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein gatemodulierter und bifurkierter gestapelter U-Net-Modul für die Entverzerrung von Dokumentenbildern

Hmrishav Bandyopadhyay Tanmoy Dasgupta Nibaran Das Mita Nasipuri

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters