HyperAIHyperAI

Command Palette

Search for a command to run...

Adaptive Radial Projection on Fourier Magnitude Spectrum for Document Image Skew Estimation

Luan Pham; Phu Hao Hoang; Xuan Toan Mai; Tuan Anh Tran

Zusammenfassung

Die Schrägschätzung ist eine zentrale Aufgabe in Dokumentverarbeitungssystemen, insbesondere für gescannte Dokumentbilder, da ihre Genauigkeit direkt die Leistung folgender Verarbeitungsschritte beeinflusst. In der Ära der Digitalisierung haben über die Jahre zahlreiche Forschungsarbeiten sich diesem anspruchsvollen Problem gewidmet. In dieser Arbeit stellen wir zunächst einen neuartigen Ansatz zur Schrägschätzung vor, der den dominierenden Schrägwinkel eines gegebenen Dokumentbildes durch Anwendung einer adaptiven radialen Projektion auf das 2D-Discrete-Fourier-Magnitudenspektrum extrahiert. Zweitens führen wir eine hochwertige Datensammlung für die Schrägschätzung, DISE-2021, ein, um die Leistung verschiedener Schätzer zu bewerten. Drittens liefern wir umfassende Analysen, die sich auf mehrere Verbesserungsmöglichkeiten von Fourier-basierten Methoden konzentrieren. Unsere Ergebnisse zeigen, dass der vorgeschlagene Ansatz robust, zuverlässig ist und alle verglichenen Methoden übertrifft. Die Daten und der Quellcode sind unter https://github.com/phamquiluan/jdeskew verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp