HyperAIHyperAI
vor 16 Tagen

Adaptive Radial Projection on Fourier Magnitude Spectrum for Document Image Skew Estimation

{Luan Pham; Phu Hao Hoang; Xuan Toan Mai; Tuan Anh Tran}
Abstract

Die Schrägschätzung ist eine zentrale Aufgabe in Dokumentverarbeitungssystemen, insbesondere für gescannte Dokumentbilder, da ihre Genauigkeit direkt die Leistung folgender Verarbeitungsschritte beeinflusst. In der Ära der Digitalisierung haben über die Jahre zahlreiche Forschungsarbeiten sich diesem anspruchsvollen Problem gewidmet. In dieser Arbeit stellen wir zunächst einen neuartigen Ansatz zur Schrägschätzung vor, der den dominierenden Schrägwinkel eines gegebenen Dokumentbildes durch Anwendung einer adaptiven radialen Projektion auf das 2D-Discrete-Fourier-Magnitudenspektrum extrahiert. Zweitens führen wir eine hochwertige Datensammlung für die Schrägschätzung, DISE-2021, ein, um die Leistung verschiedener Schätzer zu bewerten. Drittens liefern wir umfassende Analysen, die sich auf mehrere Verbesserungsmöglichkeiten von Fourier-basierten Methoden konzentrieren. Unsere Ergebnisse zeigen, dass der vorgeschlagene Ansatz robust, zuverlässig ist und alle verglichenen Methoden übertrifft. Die Daten und der Quellcode sind unter https://github.com/phamquiluan/jdeskew verfügbar.

Adaptive Radial Projection on Fourier Magnitude Spectrum for Document Image Skew Estimation | Neueste Forschungsarbeiten | HyperAI