HyperAIHyperAI

Command Palette

Search for a command to run...

SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

Zhi Qiao Yu Zhou Dongbao Yang Yucan Zhou Weiping Wang

Zusammenfassung

Die Erkennung von Szenentexten ist ein aktuelles Forschungsthema im Bereich der Computer Vision. In jüngster Zeit wurden zahlreiche Erkennungsmethoden auf Basis des Encoder-Decoder-Rahmenwerks vorgeschlagen, die in der Lage sind, Szenentexte mit perspektivischer Verzerrung und gekrümmter Form zu verarbeiten. Dennoch bleiben erhebliche Herausforderungen bestehen, wie beispielsweise Bildunschärfe, ungleichmäßige Beleuchtung und unvollständige Zeichen. Wir argumentieren, dass die meisten Encoder-Decoder-Methoden auf lokalen visuellen Merkmalen basieren und keine explizite globale semantische Information nutzen. In dieser Arbeit stellen wir einen semantikverstärkten Encoder-Decoder-Framework vor, der robuste Erkennung von Texten niedriger Qualität ermöglicht. Die semantische Information wird sowohl im Encoder-Modul zur Supervision als auch im Decoder-Modul zur Initialisierung genutzt. Insbesondere wird die aktuell fortschrittlichste Methode ASTER als Referenz in das vorgeschlagene Framework integriert. Umfassende Experimente zeigen, dass der vorgeschlagene Rahmenwerk robuster gegenüber Textbildern niedriger Qualität ist und auf mehreren Benchmark-Datensätzen Ergebnisse auf State-of-the-Art-Niveau erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp