HyperAIHyperAI

Command Palette

Search for a command to run...

Entkoppeltes Aufmerksamkeitsnetzwerk für die Texterkennung

Tianwei Wang Yuanzhi Zhu Lianwen Jin Canjie Luo Xiaoxue Chen Yaqiang Wu Qianying Wang Mingxiang Cai

Zusammenfassung

Die Texterkennung hat aufgrund ihrer vielfältigen Anwendungen erhebliches Forschungsinteresse geweckt. Moderne Ansätze zur Texterkennung basieren auf Aufmerksamkeitsmechanismen. Allerdings leiden die meisten dieser Methoden aufgrund ihrer rekursiven Alignierungsoperation erheblich unter dem sogenannten Alignierungsproblem, da die Alignierung auf den vorherigen Dekodierungsergebnissen beruht. Um dieses Problem zu beheben, schlagen wir ein entkoppeltes Aufmerksamkeitsnetzwerk (Decoupled Attention Network, DAN) vor, das die Alignierungsoperation von den historischen Dekodierungsergebnissen entkoppelt. DAN ist ein effektiver, flexibler und robuster end-to-end-Texterkennungssystem, das aus drei Komponenten besteht: 1) einem Feature-Encoder, der visuelle Merkmale aus dem Eingabebild extrahiert; 2) einem konvolutionellen Alignierungsmodul, das die Alignierung auf Basis der Merkmale des Encoders durchführt; und 3) einem entkoppelten Text-Dekoder, der die endgültige Vorhersage durch gemeinsame Nutzung der Merkmalskarte und der Aufmerksamkeitskarten erzeugt. Experimentelle Ergebnisse zeigen, dass DAN auf mehreren Texterkennungsaufgaben, einschließlich der Offline-Erkennung handschriftlicher Texte sowie der Erkennung regulärer und irregulärer Szenentexte, die derzeit beste Leistung erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Entkoppeltes Aufmerksamkeitsnetzwerk für die Texterkennung | Paper | HyperAI