HyperAIHyperAI

Command Palette

Search for a command to run...

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen

Youjiang Xu Jiaqi Duan Zhanghui Kuang Xiaoyu Yue Hongbin Sun Yue Guan Wayne Zhang

Zusammenfassung

Große geometrische Varianzen (z.B. Orientierung) stellen die wichtigsten Herausforderungen bei der Erkennung von Szentexten dar. In dieser Arbeit führen wir zunächst Experimente durch, um die Fähigkeit von Netzwerken zu untersuchen, geometrische Varianzen beim Erkennen von Szentexten zu lernen, und stellen fest, dass Netzwerke nur begrenzte textgeometrische Varianzen bewältigen können. Anschließend schlagen wir ein neuartiges Geometrie-Normalisierungsmodul (GNM) mit mehreren Zweigen vor, wobei jeder Zweig aus einer Skalen-Normalisierungseinheit und einer Orientierungs-Normalisierungseinheit besteht, um jedes Textobjekt durch mindestens einen Zweig auf einen gewünschten kanonischen geometrischen Bereich zu normalisieren. Das GNM ist allgemein und kann leicht in bestehende konvolutionsbasierte Texterkennungssysteme integriert werden, um end-to-end Geometrie-Normalisierungsnetze (GNNets) zu bilden. Darüber hinaus schlagen wir ein geometerkennendes Trainingsverfahren vor, das die effektive Ausbildung der GNNets ermöglicht, indem es Textobjekte aus einer gleichmäßigen geometrischen Varianzverteilung durch Stichprobenziehung und Verstärkung generiert. Schließlich zeigen Experimente auf den gängigen Benchmarks ICDAR 2015 und ICDAR 2017 MLT, dass unsere Methode alle bisher besten Ansätze erheblich übertrifft, indem sie Test-F-Werte von 88,52 und 74,54 erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp