HyperAIHyperAI
vor 2 Monaten

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen

Youjiang Xu; Jiaqi Duan; Zhanghui Kuang; Xiaoyu Yue; Hongbin Sun; Yue Guan; Wayne Zhang
Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen
Abstract

Große geometrische Varianzen (z.B. Orientierung) stellen die wichtigsten Herausforderungen bei der Erkennung von Szentexten dar. In dieser Arbeit führen wir zunächst Experimente durch, um die Fähigkeit von Netzwerken zu untersuchen, geometrische Varianzen beim Erkennen von Szentexten zu lernen, und stellen fest, dass Netzwerke nur begrenzte textgeometrische Varianzen bewältigen können. Anschließend schlagen wir ein neuartiges Geometrie-Normalisierungsmodul (GNM) mit mehreren Zweigen vor, wobei jeder Zweig aus einer Skalen-Normalisierungseinheit und einer Orientierungs-Normalisierungseinheit besteht, um jedes Textobjekt durch mindestens einen Zweig auf einen gewünschten kanonischen geometrischen Bereich zu normalisieren. Das GNM ist allgemein und kann leicht in bestehende konvolutionsbasierte Texterkennungssysteme integriert werden, um end-to-end Geometrie-Normalisierungsnetze (GNNets) zu bilden. Darüber hinaus schlagen wir ein geometerkennendes Trainingsverfahren vor, das die effektive Ausbildung der GNNets ermöglicht, indem es Textobjekte aus einer gleichmäßigen geometrischen Varianzverteilung durch Stichprobenziehung und Verstärkung generiert. Schließlich zeigen Experimente auf den gängigen Benchmarks ICDAR 2015 und ICDAR 2017 MLT, dass unsere Methode alle bisher besten Ansätze erheblich übertrifft, indem sie Test-F-Werte von 88,52 und 74,54 erreicht.

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen | Neueste Forschungsarbeiten | HyperAI