vor 7 Monaten

Zusammenfassung

Große geometrische Varianzen (z.B. Orientierung) stellen die wichtigsten Herausforderungen bei der Erkennung von Szentexten dar. In dieser Arbeit führen wir zunächst Experimente durch, um die Fähigkeit von Netzwerken zu untersuchen, geometrische Varianzen beim Erkennen von Szentexten zu lernen, und stellen fest, dass Netzwerke nur begrenzte textgeometrische Varianzen bewältigen können. Anschließend schlagen wir ein neuartiges Geometrie-Normalisierungsmodul (GNM) mit mehreren Zweigen vor, wobei jeder Zweig aus einer Skalen-Normalisierungseinheit und einer Orientierungs-Normalisierungseinheit besteht, um jedes Textobjekt durch mindestens einen Zweig auf einen gewünschten kanonischen geometrischen Bereich zu normalisieren. Das GNM ist allgemein und kann leicht in bestehende konvolutionsbasierte Texterkennungssysteme integriert werden, um end-to-end Geometrie-Normalisierungsnetze (GNNets) zu bilden. Darüber hinaus schlagen wir ein geometerkennendes Trainingsverfahren vor, das die effektive Ausbildung der GNNets ermöglicht, indem es Textobjekte aus einer gleichmäßigen geometrischen Varianzverteilung durch Stichprobenziehung und Verstärkung generiert. Schließlich zeigen Experimente auf den gängigen Benchmarks ICDAR 2015 und ICDAR 2017 MLT, dass unsere Methode alle bisher besten Ansätze erheblich übertrifft, indem sie Test-F-Werte von 88,52 und 74,54 erreicht.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Youjiang Xu Jiaqi Duan Zhanghui Kuang Xiaoyu Yue Hongbin Sun Yue Guan Wayne Zhang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Youjiang Xu Jiaqi Duan Zhanghui Kuang Xiaoyu Yue Hongbin Sun Yue Guan Wayne Zhang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen | Paper | HyperAI

Command Palette

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen

Youjiang Xu Jiaqi Duan Zhanghui Kuang Xiaoyu Yue Hongbin Sun Yue Guan Wayne Zhang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen

Youjiang Xu Jiaqi Duan Zhanghui Kuang Xiaoyu Yue Hongbin Sun Yue Guan Wayne Zhang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Geometrische Normalisierungsnetze für genaue Texterkennung in Szenen

Youjiang Xu Jiaqi Duan Zhanghui Kuang Xiaoyu Yue Hongbin Sun Yue Guan Wayne Zhang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters