vor 6 Monaten

Zusammenfassung

In jüngster Zeit haben segmentationsbasierte Ansätze zur Erkennung von Szenentext erhebliche Aufmerksamkeit in der Forschungsgemeinschaft erhalten, da sie im Vergleich zu anderen Methoden bei der Erkennung von Textinstanzen beliebiger Formen und extremen Seitenverhältnissen deutliche Vorteile aufweisen, die auf ihrer pixelgenauen Beschreibung beruhen. Allerdings sind die meisten bestehenden segmentationsbasierten Ansätze durch ihre komplexen Nachverarbeitungsalgorithmen sowie die Skalenrobustheit ihrer Segmentierungsmodelle eingeschränkt. Die Nachverarbeitungsalgorithmen sind nicht nur unabhängig von der Modelloptimierung, sondern auch zeitaufwendig, während die Skalenrobustheit üblicherweise durch eine direkte Fusion mehrskaliger Merkmalskarten gestärkt wird. In diesem Artikel stellen wir ein differentiable Binarization (DB)-Modul vor, das den Binarisierungsprozess – einen der zentralen Schritte im Nachverarbeitungsprozess – direkt in das Segmentierungsnetzwerk integriert. Durch die gleichzeitige Optimierung des vorgeschlagenen DB-Moduls kann das Segmentierungsnetzwerk präzisere Ergebnisse liefern, was die Genauigkeit der Texterkennung durch eine einfache und effiziente Pipeline verbessert. Darüber hinaus wird ein effizientes adaptives Skalenfusion (Adaptive Scale Fusion, ASF)-Modul vorgestellt, das die Skalenrobustheit durch adaptives Fusionsverfahren von Merkmalen unterschiedlicher Skalen erhöht. Durch die Integration des vorgeschlagenen DB- und ASF-Moduls in das Segmentierungsnetzwerk erreicht unser vorgeschlagener Szenentextdetektor konsistent führende Ergebnisse hinsichtlich sowohl Genauigkeit als auch Geschwindigkeit auf fünf etablierten Benchmark-Datensätzen.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Objekterkennung

Semantische Segmentierung

Minghui Liao Zhisheng Zou Zhaoyi Wan Cong Yao Xiang Bai

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Objekterkennung

Semantische Segmentierung

Minghui Liao Zhisheng Zou Zhaoyi Wan Cong Yao Xiang Bai

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Echtzeit-Szenentexterkennung mit differentiabler Binarisierung und adaptiver Skalenfusion | Paper | HyperAI

Command Palette

Echtzeit-Szenentexterkennung mit differentiabler Binarisierung und adaptiver Skalenfusion

Minghui Liao Zhisheng Zou Zhaoyi Wan Cong Yao Xiang Bai

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Echtzeit-Szenentexterkennung mit differentiabler Binarisierung und adaptiver Skalenfusion

Minghui Liao Zhisheng Zou Zhaoyi Wan Cong Yao Xiang Bai

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Echtzeit-Szenentexterkennung mit differentiabler Binarisierung und adaptiver Skalenfusion

Minghui Liao Zhisheng Zou Zhaoyi Wan Cong Yao Xiang Bai

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters