vor 7 Monaten

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

Zusammenfassung

Die Erkennung von Szene-Text in beliebigen Formen war in den letzten Jahren eine herausfordernde Aufgabe. In dieser Arbeit schlagen wir einen neuen segmentierungsbasierten Textdetektor vor, nämlich SAST, der ein kontextbasiertes Mehrfachaufgaben-Lernframework auf Basis eines Fully Convolutional Networks (FCN) verwendet, um verschiedene geometrische Eigenschaften für die Rekonstruktion polygonaler Darstellungen von Textregionen zu erlernen. Berücksichtigend die sequentiellen Merkmale von Text wird ein Kontext-Aufmerksamkeitsblock eingeführt, um langfristige Abhängigkeiten der Pixelinformationen zu erfassen und so eine zuverlässigere Segmentierung zu erreichen. Im Nachbearbeitungsprozess wird eine Methode zur Zuordnung von Punkten zu Quadraten vorgeschlagen, um Pixel in Textinstanzen durch die Integration sowohl hochstufiger Objektkenntnisse als auch niedrigstufiger Pixelinformationen in einem Schritt zusammenzufassen. Darüber hinaus kann die polygonale Darstellung von Text beliebiger Form mit den vorgeschlagenen geometrischen Eigenschaften viel effektiver extrahiert werden. Experimente auf mehreren Benchmarks, einschließlich ICDAR2015, ICDAR2017-MLT, SCUT-CTW1500 und Total-Text, zeigen, dass SAST in Bezug auf Genauigkeit bessere oder vergleichbare Leistungen erzielt. Des Weiteren läuft der vorgeschlagene Algorithmus bei 27,63 FPS auf SCUT-CTW1500 mit einem H-Mittelwert von 81,0 % auf einer einzelnen NVIDIA Titan Xp-Grafikkarte und übertrifft damit die meisten existierenden segmentierungsbasierten Methoden.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Bildsegmentierung

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Bildsegmentierung

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Ein Einsschuss-Textdetektor für beliebig geformte Texte basierend auf kontextbasiertem Multitask-Lernen

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein Einsschuss-Textdetektor für beliebig geformte Texte basierend auf kontextbasiertem Multitask-Lernen

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein Einsschuss-Textdetektor für beliebig geformte Texte basierend auf kontextbasiertem Multitask-Lernen

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters