vor 7 Monaten

Zusammenfassung

Die Erkennung und Identifizierung von Text in natürlichen Szenebildern ist eine herausfordernde Aufgabe, die noch nicht vollständig gelöst ist. In den letzten Jahren wurden mehrere neue Systeme vorgeschlagen, die zumindest eine der beiden Teilaufgaben (Texterkennung und Textidentifizierung) angehen. In dieser Arbeit stellen wir STN-OCR vor, einen Schritt hin zu halbüberwachten neuronalen Netzen für die Texterkennung in natürlichen Szenen, das end-to-end optimiert werden kann. Im Gegensatz zu den meisten bestehenden Arbeiten, die aus mehreren tiefen neuronalen Netzen und verschiedenen Vorverarbeitungsschritten bestehen, schlagen wir ein einzelnes tiefes neuronales Netzwerk vor, das lernt, Text in natürlichen Bildern auf halbüberwachte Weise zu erkennen und zu identifizieren. STN-OCR ist ein Netzwerk, das ein räumliches Transformer-Netzwerk integriert und gemeinsam lernt, welches lernen kann, Textbereiche in einem Bild zu erkennen, sowie ein Texterkennungsnetzwerk, das die identifizierten Textbereiche verarbeitet und ihren textuellen Inhalt erkennt. Wir untersuchen das Verhalten unseres Modells bei einer Reihe verschiedener Aufgaben (Erkennung und Identifizierung von Zeichen und Textzeilen). Experimentelle Ergebnisse auf öffentlichen Benchmark-Datensätzen zeigen die Fähigkeit unseres Modells, eine Vielzahl von unterschiedlichen Aufgaben zu bewältigen, ohne erhebliche Änderungen an seiner Gesamtstruktur vorzunehmen.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 7 Monaten

Christian Bartz Haojin Yang Christoph Meinel

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 7 Monaten

Christian Bartz Haojin Yang Christoph Meinel

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

STN-OCR: Ein einzelnes neuronales Netzwerk für Texterkennung und Textidentifikation | Paper | HyperAI

Command Palette

STN-OCR: Ein einzelnes neuronales Netzwerk für Texterkennung und Textidentifikation

Christian Bartz Haojin Yang Christoph Meinel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

STN-OCR: Ein einzelnes neuronales Netzwerk für Texterkennung und Textidentifikation

Christian Bartz Haojin Yang Christoph Meinel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

STN-OCR: Ein einzelnes neuronales Netzwerk für Texterkennung und Textidentifikation

Christian Bartz Haojin Yang Christoph Meinel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters