vor 7 Monaten

Zusammenfassung

Kürzlich haben Modelle auf der Basis tiefer neuronaler Netze die Bereiche der Texterkennung und -detektion in Szenen dominiert. In dieser Arbeit untersuchen wir das Problem der Textlokalisierung in Szenen, das darauf abzielt, Text simultan zu detektieren und zu erkennen in natürlichen Bildern. Ein neuronales Netzwerkmodell, das von Anfang bis Ende trainiert werden kann, wird vorgeschlagen, um Textlokalisierung in Szenen durchzuführen. Das vorgeschlagene Modell, als Mask TextSpotter bezeichnet, wurde von der kürzlich veröffentlichten Arbeit Mask R-CNN inspiriert. Im Gegensatz zu früheren Methoden, die ebenfalls Textlokalisierung mit neuronalen Netzen durchführen können, die von Anfang bis Ende trainiert werden, nutzt Mask TextSpotter einen einfachen und glatten Trainingsprozess von Anfang bis Ende, bei dem präzise Textdetektion und -erkennung durch semantische Segmentierung erreicht werden. Darüber hinaus übertrifft es frühere Methoden bei der Verarbeitung von Textinstanzen unregelmäßiger Formen, wie zum Beispiel gekrümmtem Text. Experimente auf den Datensätzen ICDAR2013, ICDAR2015 und Total-Text zeigen, dass die vorgeschlagene Methode sowohl in den Aufgaben der Textdetektion in Szenen als auch in der end-to-end-Texterkennung standesüberragende Ergebnisse erzielt.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Semantische Segmentierung

Pengyuan Lyu Minghui Liao Cong Yao Wenhao Wu Xiang Bai

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Semantische Segmentierung

Pengyuan Lyu Minghui Liao Cong Yao Wenhao Wu Xiang Bai

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Mask TextSpotter: Ein von Ende zu Ende trainierbares neuronales Netzwerk zur Erkennung von Text in beliebigen Formen

Pengyuan Lyu Minghui Liao Cong Yao Wenhao Wu Xiang Bai

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mask TextSpotter: Ein von Ende zu Ende trainierbares neuronales Netzwerk zur Erkennung von Text in beliebigen Formen

Pengyuan Lyu Minghui Liao Cong Yao Wenhao Wu Xiang Bai

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mask TextSpotter: Ein von Ende zu Ende trainierbares neuronales Netzwerk zur Erkennung von Text in beliebigen Formen

Pengyuan Lyu Minghui Liao Cong Yao Wenhao Wu Xiang Bai

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters