HyperAIHyperAI

Command Palette

Search for a command to run...

Text Spotting Transformers

Xiang Zhang Yongwen Su Subarna Tripathi Zhuowen Tu

Zusammenfassung

In diesem Artikel stellen wir TExt Spotting TRansformers (TESTR) vor, einen generischen end-to-end-Textspotting-Framework basierend auf Transformers zur Textdetektion und -erkenntnis in natürlichen Szenen. TESTR baut auf einem einzigen Encoder und zwei Dekodern auf, um gemeinsam die Regression der Kontrollpunkte von Textboxen und die Zeichenerkennung zu bewältigen. Im Gegensatz zu den meisten existierenden Ansätzen verzichtet unsere Methode auf Region-of-Interest-Operationen und heuristisch gesteuerte Nachverarbeitungsschritte; TESTR erweist sich insbesondere bei der Verarbeitung gekrümmter Textboxen als besonders effektiv, da hier besondere Berücksichtigung der Anpassung traditioneller Rechteckrepräsentationen erforderlich ist. Wir zeigen unsere kanonische Darstellung von Kontrollpunkten, die sowohl für Textinstanzen mit Bezier-Kurven- als auch mit Polygonannotationen geeignet ist. Zudem entwickeln wir einen Prozess zur polygonalen Detektion, der durch eine Bounding-Box geleitet wird (box-to-polygon). Experimente an gekrümmten und beliebig geformten Datensätzen belegen die state-of-the-art-Leistungsfähigkeit des vorgeschlagenen TESTR-Algorithmus.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp