HyperAIHyperAI
vor 17 Tagen

Single Shot Self-Reliant Scene Text Spotter durch entkoppelte aber kollaborative Detektion und Erkennung

Jingjing Wu, Pengyuan Lyu, Guangming Lu, Chengquan Zhang, Wenjie Pei
Single Shot Self-Reliant Scene Text Spotter durch entkoppelte aber kollaborative Detektion und Erkennung
Abstract

Typische Text-Spotters folgen dem zweistufigen Spotting-Paradigma, bei dem zunächst die Grenzen einer Textinstanz detektiert werden und anschließend die Texterkennung innerhalb der erkannten Regionen durchgeführt wird. Trotz der bemerkenswerten Fortschritte dieses Paradigmas besteht eine wichtige Einschränkung darin, dass die Leistung der Texterkennung stark von der Genauigkeit der Textdetektion abhängt, was die potenzielle Fehlerfortpflanzung von der Detektion zur Erkennung zur Folge hat. In dieser Arbeit präsentieren wir den Single-Shot Self-Reliant Scene Text Spotter v2 (SRSTS v2), der diese Einschränkung umgeht, indem die Erkennung von der Detektion entkoppelt wird, während beide Aufgaben gleichzeitig optimiert werden. Konkret wählt unser SRSTS v2 repräsentative Merkmalspunkte um jede potenzielle Textinstanz herum aus und führt sowohl die Textdetektion als auch die Texterkennung parallel unter Leitung dieser ausgewählten Punkte durch. Dadurch ist die Texterkennung nicht mehr von der Detektion abhängig, was die Fehlerfortpflanzung von der Detektion zur Erkennung erheblich verringert. Zudem wird das Sampling-Modul unter der Aufsicht sowohl der Detektion als auch der Erkennung trainiert, was eine kooperative Optimierung und gegenseitige Verbesserung beider Aufgaben ermöglicht. Durch den vorteilhaften, auf Sampling basierenden parallelen Spotting-Framework ist unsere Methode in der Lage, Textinstanzen korrekt zu erkennen, selbst wenn die präzisen Textgrenzen schwer zu detektieren sind. Umfangreiche Experimente auf vier Benchmarks zeigen, dass unsere Methode gegenüber aktuellen State-of-the-Art-Spotters überzeugt.

Single Shot Self-Reliant Scene Text Spotter durch entkoppelte aber kollaborative Detektion und Erkennung | Neueste Forschungsarbeiten | HyperAI