Lizenzplattenerkennung und -erkennung in ungehinderten Szenarien

Trotz der großen Anzahl kommerzieller und akademischer Methoden für die automatische Kennzeichenerkennung (Automatic License Plate Recognition, ALPR) konzentrieren sich die meisten bestehenden Ansätze auf eine spezifische Kennzeichenregion (z. B. europäisch, US-amerikanisch, brasilianisch, taiwanesisch usw.) und untersuchen häufig Datensätze mit vorwiegend frontal ausgerichteten Aufnahmen. In dieser Arbeit wird ein komplettes ALPR-System vorgestellt, das sich auf unbeschränkte Aufnahmeszenarien konzentriert, bei denen die Kennzeichen erheblich verformt sein können, beispielsweise aufgrund schräger Blickwinkel. Der zentrale Beitrag dieser Arbeit ist die Einführung eines neuartigen Faltungsneuralen Netzes (Convolutional Neural Network, CNN), das in der Lage ist, mehrere verzerrte Kennzeichen innerhalb eines einzigen Bildes zu erkennen und zu korrigieren, wobei die korrigierten Kennzeichen anschließend einer optischen Zeichenerkennung (Optical Character Recognition, OCR) zugeführt werden, um das endgültige Ergebnis zu erzielen. Als zusätzlicher Beitrag präsentieren wir zudem manuelle Annotationen für eine anspruchsvolle Sammlung von Kennzeichenbildern aus verschiedenen Regionen und unterschiedlichen Erfassungsbedingungen. Unsere experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode – ohne jegliche Parameteranpassung oder Feinabstimmung für ein spezifisches Szenario – in traditionellen Datensätzen mit den besten kommerziellen Systemen auf Augenhöhe liegt und sowohl akademische als auch kommerzielle Ansätze in anspruchsvollen Datensätzen übertrifft.