Feinabgestimmte Fahrzeugklassifikation mit unsupervised Parts Co-occurrence Learning

Die feinkörnige Klassifizierung von Fahrzeugen stellt ein anspruchsvolles Forschungsproblem dar, das in der Fachcommunity bisher nur wenig Aufmerksamkeit gefunden hat. In diesem Artikel stellen wir eine tiefe Netzwerkarchitektur für die feinkörnige Klassifizierung von Fahrzeugen vor, die keine Annotationen von Teilen oder 3D-Bounding-Boxes erfordert. Zur unsupervisierten Entdeckung von Teilen wird eine Co-Occurrence-Schicht (COOC-Schicht) eingesetzt. Zudem wird ein zweistufiges Verfahren mit Transfer-Learning und Feinabstimmung (Fine-Tuning) verwendet, das es ermöglicht, Modelle effizienter zu feinabzustimmen, indem vortrainierte Gewichte auf ImageNet in bestimmten Schichten genutzt werden, während andere Schichten zufällig initialisiert werden. Unser Modell erreicht eine Genauigkeit von 86,5 % und übertrifft damit die bisherigen State-of-the-Art-Methoden auf dem BoxCars116K-Datensatz um 4 Prozentpunkte. Zudem erzielen wir auf dem CompCars-Datensatz jeweils 95,5 % und 93,19 % Genauigkeit bei den Train-Test-Splits 70-30 und 50-50, was eine Verbesserung gegenüber anderen Ansätzen um 4,5 % bzw. 8 % darstellt.