HyperAIHyperAI
vor 17 Tagen

Zu einer Rohobjekterkennung unter vielfältigen Bedingungen

Zhong-Yu Li, Xin Jin, Boyuan Sun, Chun-Le Guo, Ming-Ming Cheng
Zu einer Rohobjekterkennung unter vielfältigen Bedingungen
Abstract

Bekannte Methoden zur Objekterkennung berücksichtigen häufig sRGB-Eingabedaten, die ursprünglich aus RAW-Daten mittels eines ISP (Image Signal Processor) komprimiert wurden, der ursprünglich für die visuelle Darstellung konzipiert war. Diese Kompression kann jedoch entscheidende Informationen für die Objekterkennung verlieren, insbesondere unter komplexen Licht- und Wetterbedingungen. Wir stellen den AODRaw-Datensatz vor, der 7.785 hochauflösende, echte RAW-Bilder mit insgesamt 135.601 annotierten Instanzen aus 62 Kategorien enthält und eine breite Vielfalt an Innen- und Außenbereichen unter neun unterschiedlichen Licht- und Wetterbedingungen abbildet. Auf Basis von AODRaw, der sowohl die Objekterkennung auf RAW- als auch auf sRGB-Daten unterstützt, bieten wir eine umfassende Benchmark zur Evaluierung aktueller Erkennungsmethoden. Wir stellen fest, dass eine sRGB-Vortrainierung die Leistungspotenziale der RAW-Objekterkennung einschränkt, da ein Domänenunterschied zwischen sRGB und RAW besteht. Dies führt uns dazu, direkt auf der RAW-Domäne vorzutrainieren. Allerdings ist es aufgrund der Kamerarauschen schwieriger, reichhaltige Repräsentationen bei der RAW-Vortrainierung zu erlernen als bei der sRGB-Vortrainierung. Um die RAW-Vortrainierung zu unterstützen, ziehen wir Wissen aus einem kommerziell erhältlichen Modell, das auf der sRGB-Domäne vortrainiert wurde. Als Ergebnis erzielen wir erhebliche Verbesserungen unter vielfältigen und ungünstigen Bedingungen, ohne zusätzliche Vorverarbeitungsmoduln zu benötigen. Der Quellcode und der Datensatz sind unter https://github.com/lzyhha/AODRaw verfügbar.