HyperAIHyperAI
vor 2 Monaten

Monokulare semantische Besetzungsnetz-Kartierung mit konvolutionellen variationellen Encoder-Decoder-Netzwerken

Lu, Chenyang ; van de Molengraft, Marinus Jacobus Gerardus ; Dubbelman, Gijs
Monokulare semantische Besetzungsnetz-Kartierung mit konvolutionellen variationellen
Encoder-Decoder-Netzwerken
Abstract

In dieser Arbeit untersuchen und evaluieren wir das end-to-end-Lernen von monokularen semantisch-metrischen Besetztheitsschemata aus schwachen binokularen Grundwahrheiten. Das Netzwerk lernt, vier Klassen vorherzusagen, sowie eine Abbildung von der Kameraansicht in die Vogelperspektive. Im Zentrum steht dabei ein variationsgesteuerter Encoder-Decoder-Netzwerks, der die visuelle Information des Fahrzeugumfelds aus der Frontansicht kodiert und anschließend in ein 2-D Top-Down-Kartesisches Koordinatensystem dekodiert. Die Auswertungen auf Cityscapes zeigen, dass das end-to-end-Lernen von semantisch-metrischen Besetztheitsschemata den deterministischen Ansatz mit der Annahme einer ebenen Fläche um mehr als 12 % im mittleren IoU (Intersection over Union) übertrifft. Darüber hinaus demonstrieren wir, dass die variationsgesteuerte Stichprobenziehung mit einem relativ kleinen Einbettungsvektor Robustheit gegen dynamische Störungen des Fahrzeugs und Übertragbarkeit auf unbekannte KITTI-Daten bietet. Unser Netzwerk erreicht Echtzeit-Inferenzraten von etwa 35 Hz für ein Eingabebild mit einer Auflösung von 256x512 Pixeln und eine Ausgabekarte mit 64x64 Besetztheitsrasterzellen unter Verwendung einer Titan V GPU.

Monokulare semantische Besetzungsnetz-Kartierung mit konvolutionellen variationellen Encoder-Decoder-Netzwerken | Neueste Forschungsarbeiten | HyperAI