HyperAIHyperAI
vor 17 Tagen

TriStereoNet: Ein Trinokular-Frame­work für die Mehrbasen-Disparitäts­schätzung

Faranak Shamsafar, Andreas Zell
TriStereoNet: Ein Trinokular-Frame­work für die Mehrbasen-Disparitäts­schätzung
Abstract

Stereo-Sicht ist eine effektive Methode zur Tiefenschätzung mit breiter Anwendbarkeit in autonomen Fahrszenarien sowohl in städtischen als auch auf Autobahnen. Obwohl verschiedene auf Deep Learning basierende Ansätze für die Stereo-Bildverarbeitung entwickelt wurden, sind die Eingabedaten aus einem binokularen Setup mit fester Basisebene begrenzt. Um dieses Problem anzugehen, präsentieren wir ein end-to-end-Netzwerk zur Verarbeitung von Daten aus einem trinokularen Setup, das aus einer engen und einer weiten Stereo-Paar-Kombination besteht. In diesem Entwurf werden zwei binokulare Datensätze mit einer gemeinsamen Referenzbild verwendet, wobei die Netzwerkgewichte gemeinsam genutzt und eine mittlere Ebene-Fusion durchgeführt wird. Außerdem stellen wir eine Guided Addition-Methode zur Fusion der 4D-Daten beider Basen vor. Zusätzlich wird ein iterativer, sequenzieller Selbstüberwachungs- und überwachter Lernansatz auf realen und synthetischen Datensätzen vorgestellt, der die praktische Trainierung des trinokularen Systems ermöglicht, ohne dass Ground-Truth-Daten des realen Datensatzes erforderlich sind. Experimentelle Ergebnisse zeigen, dass das trinokulare Disparitätsnetzwerk die Leistung übertrifft, die bei der Verarbeitung einzelner Paare mit einer ähnlichen Architektur erzielt wird. Code und Datensatz: https://github.com/cogsys-tuebingen/tristereonet.

TriStereoNet: Ein Trinokular-Frame­work für die Mehrbasen-Disparitäts­schätzung | Neueste Forschungsarbeiten | HyperAI