HyperAIHyperAI

Command Palette

Search for a command to run...

Beliebige Tiefenschätzung von Stereo-Bildern auf mobilen Geräten

Yan Wang∗1, Zihang Lai∗2, Gao Huang1, Brian H. Wang1, Laurens van der Maaten3, Mark Campbell1, and Kilian Q. Weinberger1

Zusammenfassung

Viele Anwendungen der stereoskopischen Tiefenschätzung in der Robotik erfordern die Echtzeitgenerierung genauer Disparitätskarten unter erheblichen rechnerischen Einschränkungen. Aktuelle Standesalgorithmen zwingen zu einer Wahl zwischen entweder langsam generierten, aber genauen Abbildungen oder schnell generierten, aber ungenauen Abbildungen. Zudem benötigen diese Methoden in der Regel viel zu viele Parameter, um auf Geräten mit eingeschränkter Leistung oder Speicherplatz nutzbar zu sein. Angeregt durch diese Nachteile schlagen wir einen neuen Ansatz für die Disparitätsvorhersage im Anytime-Setting vor. Im Gegensatz zu früheren Arbeiten kann unser end-to-end gelernter Ansatz während der Inferenz Rechenleistung und Genauigkeit austauschen. Die Tiefenschätzung erfolgt in Stufen, wobei das Modell jederzeit abgefragt werden kann, um seine aktuell beste Schätzung auszugeben. Unser endgültiges Modell kann 1242 × 375 Auflösungsbilder in einem Bereich von 10-35 FPS auf einem NVIDIA Jetson TX2 Modul verarbeiten, wobei die Fehler nur marginal zunehmen – und zwar mit zwei Größenordnungen weniger Parametern als der wettbewerbsfähigste Baseline. Der Quellcode ist unter https://github.com/mileyan/AnyNet verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp