HyperAIHyperAI

Command Palette

Search for a command to run...

Vorhersage von Tiefe, Oberflächennormalen und semantischen Etiketten mit einer gemeinsamen Multi-Skalen-Faltungsarchitektur

David Eigen Rob Fergus

Zusammenfassung

In dieser Arbeit behandeln wir drei verschiedene Aufgaben der Computer Vision mit einer einzigen grundlegenden Architektur: Tiefenschätzung, Oberflächennormaleinschätzung und semantisches Labeling. Wir verwenden ein mehrskaliges Faltungsnetzwerk (multiscale convolutional network), das sich durch nur geringfügige Anpassungen leicht an jede Aufgabe anpassen lässt und direkt von dem Eingangsbild zum Ausgabebild schreitet. Unsere Methode verfeinert die Vorhersagen schrittweise über eine Reihe von Skalen und erfasst viele Bildetails ohne die Verwendung von Superpixeln oder niedrigstufiger Segmentierung. Wir erreichen den aktuellen Stand der Technik in Benchmarks für alle drei Aufgaben.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp