HyperAIHyperAI

Command Palette

Search for a command to run...

AdaBins: Tiefenschätzung mithilfe adaptiver Binns

Shariq Farooq Bhat Ibraheem Alhashim Peter Wonka

Zusammenfassung

Wir behandeln das Problem der Schätzung einer hochwertigen dichten Tiefenkarte aus einem einzigen RGB-Eingabebild. Wir beginnen mit einer Baseline-Encoder-Decoder-architektur auf der Grundlage von konvolutionellen neuronalen Netzen und stellen die Frage, wie die globale Verarbeitung von Informationen zur Verbesserung der Gesamtschätzung der Tiefeninformation beitragen kann. Hierzu schlagen wir einen transformerbasierten Architekturblock vor, der den Tiefenbereich in Bins unterteilt, deren Mittelwerte jeweils adaptiv pro Bild geschätzt werden. Die endgültigen Tiefenwerte werden als lineare Kombinationen der Bin-Mittelpunkte berechnet. Wir bezeichnen unseren neuen Baustein als AdaBins. Unsere Ergebnisse zeigen eine entscheidende Verbesserung gegenüber dem Stand der Technik auf mehreren gängigen Tiefendatensätzen in allen Metriken. Wir validieren zudem die Wirksamkeit des vorgeschlagenen Blocks mittels einer Ablationsstudie und stellen den Quellcode sowie die entsprechenden vortrainierten Gewichte des neuen State-of-the-Art-Modells bereit.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp