HyperAIHyperAI
vor 16 Tagen

Hierarchische Normalisierung für robuste monokulare Tiefenschätzung

Chi Zhang, Wei Yin, Zhibin Wang, Gang Yu, Bin Fu, Chunhua Shen
Hierarchische Normalisierung für robuste monokulare Tiefenschätzung
Abstract

In diesem Artikel behandeln wir die Schätzung von Tiefenwerten aus einer einzigen Kamera mithilfe tiefer neuronaler Netzwerke. Um das Training tiefer monokularer Schätzmodelle mit verschiedenen Datensätzen zu ermöglichen, verwenden aktuelle Methoden Bildlevel-Normalisierungsstrategien, um affin-invariante Tiefenrepräsentationen zu erzeugen. Allerdings betont das Lernen mit Bildlevel-Normalisierung hauptsächlich die Beziehungen zwischen Pixelrepräsentationen und den globalen Statistiken innerhalb der Bilder, beispielsweise der Szenenstruktur, während feinere Tiefenunterschiede möglicherweise vernachlässigt werden. In diesem Artikel stellen wir eine neuartige mehrskalige Tiefennormalisierungsmethode vor, die die Tiefenrepräsentationen hierarchisch basierend auf räumlichen Informationen und Tiefenverteilungen normalisiert. Im Gegensatz zu früheren Normalisierungsstrategien, die ausschließlich auf der globalen Bildebene angewendet werden, kann die vorgeschlagene hierarchische Normalisierung feinere Details effektiv bewahren und die Genauigkeit verbessern. Wir präsentieren zwei Strategien, die jeweils den hierarchischen Normalisierungsrahmen im Tiefenbereich und im räumlichen Bereich definieren. Unsere umfangreichen Experimente zeigen, dass die vorgeschlagene Normalisierungsstrategie die bisherigen Methoden deutlich übertrifft und neue SOTA-Ergebnisse auf fünf Zero-Shot-Transfer-Benchmark-Datensätzen erzielt.

Hierarchische Normalisierung für robuste monokulare Tiefenschätzung | Neueste Forschungsarbeiten | HyperAI