Die Durchsetzung geometrischer Nebenbedingungen des virtuellen Normalenvektors für die Tiefenschätzung

Die monokulare Tiefenschätzung spielt eine entscheidende Rolle bei der Erfassung der 3D-Szenengeometrie. Obwohl aktuelle Methoden in Bewertungsmaßstäben wie dem pixelweisen relativen Fehler erstaunliche Fortschritte gemacht haben, vernachlässigen die meisten Ansätze die geometrischen Restriktionen im 3D-Raum. In dieser Arbeit zeigen wir die Bedeutung höherer 3D-geometrischer Restriktionen für die Tiefenschätzung. Durch den Entwurf eines Verlustterms, der eine einfache Art von geometrischen Restriktionen erzwingt, nämlich virtuelle Normalrichtungen, die durch zufällig ausgewählte drei Punkte im rekonstruierten 3D-Raum bestimmt werden, können wir die Genauigkeit der Tiefenschätzung erheblich verbessern. Besonders bemerkenswert ist, dass das Nebenprodukt dieser hinreichend genauen geschätzten Tiefe darin besteht, dass wir nun in der Lage sind, gute 3D-Strukturen der Szene, wie zum Beispiel den Punktwolke und die Oberflächennormalen direkt aus der Tiefe zu rekonstruieren, wodurch die Notwendigkeit des Trainings neuer Submodelle vermieden wird, wie es bisher üblich war. Experimente mit zwei Benchmarks, NYU Depth-V2 und KITTI, belegen die Effektivität unserer Methode und ihre Standarte-leistende Performance.