3D-Skizzenbewusste semantische Szenerien vervollständigen durch halbüberwachte Strukturvorinformation
Das Ziel der Aufgabe der semantischen Szenenvervollständigung (SSC) besteht darin, aus einer einzelnen Sicht eine vollständige 3D-Voxel-Darstellung des Volumenbesetzungsgrades und die semantischen Klassifizierungen der Objekte in der Szene gleichzeitig vorherzusagen. Da die Rechenkosten im Allgemeinen mit dem Anstieg der Voxel-Auflösung explosionsartig ansteigen, müssen die meisten aktuellen Methoden ihre Architektur auf eine niedrig-auflösende Darstellung zurechtstutzen, wobei sie Details vorhersagen müssen. Somit wird die Voxel-Auflösung zu einem der entscheidenden Schwierigkeiten, die zu einer Leistungsflasche führen.In dieser Arbeit schlagen wir eine neue, geometrieorientierte Strategie vor, um Tiefeninformationen in eine niedrig-auflösende Voxel-Darstellung einzubetten. Diese Strategie kann trotzdem ausreichend geometrische Informationen kodieren, wie zum Beispiel Raumlayout, Größen und Formen von Objekten, um unsichtbare Bereiche der Szene mit gut strukturierter Detailgenauigkeit abzuleiten. Dazu schlagen wir zunächst eine neuartige 3D-Skizzenbewusste Merkmalskodierung vor, die geometrische Informationen effektiv und effizient kodiert. Mit Hilfe dieser 3D-Skizze entwickeln wir ferner ein einfaches aber effektives Framework für die semantische Szenenvervollständigung, das einen leichten 3D-Skizhen-Halluzinationsmodul integriert, um durch eine semi-überwachte Strukturvorwissen-Lernstrategie den Besetzungsgrad und die semantischen Klassifizierungen zu leiten. Wir zeigen, dass unsere vorgeschlagene geometrische Kodierung besser funktioniert als das habituelle Tiefenmerkmalslernen aus herkömmlichen SSC-Frameworks. Unser endgültiges Modell übertreffen bestehende Methoden konsistent auf drei öffentlichen Benchmarks und benötigt nur 3D-Volumina mit einer Auflösung von 60 x 36 x 60 sowohl für Eingabe als auch Ausgabe. Der Code und das zusätzliche Material werden unter https://charlesCXK.github.io zur Verfügung gestellt.请注意,虽然您的要求中提到“使其更符合法语读者的阅读习惯”,但您需要的是德语翻译。因此,我已根据德语的阅读习惯进行了调整。如果您有任何其他要求或需要进一步修改,请告知。