HyperAIHyperAI
vor 11 Tagen

ACDNet: Adaptiv kombinierte dilatierte Faltung für die Tiefenschätzung bei monokularen Panoramen

Chuanqing Zhuang, Zhengda Lu, Yiqun Wang, Jun Xiao, Ying Wang
ACDNet: Adaptiv kombinierte dilatierte Faltung für die Tiefenschätzung bei monokularen Panoramen
Abstract

Die Tiefenschätzung ist in den letzten Jahren ein entscheidender Schritt für die 3D-Rekonstruktion mithilfe von Panoramabildern geworden. Panoramabilder bewahren die vollständige räumliche Information, bringen jedoch durch die equirectanguläre Projektion Verzerrungen mit sich. In diesem Artikel stellen wir ACDNet vor, ein Netzwerk auf Basis der adaptiv kombinierten dilatierten Faltung, das zur Vorhersage einer dichten Tiefenkarte für monokulare Panoramabilder dient. Konkret kombinieren wir Faltungskerne mit unterschiedlichen Dilatationsraten, um den Empfindlichkeitsbereich in der equirectangulären Projektion zu erweitern. Gleichzeitig führen wir ein adaptives kanalweises Fusionsmodul ein, das die Merkmalskarten zusammenfasst und verschiedene Aufmerksamkeitsbereiche innerhalb des Empfindlichkeitsbereichs entlang der Kanäle erzeugt. Durch die Nutzung von kanalweiser Aufmerksamkeit bei der Konstruktion des adaptiven kanalweisen Fusionsmoduls kann das Netzwerk kontextuelle Informationen zwischen Kanälen effizient erfassen und nutzen. Schließlich führen wir Tiefenschätzungs-Experimente auf drei Datensätzen (sowohl virtuelle als auch realweltbasierte) durch, und die experimentellen Ergebnisse zeigen, dass unser vorgeschlagenes ACDNet die derzeitigen Stand der Technik (SOTA) erheblich übertrifft. Unsere Quellcodes und Modellparameter sind unter https://github.com/zcq15/ACDNet verfügbar.

ACDNet: Adaptiv kombinierte dilatierte Faltung für die Tiefenschätzung bei monokularen Panoramen | Neueste Forschungsarbeiten | HyperAI