Command Palette
Search for a command to run...
LayoutNet:単一のRGB画像から3次元ルームレイアウトを再構成する
LayoutNet:単一のRGB画像から3次元ルームレイアウトを再構成する
Zou Chuhang Colburn Alex Shan Qi Hoiem Derek
概要
本研究では、パノラマ画像と透視投影画像の両方に一般化する能力を備えた、単一画像から部屋のレイアウトを予測するアルゴリズムを提案する。既存の手法がパノラマ画像を透視投影画像に分解するのに対し、本手法は直接パノラマ画像を処理する。ネットワークアーキテクチャはRoomNetに類似しているが、消失点に基づいた画像の整合性の確保、複数のレイアウト要素(角点、境界、サイズ、並進量)の同時予測、および予測結果に対して制約付きマンハッタンレイアウトを適合させる点で、性能の向上を示す。本手法はパノラマ画像処理において他の既存手法と比較して速度と精度の両面で優れた性能を発揮し、透視投影画像では最高水準の精度を達成するとともに、直方体形状に限らず、より一般的なマンハッタン型レイアウト(例:L字型の部屋)も対応可能である。