HyperAIHyperAI

Command Palette

Search for a command to run...

LayoutNet:単一のRGB画像から3次元ルームレイアウトを再構成する

Zou Chuhang Colburn Alex Shan Qi Hoiem Derek

概要

本研究では、パノラマ画像と透視投影画像の両方に一般化する能力を備えた、単一画像から部屋のレイアウトを予測するアルゴリズムを提案する。既存の手法がパノラマ画像を透視投影画像に分解するのに対し、本手法は直接パノラマ画像を処理する。ネットワークアーキテクチャはRoomNetに類似しているが、消失点に基づいた画像の整合性の確保、複数のレイアウト要素(角点、境界、サイズ、並進量)の同時予測、および予測結果に対して制約付きマンハッタンレイアウトを適合させる点で、性能の向上を示す。本手法はパノラマ画像処理において他の既存手法と比較して速度と精度の両面で優れた性能を発揮し、透視投影画像では最高水準の精度を達成するとともに、直方体形状に限らず、より一般的なマンハッタン型レイアウト(例:L字型の部屋)も対応可能である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています