6ヶ月前

3D マシンビジョン

畳み込みニューラルネットワーク

セマンティックセグメンテーション

アプローチ／フレームワーク

コンピュータビジョン

Zak Murez Tarrence van As James Bartolozzi Ayan Sinha Vijay Badrinarayanan Andrew Rabinovich

概要

我々は、撮影されたRGB画像群から、カメラの姿勢情報を用いて、切断された符号付き距離関数（TSDF）を直接回帰することで、シーンのエンド・トゥ・エンド3次元再構成を行う手法を提案する。従来の3次元再構成手法は、シーンの完全な3次元モデルを推定する前に、深度マップといった中間表現を用いることが一般的である。本研究では、3次元空間への直接回帰がより効果的であると仮定した。2次元CNNが各画像から独立して特徴量を抽出し、カメラの内部パラメータと外部パラメータを用いて、これらの特徴量をボクセル体積に逆投影・累積する。累積後、3次元CNNが累積された特徴量を精緻化し、TSDF値を予測する。さらに、追加的な計算コストをほとんど増加させることなく、3次元モデルのセマンティックセグメンテーションも得られる。本手法はScannetデータセット上で評価され、従来の最先端手法（深層マルチビュー立体視 followed by 伝統的なTSDF統合）と比較して、定量的および定性的な両面で顕著な性能向上を達成した。また、深度センサを用いた既存手法と比較し、本手法はRGB入力のみで3次元セマンティックセグメンテーションを実現している点で、従来の研究とは異なり、RGB入力のみによる問題解決に挑戦している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

3D マシンビジョン

畳み込みニューラルネットワーク

セマンティックセグメンテーション

アプローチ／フレームワーク

コンピュータビジョン

Zak Murez Tarrence van As James Bartolozzi Ayan Sinha Vijay Badrinarayanan Andrew Rabinovich

概要

我々は、撮影されたRGB画像群から、カメラの姿勢情報を用いて、切断された符号付き距離関数（TSDF）を直接回帰することで、シーンのエンド・トゥ・エンド3次元再構成を行う手法を提案する。従来の3次元再構成手法は、シーンの完全な3次元モデルを推定する前に、深度マップといった中間表現を用いることが一般的である。本研究では、3次元空間への直接回帰がより効果的であると仮定した。2次元CNNが各画像から独立して特徴量を抽出し、カメラの内部パラメータと外部パラメータを用いて、これらの特徴量をボクセル体積に逆投影・累積する。累積後、3次元CNNが累積された特徴量を精緻化し、TSDF値を予測する。さらに、追加的な計算コストをほとんど増加させることなく、3次元モデルのセマンティックセグメンテーションも得られる。本手法はScannetデータセット上で評価され、従来の最先端手法（深層マルチビュー立体視 followed by 伝統的なTSDF統合）と比較して、定量的および定性的な両面で顕著な性能向上を達成した。また、深度センサを用いた既存手法と比較し、本手法はRGB入力のみで3次元セマンティックセグメンテーションを実現している点で、従来の研究とは異なり、RGB入力のみによる問題解決に挑戦している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています