7ヶ月前

3D マシンビジョン

畳み込みニューラルネットワーク

セマンティックセグメンテーション

アプローチ／フレームワーク

コンピュータビジョン

Shuran Song Fisher Yu Andy Zeng Angel X. Chang Manolis Savva Thomas Funkhouser

概要

本論文は、シングルビューの深度マップ観測からシーンの体積占有と意味ラベルの完全な3Dボクセル表現を生成するタスクである意味的なシーン補完に焦点を当てています。従来の研究では、シーン補完と深度マップの意味ラベリングを別々に扱ってきました。しかし、我々はこれらの2つの問題が密接に関連していることを観察しました。これらの2つのタスクの相関性を活用するために、シングル深度画像を入力として受け取り、カメラ視錐内のすべてのボクセルに対して同時に占有状態と意味ラベルを出力するエンドツーエンドの3D畳み込みネットワークである意味的なシーン補完ネットワーク（SSCNet）を導入します。当該ネットワークは、受容野を効率的に拡大し、3Dコンテキスト学習を可能にする希薄化に基づく3Dコンテキストモジュールを使用しています。ネットワークの訓練のために、我々はSUNCGという手動で作成された大規模な合成3Dシーンデータセットを作成しました。このデータセットには密集した体積アノテーションが含まれています。我々の実験結果は、結合モデルが各タスクを個別に処理する方法よりも優れ、また意味的なシーン補完タスクにおいて代替手法よりも優れていることを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

3D マシンビジョン

畳み込みニューラルネットワーク

セマンティックセグメンテーション

アプローチ／フレームワーク

コンピュータビジョン

Shuran Song Fisher Yu Andy Zeng Angel X. Chang Manolis Savva Thomas Funkhouser

概要

本論文は、シングルビューの深度マップ観測からシーンの体積占有と意味ラベルの完全な3Dボクセル表現を生成するタスクである意味的なシーン補完に焦点を当てています。従来の研究では、シーン補完と深度マップの意味ラベリングを別々に扱ってきました。しかし、我々はこれらの2つの問題が密接に関連していることを観察しました。これらの2つのタスクの相関性を活用するために、シングル深度画像を入力として受け取り、カメラ視錐内のすべてのボクセルに対して同時に占有状態と意味ラベルを出力するエンドツーエンドの3D畳み込みネットワークである意味的なシーン補完ネットワーク（SSCNet）を導入します。当該ネットワークは、受容野を効率的に拡大し、3Dコンテキスト学習を可能にする希薄化に基づく3Dコンテキストモジュールを使用しています。ネットワークの訓練のために、我々はSUNCGという手動で作成された大規模な合成3Dシーンデータセットを作成しました。このデータセットには密集した体積アノテーションが含まれています。我々の実験結果は、結合モデルが各タスクを個別に処理する方法よりも優れ、また意味的なシーン補完タスクにおいて代替手法よりも優れていることを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

単一の深度画像からの意味的シーン補完 | 記事 | HyperAI超神経