8ヶ月前

オブジェクト検出

コンピュータビジョン

Georgia Gkioxari Jitendra Malik Justin Johnson

概要

2D認識技術の急速な進歩により、実世界の画像における物体検出を正確に行うシステムが開発されました。しかし、これらのシステムは2Dでの予測に留まり、世界の3D構造を無視しています。一方で、3D形状予測の進歩は主に合成ベンチマークや単独の物体に焦点を当ててきました。本研究では、これらの2つの分野における進歩を統合します。我々は、実世界の画像から物体を検出し、各検出された物体の完全な3D形状を与える三角メッシュを生成するシステムを提案します。このシステムはMesh R-CNNと呼ばれ、Mask R-CNNにメッシュ予測ブランチを追加することで、まず粗いボクセル表現を予測し、それをメッシュに変換し、さらにメッシュの頂点と辺に対してグラフ畳み込みネットワーク（Graph Convolutional Network）によって精緻化するというプロセスを行います。我々はShapeNetにおいてメッシュ予測ブランチの有効性を確認し、単一画像からの形状予測において先行研究を超える性能を達成しました。その後、Pix3Dにおいて全般的Mesh R-CNNシステムを展開し、物体検出とその3D形状予測を同時に行いました。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

オブジェクト検出

コンピュータビジョン

Georgia Gkioxari Jitendra Malik Justin Johnson

概要

2D認識技術の急速な進歩により、実世界の画像における物体検出を正確に行うシステムが開発されました。しかし、これらのシステムは2Dでの予測に留まり、世界の3D構造を無視しています。一方で、3D形状予測の進歩は主に合成ベンチマークや単独の物体に焦点を当ててきました。本研究では、これらの2つの分野における進歩を統合します。我々は、実世界の画像から物体を検出し、各検出された物体の完全な3D形状を与える三角メッシュを生成するシステムを提案します。このシステムはMesh R-CNNと呼ばれ、Mask R-CNNにメッシュ予測ブランチを追加することで、まず粗いボクセル表現を予測し、それをメッシュに変換し、さらにメッシュの頂点と辺に対してグラフ畳み込みネットワーク（Graph Convolutional Network）によって精緻化するというプロセスを行います。我々はShapeNetにおいてメッシュ予測ブランチの有効性を確認し、単一画像からの形状予測において先行研究を超える性能を達成しました。その後、Pix3Dにおいて全般的Mesh R-CNNシステムを展開し、物体検出とその3D形状予測を同時に行いました。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています