8ヶ月前

3D マシンビジョン

コンピュータビジョン

コンピュータビジョン

Jianyuan Wang Minghao Chen Nikita Karaev Andrea Vedaldi Christian Rupprecht David Novotny

概要

VGGT（Very Generic Geometry Tracker）について紹介します。これは、フィードフォワード型ニューラルネットワークであり、1つの視点、数個の視点、または数百の視点からシーンのすべての主要な3次元属性を直接推論します。これらの属性には、カメラパラメータ、ポイントマップ、深度マップ、および3次元ポイントトラックが含まれます。このアプローチは、従来のモデルが単一のタスクに制限され、専門化されていた3次元コンピュータビジョン分野における一歩前進です。また、単純で効率的であり、1秒未満で画像を再構築し、ビジュアルジオメトリ最適化技術を用いた後処理が必要な代替手法よりも優れた性能を示しています。

ネットワークは複数の3次元タスクにおいて最先端の結果を達成しており、カメラパラメータ推定、マルチビュー深度推定、密集したポイントクラウド再構築、および3次元ポイント追跡が含まれます。さらに、事前学習されたVGGTを使用して特徴量バックボーンとして利用することで、非剛体ポイント追跡やフィードフォワード型新規視点合成などの下流タスクが大幅に向上することも示しています。コードとモデルは公開されており、以下のhttps URLからアクセスできます。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

3D マシンビジョン

コンピュータビジョン

コンピュータビジョン

Jianyuan Wang Minghao Chen Nikita Karaev Andrea Vedaldi Christian Rupprecht David Novotny

概要

VGGT（Very Generic Geometry Tracker）について紹介します。これは、フィードフォワード型ニューラルネットワークであり、1つの視点、数個の視点、または数百の視点からシーンのすべての主要な3次元属性を直接推論します。これらの属性には、カメラパラメータ、ポイントマップ、深度マップ、および3次元ポイントトラックが含まれます。このアプローチは、従来のモデルが単一のタスクに制限され、専門化されていた3次元コンピュータビジョン分野における一歩前進です。また、単純で効率的であり、1秒未満で画像を再構築し、ビジュアルジオメトリ最適化技術を用いた後処理が必要な代替手法よりも優れた性能を示しています。

ネットワークは複数の3次元タスクにおいて最先端の結果を達成しており、カメラパラメータ推定、マルチビュー深度推定、密集したポイントクラウド再構築、および3次元ポイント追跡が含まれます。さらに、事前学習されたVGGTを使用して特徴量バックボーンとして利用することで、非剛体ポイント追跡やフィードフォワード型新規視点合成などの下流タスクが大幅に向上することも示しています。コードとモデルは公開されており、以下のhttps URLからアクセスできます。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています