HyperAIHyperAI

Command Palette

Search for a command to run...

StereoNet: 導かれる階層的精緻化によるリアルタイムのエッジ認識深度予測

Sameh Khamis Sean Fanello Christoph Rhemann Adarsh Kowdle Julien Valentin Shahram Izadi

概要

本論文では、StereoNetを提案します。これは、NVidia Titan X上で60 fpsで動作する初めてのエンドツーエンドの深層アーキテクチャであり、高品質でエッジを保った量子化のない視差マップをリアルタイムに生成します。本論文の重要な洞察は、ネットワークが従来のステレオマッチング手法よりも桁違いに高いサブピクセル精度でのマッチングを達成できることです。これにより、非常に低い解像度のコストボリュームを使用することでリアルタイム性能を実現し、そのコストボリュームには高精度な視差を得るためのすべての情報がエンコードされています。空間的な精度は、学習済みのエッジ認識アップサンプリング関数を使用することで達成されます。当モデルは、左画像と右画像から特徴量を抽出するためにシアムネットワークを使用しています。視差の初期推定は非常に低い解像度のコストボリュームで計算され、その後階層的に学習済みのアップサンプリング関数を通じて高周波詳細が再導入されます。この関数はコンパクトなピクセル対ピクセル精緻化ネットワークを使用しており、色入力をガイドとして利用することで高品質なエッジ認識出力を生成することが可能です。我々は複数のベンチマークにおいて優れた結果を達成しており、提案手法が許容可能な計算量で極めて高い柔軟性を持つことを示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています