HyperAIHyperAI

Command Palette

Search for a command to run...

幾何学を意識したマップの学習とカメラ位置特定

Samarth Brahmbhatt Jinwei Gu Kihwan Kim James Hays Jan Kautz

概要

地図は、画像ベースのカメラ位置特定および視覚SLAMシステムにおいて重要な構成要素です:画像間の幾何学的な制約を確立し、相対姿勢推定のドリフトを補正し、追跡が失われた後のカメラ再位置特定に使用されます。しかし、地図の正確な定義はしばしばアプリケーション固有であり、異なるシナリオ(例:3Dランドマーク、線、平面、ビジュアルワードの袋)のために手作業で調整されています。本研究では、MapNetと呼ばれる深層ニューラルネットワークを使用して地図を表現することを提案します。これによりデータ駆動型の地図表現を学習することが可能になります。従来の地図学習とは異なり、MapNetは視覚オドメトリやGPSなどの安価で普及しているセンサ入力を利用し、それらを画像と融合させてカメラ位置特定を行います。これらの入力によって表現される幾何学的な制約は、従来 bunble adjustment や pose-graph optimization に使用されてきましたが、MapNetの訓練では損失項として定式化され、推論時にも利用されます。これにより直接的に位置特定精度が向上するだけでなく、シーンから得られる追加のラベルなしビデオシークエンスを使用してMapNet(つまり地図)を自己監督的に更新することができます。また、深層学習に基づくカメラ姿勢回帰に適した新しいパラメータ化方法も提案しています。室内7-Scenesデータセットと屋外Oxford RobotCarデータセットでの実験結果は、従来の手法に対して大幅な性能向上を示しています。MapNetプロジェクトのウェブページは https://goo.gl/mRB3Au です。注:「bunble adjustment」および「pose-graph optimization」は一般的な日本語訳が存在しないため、「束調整」および「姿勢グラフ最適化」と訳しました。ただし、「bunble adjustment」には誤字がある可能性があります。「bundle adjustment」が正しい表記である場合は、「束調整」と修正してください。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています