HyperAIHyperAI

Command Palette

Search for a command to run...

MonoRUn:再構成と不確実性伝播を用いた単眼3Dオブジェクト検出

Hansheng Chen Yuyao Huang Wei Tian Zhong Gao Lu Xiong

概要

3次元空間における物体の局所化は、単眼3次元物体検出において困難な課題の一つである。近年の6DoF姿勢推定に関する進展により、画像と物体3次元モデル間の高密度な2D-3次元対応マップを予測し、その後Perspective-n-Point(PnP)アルゴリズムを用いて物体の姿勢を推定することで、顕著な局所化精度が達成可能であることが示された。しかし、こうした手法は物体の幾何形状の真値(ground truth)を用いた学習に依存しており、実際の屋外シーンではこれを取得することが困難である。この問題に対処するため、本研究では、単純な3次元バウンディングボックスのアノテーションのみを用いて、高密度な対応関係および幾何情報を自己教師学習的に学習する新たな検出フレームワーク「MonoRUn」を提案する。ピクセルに関連する3次元物体座標を回帰するため、不確実性を意識した領域再構成ネットワークを採用する。自己教師学習のため、予測された3次元座標を再び画像平面に射影する。この際、不確実性を重み付けた再投影誤差を最小化するため、ロバストKL損失を提案する。テストフェーズでは、ネットワークの不確実性を下流のすべてのモジュールに伝播させることで活用する。具体的には、不確実性を駆動するPnPアルゴリズムを用いて物体の姿勢とその共分散を推定する。広範な実験により、本手法がKITTIベンチマークにおいて、現在の最先端手法を上回ることを実証した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
MonoRUn:再構成と不確実性伝播を用いた単眼3Dオブジェクト検出 | 記事 | HyperAI超神経