11日前

BEVStereo:動的時系列ステレオを用いたマルチビュー3Dオブジェクト検出における深度推定の向上

Yinhao Li, Han Bao, Zheng Ge, Jinrong Yang, Jianjian Sun, Zeming Li
BEVStereo:動的時系列ステレオを用いたマルチビュー3Dオブジェクト検出における深度推定の向上
要約

深度認識における固有の曖昧さに制約されるため、現在のカメラベース3次元物体検出手法は性能の限界に達している。直感的に、時系列マルチビューステレオ(MVS)技術を活用することで、この曖昧さに対処する自然なアプローチが得られる。しかし、従来のMVS手法を3次元物体検出の場面に適用する際には、2つの問題点がある。第一に、すべての視点間の類似性評価に膨大な計算コストがかかる。第二に、物体が頻繁に移動する屋外環境に対応することが困難である。こうした課題に応じ、本研究では動的にマッチング候補のスケールを選択する有効な時系列ステレオ手法を提案する。これにより、計算負荷を大幅に低減することが可能となる。さらに、反復アルゴリズムを設計し、より価値の高い候補を更新することで、移動する物体に対しても適応可能な仕組みを実現した。本手法をマルチビュー3次元検出器に適用した具体例として、BEVStereoを提案する。BEVStereoは、nuScenesデータセットのカメラオンリー トラックにおいて、新たな最先端性能(mAP 52.5%、NDS 61.0%)を達成した。また、多数の実験から、本手法が従来のMVSアプローチに比べ、複雑な屋外環境に対しても優れた対応能力を有することが明らかになった。コードは以下のURLにて公開されている:https://github.com/Megvii-BaseDetection/BEVStereo。

BEVStereo:動的時系列ステレオを用いたマルチビュー3Dオブジェクト検出における深度推定の向上 | 最新論文 | HyperAI超神経