2ヶ月前

オブジェクト中心の時間モデルを用いた効率的なマルチビュー3Dオブジェクト検出の探索

Wang, Shihao ; Liu, Yingfei ; Wang, Tiancai ; Li, Ying ; Zhang, Xiangyu
オブジェクト中心の時間モデルを用いた効率的なマルチビュー3Dオブジェクト検出の探索
要約

本論文では、多視点3D物体検出のための長系列モデリングフレームワークであるStreamPETRを提案します。PETRシリーズのスパースクエリ設計に基づいて、オブジェクト中心の一貫した時間的メカニズムを体系的に開発しました。このモデルはオンラインで動作し、長期的な履歴情報がオブジェクトクエリを通じてフレームごとに伝播されます。また、物体の動きをモデル化するためのモーションアウェアレイヤーノルム化を導入しています。StreamPETRは、単一フレームベースラインと比較して計算コストがわずかにしか増加せず、大幅な性能向上を達成しています。標準的なnuScenesベンチマークにおいて、LiDARベースの方法と同等の性能(67.6% NDS & 65.3% AMOTA)を達成した初めてのオンライン多視点手法です。軽量版では45.0% mAPと31.7 FPSを実現しており、最先端手法(SOLOFusion)よりも2.3% mAP高く、1.8倍速いFPSとなっています。コードはhttps://github.com/exiawsh/StreamPETR.git で公開されています。

オブジェクト中心の時間モデルを用いた効率的なマルチビュー3Dオブジェクト検出の探索 | 最新論文 | HyperAI超神経