2ヶ月前

単眼3D物体検出における精度の高い提案と形状再構成の活用

Jason Ku; Alex D. Pon; Steven L. Waslander
単眼3D物体検出における精度の高い提案と形状再構成の活用
要約

私たちはMonoPSRという単眼3次元物体検出手法を提案します。この手法は、提案と形状再構成を利用しています。まず、ピンホールカメラモデルの基本的な関係を使用して、成熟した2次元物体検出器からの検出結果を用いて、シーン内の各物体に対して3次元の提案を生成します。これらの提案の3次元位置は非常に正確であり、最終的な3次元バウンディングボックス検出の回帰の難易度を大幅に低減します。同時に、物体中心座標系で点群を予測し、局所的なスケールと形状情報を学習します。しかし、形状情報を活用して3次元位置特定をガイドする方法が重要な課題です。そのため、新しい投影アライメント損失(projection alignment loss)を含む集約損失を設計し、これらのタスクをニューラルネットワーク内で共同最適化することで3次元位置特定の精度向上を目指しました。私たちの手法はKITTIベンチマークにおいて単眼手法の中で最新の最先端結果を達成しており、歩行者や自転車乗りなどのより難しいクラスでも優れた性能を示しながら効率的な実行時間を維持しています。

単眼3D物体検出における精度の高い提案と形状再構成の活用 | 最新論文 | HyperAI超神経