11日前

オブジェクトは異なる:柔軟な単眼3Dオブジェクト検出

Yunpeng Zhang, Jiwen Lu, Jie Zhou
オブジェクトは異なる:柔軟な単眼3Dオブジェクト検出
要約

単一の画像から深度情報なしで3次元物体を高精度に局在化することは、極めて困難な課題である。既存の大多数の手法は、物体の分布が多様であるにもかかわらず、すべての物体に対して同一のアプローチを採用しており、特に切断された物体(truncated objects)に対しては性能が限定的である。本論文では、単眼3次元物体検出のための柔軟なフレームワークを提案する。このフレームワークは、切断された物体を明示的に分離し、物体の深度推定に複数のアプローチを適応的に統合する。具体的には、長尾分布に従う切断物体の特徴マップのエッジを分離して処理することで、通常の物体の最適化に影響を与えないようにしている。さらに、物体の深度推定を、直接回帰された深度と、異なるキーポイント群から解得された深度の不確実性を考慮したアンサンブルとして定式化している。実験の結果、KITTIベンチマークのテストセットにおいて、中程度の難易度では最先端手法に対して27%、困難な難易度では30%の相対的な性能向上を達成しつつ、リアルタイムの効率性を維持した。コードは、\url{https://github.com/zhangyp15/MonoFlex} で公開される予定である。

オブジェクトは異なる:柔軟な単眼3Dオブジェクト検出 | 最新論文 | HyperAI超神経