2ヶ月前

Triangulation Learning Network: 単眼からステレオ3D物体検出へ

Qin, Zengyi ; Wang, Jinglu ; Lu, Yan
Triangulation Learning Network: 単眼からステレオ3D物体検出へ
要約

本論文では、ステレオ画像からの3次元物体検出の問題に焦点を当て、その主要な課題であるステレオ情報を効果的に利用する方法について研究しています。従来のピクセルレベルの深度マップを使用する手法とは異なり、我々は3次元アンカーを用いて、ステレオ画像内の関心領域間で物体レベルの対応関係を明示的に構築することを提案します。これにより、深層ニューラルネットワークが3次元空間において目標となる物体を検出し、三角測量を行うことを学習します。また、表現特性を強化しノイジーサインを弱めるために、コスト効率の高いチャネル再重み付け戦略も導入しています。これら全ての手法は、単眼画像を使用する堅牢なベースライン検出器に柔軟に統合されています。我々は、単眼ベースラインとステレオ三角測量学習ネットワークが困難なKITTIデータセット上で既存の最先端技術よりも優れた3次元物体検出および位置特定性能を達成することを示しています。

Triangulation Learning Network: 単眼からステレオ3D物体検出へ | 最新論文 | HyperAI超神経