2ヶ月前

Disp R-CNN: 形状事前情報誘導によるステレオ3D物体検出のためのインスタンス視差推定

Sun, Jiaming ; Chen, Linghao ; Xie, Yiming ; Zhang, Siyu ; Jiang, Qinhong ; Zhou, Xiaowei ; Bao, Hujun
Disp R-CNN: 形状事前情報誘導によるステレオ3D物体検出のためのインスタンス視差推定
要約

本論文では、ステレオ画像から3D物体検出を行う新しいシステムであるDisp R-CNNを提案します。最近の多くの研究では、この問題をまず視差推定により点群を復元し、その後3D検出器を適用することで解決しています。視差マップは全画像に対して計算されるため、コストが高く、カテゴリ固有の事前情報を活用することができません。これに対し、我々は対象物体の画素のみに視差を予測し、より正確な視差推定のためにカテゴリ固有の形状事前情報を学習するインスタンス視差推定ネットワーク(iDispNet)を設計しました。訓練データにおける視差注釈の不足という課題に対処するために、LiDAR点群を使用せずに統計的な形状モデルを用いて濃密な視差疑似正解データを生成することを提案します。これにより、当システムはより広範に応用可能となります。KITTIデータセットでの実験結果によると、訓練時にLiDAR正解データが利用できない場合でも、Disp R-CNNは競合する性能を達成し、平均精度において従来の最先端手法よりも20%優れた性能を示しました。

Disp R-CNN: 形状事前情報誘導によるステレオ3D物体検出のためのインスタンス視差推定 | 最新論文 | HyperAI超神経