2ヶ月前
LIGA-Stereo: LiDAR ジオメトリ認識表現の学習によるステレオベースの3D検出器
Guo, Xiaoyang ; Shi, Shaoshuai ; Wang, Xiaogang ; Li, Hongsheng

要約
ステレオベースの3次元検出は、中間深度マップや暗黙的な3次元幾何表現を用いてステレオ画像から3次元物体バウンディングボックスを検出することを目指しており、これは低コストの3次元認識ソリューションを提供します。しかし、その性能はLiDARベースの検出アルゴリズムと比較して依然として劣っています。正確な3次元バウンディングボックスの検出と位置特定のために、LiDARベースのモデルはLiDAR点群から物体境界と表面法線方向をエンコードすることができます。一方で、ステレオベースの検出器の検出結果は、ステレオマッチングの制約により誤った深度特徴に容易に影響を受けます。この問題を解決するために、我々はLIGA-Stereo(LiDAR Geometry Aware Stereo Detector)を提案し、高レベルの幾何学的に意識したLiDARベースの検出モデルの表現に基づいてステレオベースの3次元検出器を学習させることを目指しています。さらに、既存のボクセルベースのステレオ検出器が間接的な3次元教師データから効果的に意味論的特徴を学習できていないことを発見しました。これを補うために、補助的な2次元検出ヘッドを追加し、直接的な2次元意味論的教師データを提供します。実験結果は、上記の2つの戦略が幾何学的および意味論的表现能力を向上させたことを示しています。公式KITTIベンチマークにおいて、我々の方法は最新鋭のステレオ検出器と比較して車両、歩行者、自転車乗りに対する3次元検出性能をそれぞれ10.44%、5.69%、5.97% mAP向上させました。これにより、ステレオベースとLiDARベースの3次元検出器との間の性能差がさらに縮小されました。