2ヶ月前
視覚深度推定からの疑似LiDAR:自動運転における3D物体検出のギャップを埋める
Wang, Yan ; Chao, Wei-Lun ; Garg, Divyansh ; Hariharan, Bharath ; Campbell, Mark ; Weinberger, Kilian Q.

要約
3D物体検出は自動運転において重要なタスクです。最新の技術は、高精度な検出率を達成していますが、これは精密で高価なLiDAR技術から得られる3D入力データに依存しています。これまで、より安価な単眼またはステレオ画像データに基づくアプローチは、著しく低い精度しか達成できませんでした --- このギャップは一般的に、画像ベースの深度推定の低品質さに起因すると考えられてきました。しかし、本論文では、データの品質ではなくその表現が大部分の違いを説明していると主張します。畳み込みニューラルネットワークの内部動作を考慮に入れ、画像ベースの深度マップを擬似LiDAR表現に変換することを提案します --- つまり、LiDAR信号を模倣するものです。この表現を使用することで、既存の様々なLiDARベースの検出アルゴリズムを適用できます。人気のあるKITTIベンチマークにおいて、当方のアプローチは画像ベースの性能における現行最先端よりも大幅な改善を達成しました --- 30m範囲内の物体検出精度を以前の最先端である22%から前例のない74%へと向上させました。提出時において、当方のアルゴリズムはステレオ画像ベースアプローチに関するKITTI 3D物体検出リーダーボードで最高位となっています。当方のコードは公開されており、https://github.com/mileyan/pseudo_lidar で入手可能です。