Command Palette
Search for a command to run...
単眼セマンティック占有グリッドマッピングにおける畳み込み変分エンコーダー-デコーダーネットワークの利用
単眼セマンティック占有グリッドマッピングにおける畳み込み変分エンコーダー-デコーダーネットワークの利用
Chenyang Lu Marinus Jacobus Gerardus van de Molengraft Gijs Dubbelman
概要
本研究では、弱い二眼基準真値から単眼の意味計量占有グリッドマッピングのエンドツーエンド学習を調査および評価しました。ネットワークは4つのクラスとカメラからの鳥瞰図へのマッピングを予測することを学びます。その中心には、運転シーンの前面視覚情報を符号化し、その後2次元俯瞰図の直交座標系に復号する変分エンコーダー-デコーダーネットワークが用いられています。Cityscapesデータセットでの評価結果は、平面仮定に基づく確定的なマッピングアプローチよりも平均IoU(Intersection over Union)で12%以上優れていることを示しています。さらに、比較的小さな埋め込みベクトルを使用した変分サンプリングが車両の動的摂動に対する堅牢性と未見のKITTIデータに対する汎化能力をもたらすことを示しています。当社のネットワークは、解像度256x512ピクセルの入力画像と64x64占有グリッドセルの出力マップを使用して、Titan V GPU上で約35 Hzのリアルタイム推論速度を達成しています。