8ヶ月前

コンピュータビジョン

セマンティックセグメンテーション

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Chenyang Lu Marinus Jacobus Gerardus van de Molengraft Gijs Dubbelman

概要

本研究では、弱い二眼基準真値から単眼の意味計量占有グリッドマッピングのエンドツーエンド学習を調査および評価しました。ネットワークは4つのクラスとカメラからの鳥瞰図へのマッピングを予測することを学びます。その中心には、運転シーンの前面視覚情報を符号化し、その後2次元俯瞰図の直交座標系に復号する変分エンコーダー-デコーダーネットワークが用いられています。Cityscapesデータセットでの評価結果は、平面仮定に基づく確定的なマッピングアプローチよりも平均IoU（Intersection over Union）で12%以上優れていることを示しています。さらに、比較的小さな埋め込みベクトルを使用した変分サンプリングが車両の動的摂動に対する堅牢性と未見のKITTIデータに対する汎化能力をもたらすことを示しています。当社のネットワークは、解像度256x512ピクセルの入力画像と64x64占有グリッドセルの出力マップを使用して、Titan V GPU上で約35 Hzのリアルタイム推論速度を達成しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

コンピュータビジョン

セマンティックセグメンテーション

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Chenyang Lu Marinus Jacobus Gerardus van de Molengraft Gijs Dubbelman

概要

本研究では、弱い二眼基準真値から単眼の意味計量占有グリッドマッピングのエンドツーエンド学習を調査および評価しました。ネットワークは4つのクラスとカメラからの鳥瞰図へのマッピングを予測することを学びます。その中心には、運転シーンの前面視覚情報を符号化し、その後2次元俯瞰図の直交座標系に復号する変分エンコーダー-デコーダーネットワークが用いられています。Cityscapesデータセットでの評価結果は、平面仮定に基づく確定的なマッピングアプローチよりも平均IoU（Intersection over Union）で12%以上優れていることを示しています。さらに、比較的小さな埋め込みベクトルを使用した変分サンプリングが車両の動的摂動に対する堅牢性と未見のKITTIデータに対する汎化能力をもたらすことを示しています。当社のネットワークは、解像度256x512ピクセルの入力画像と64x64占有グリッドセルの出力マップを使用して、Titan V GPU上で約35 Hzのリアルタイム推論速度を達成しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています