2ヶ月前

HybridNets: エンドツーエンドの知覚ネットワーク

Vu, Dat ; Ngo, Bao ; Phan, Hung
HybridNets: エンドツーエンドの知覚ネットワーク
要約

エンドツーエンドネットワークはマルチタスク処理においてますます重要な役割を果たしています。この中でも特に注目すべき例として、自動運転におけるドライビング認識システムの重要性が高まっています。本論文では、マルチタスク処理向けのエンドツーエンド認識ネットワークを系統的に研究し、精度向上のためのいくつかの重要な最適化手法を提案します。まず、重み付き双方向特徴量ネットワークに基づいた効率的なセグメンテーションヘッドとボックス/クラス予測ネットワークを提案します。次に、重み付き双方向特徴量ネットワークの各レベルに対して自動的にカスタマイズされたアンカーを提案します。さらに、ネットワークのバランスと最適化を図るための効率的な損失関数と学習戦略を提案します。これらの最適化に基づいて、我々は交通物体検出、走行可能領域セグメンテーション、および車線検出を同時に実行するエンドツーエンド認識ネットワークを開発しました。これをハイブリッドネッツ(HybridNets)と呼びますが、既存技術よりも高い精度を達成しています。特に、ハイブリッドネッツはBerkeley DeepDriveデータセットで77.3の平均精度(mean Average Precision)を達成しており、31.6の平均交差率(mean Intersection Over Union)で車線検出性能も優れています。また、1283万パラメータと156億フローティングポイント演算で構成されています。加えて、ハイブリッドネッツは視覚認識タスクをリアルタイムで実行できるため、マルチタスク問題に対する実用的かつ正確な解決策となっています。コードは https://github.com/datvuthanh/HybridNets から入手可能です。