2ヶ月前
Deep MANTA: 単眼画像からの2Dおよび3D車両解析のための粗略から精密な多タスクネットワーク
Florian Chabot; Mohamed Chaouch; Jaonary Rabarisoa; Céline Teulière; Thierry Chateau

要約
本論文では、与えられた画像から多数の車両分析タスクを実行する新しい手法であるDeep MANTA(Deep Many-Tasks)について紹介します。この手法では、車両検出、部位位置特定、可視性評価、3次元寸法推定を同時に実現する堅牢な畳み込みニューラルネットワークが提案されています。そのアーキテクチャは、車両検出性能を向上させる新しい粗密型オブジェクト提案に基づいています。さらに、Deep MANTAネットワークは、これらの部位が見えない場合でも車両部位の位置特定を行うことができます。推論段階では、ネットワークの出力がリアルタイムで堅牢な姿勢推定アルゴリズムに利用され、精密な向き推定と3次元車両位置特定が行われます。実験結果から、当手法は非常に難易度の高いKITTIベンチマークにおいて単眼カメラを使用した最先端の手法よりも優れた性能を示していることが確認されました。