2ヶ月前
Pre-trained ImageNet アーキテクチャの実時間道路走行画像のセマンティックセグメンテーションへの応用に関する弁護
Marin Oršić; Ivan Krešo; Petra Bevandić; Siniša Šegvić

要約
最近、困難な道路走行データセットにおける意味分割手法の成功が、多くの関連応用分野での関心を高めています。これらの応用の多くは、車両、ドローン、および様々な種類のロボットなどのモバイルプラットフォーム上でリアルタイム予測を行うことを含んでいます。リアルタイム設定は、極めて高い計算複雑さのために挑戦的です。多くの先行研究では、一般的な目的のアーキテクチャと比較して深さ、幅、層の容量を削減することで計算複雑さを低減するカスタム軽量アーキテクチャを使用してこの課題に取り組んでいます。私たちは、広範囲の計算予算において著しく優れた性能を達成する代替アプローチを提案します。まず、主な認識エンジンとして軽量な一般的な目的のアーキテクチャに依存します。次に、予測解像度を復元する最も費用対効果が高い解決策として、横方向接続を持つ軽量アップサンプリングを利用します。最後に、新しい方法で複数の解像度で共有される特徴を融合することにより受容野を拡大することを提案します。いくつかの道路走行データセットでの実験結果は、ImageNet事前学習パラメータを使用した場合やスクラッチから学習した場合でも提案手法が大幅な優位性を持っていることを示しています。私たちがCityscapesテストに提出したSwiftNetRN-18は75.5%のMIoU(Mean Intersection over Union)を達成し、GTX1080Ti上では1024x2048画像に対して39.9 Hz(フレームレート)で動作します。