2ヶ月前
BiSeNet: 実時間セマンティックセグメンテーションのための双方向セグメンテーションネットワーク
Yu, Changqian ; Wang, Jingbo ; Peng, Chao ; Gao, Changxin ; Yu, Gang ; Sang, Nong

要約
セマンティックセグメンテーションには豊富な空間情報と広範な受容野が必要です。しかし、現代の手法は通常、リアルタイム推論速度を達成するために空間解像度を犠牲にします。これにより性能が低下する傾向があります。本論文では、このジレンマを解決するために新しい双方向セグメンテーションネットワーク(BiSeNet)を提案します。まず、空間情報を保持し、高解像度の特徴量を生成するために小さなストライドを持つSpatial Path(空間パス)を設計しました。一方で、十分な受容野を得るためには高速ダウンサンプリング戦略を持つContext Path(コンテキストパス)を使用しています。これらの2つのパスの上に、新たなFeature Fusion Module(特徴融合モジュール)を導入して効率的に特徴量を結合します。提案されたアーキテクチャはCityscapes、CamVid、COCO-Stuffデータセットにおいて速度とセグメンテーション性能のバランスを適切に取りました。特に2048x1024の入力に対して、NVIDIA Titan XPカード1枚で105 FPSの速度で68.4%の平均IOU(Intersection over Union)をCityscapesテストデータセット上で達成しており、同等の性能を持つ既存手法よりも著しく高速です。