2ヶ月前

ShelfNetを用いた高速セマンティックセグメンテーション

Juntang Zhuang; Junlin Yang; Lin Gu; Nicha Dvornek
ShelfNetを用いた高速セマンティックセグメンテーション
要約

本論文では、ShelfNetという新しいアーキテクチャを提案します。これは高速かつ正確なセマンティックセグメンテーションを実現するためのものです。従来の単一エンコーダー-デコーダー構造とは異なり、ShelfNetは各空間レベルでスキップ接続を持つ複数のエンコーダー-デコーダーブランチペアを持っています。この構造は、複数の列がある棚のように見えます。棚型の構造は、複数の深層と浅層パスの集合体として捉えることができ、これにより精度が向上します。私たちはチャンネル数を削減することで計算負荷を大幅に軽減し、同時にこの独自の構造によって高い精度を達成しています。さらに、リザルダルブロックでの共有重み戦略を提案しており、パフォーマンスを犠牲にすることなくパラメータ数を削減しています。PASCAL VOCデータセットにおいて、ShelfNetはPSPNetなどの一般的な非リアルタイム手法と同等の精度で4倍速い推論速度を達成しています。また、CityscapesデータセットではBiSeNetなどのリアルタイムセグメンテーションモデルと比較して同等の速度でより高い精度を達成しており、自動運転における街路シーン理解など、速度が求められるタスクへの適用が可能となっています。特にResNet34バックボーンを使用した場合、ShelfNetはCityscapesデータセットで79.0%のmIoU(平均交差率)を達成しており、ResNet101などの大規模バックボーンを使用したPSPNetやBiSeNetよりも優れています。多数の実験を通じて、ShelfNetの優れた性能が確認されました。本論文では実装リンクも提供しています。\url{https://github.com/juntang-zhuang/ShelfNet-lw-cityscapes}

ShelfNetを用いた高速セマンティックセグメンテーション | 最新論文 | HyperAI超神経