2ヶ月前
ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation ESPNet: セマンティックセグメンテーションのための効率的な拡張畳み込みの空間ピラミッド
Sachin Mehta; Mohammad Rastegari; Anat Caspi; Linda Shapiro; Hannaneh Hajishirzi

要約
リソース制約下での高解像度画像のセマンティックセグメンテーションに向けた高速かつ効率的な畳み込みニューラルネットワーク、ESPNet(Efficient Spatial Pyramid Network)を紹介します。ESPNetは、計算量、メモリ、消費電力の面で効率的な新しい畳み込みモジュールである効率的空間ピラミッド(ESP: Efficient Spatial Pyramid)に基づいています。ESPNetは最新のセマンティックセグメンテーションネットワークPSPNet(Pyramid Scene Parsing Network)よりも22倍速く(標準GPU上では)、180倍小型でありながら、カテゴリごとの精度はわずか8%低下しています。私たちはCityscapes、PASCAL VOC、および乳癌生検全体スライド画像データセットを含む様々なセマンティックセグメンテーションデータセット上でESPNetを評価しました。同じメモリと計算量の制約下で、MobileNet、ShuffleNet、ENetなどの現在の効率的なCNNネットワークよりも、標準的な指標と新たに導入したエッジデバイス上の効率性を測定するパフォーマンス指標の両方において優れています。当社のネットワークは、標準GPUでは1秒間に112フレーム、エッジデバイスでは1秒間に9フレームという速度で高解像度画像を処理できます。