2ヶ月前

LinkNet: エンコーダ表現を活用した効率的なセマンティックセグメンテーション

Abhishek Chaurasia; Eugenio Culurciello
LinkNet: エンコーダ表現を活用した効率的なセマンティックセグメンテーション
要約

視覚シーン理解のためのピクセル単位のセマンティックセグメンテーションは、精度だけでなく、リアルタイムアプリケーションでの利用を考慮して効率性も必要とされます。既存のアルゴリズムは精度が高いものの、ニューラルネットワークのパラメータを効率的に活用することに焦点を当てていません。その結果、パラメータ数や演算量が非常に多くなり、処理速度も遅くなっています。本論文では、パラメータ数を大幅に増加させずに学習できる新しい深層ニューラルネットワークアーキテクチャを提案します。当社のネットワークは、3x640x360 解像度の画像処理に 1150 万パラメータと 21.2 ギガFLOPS(GFLOPs)しか使用しません。CamVid データセットで最先端の性能を示し、Cityscapes データセットでも同等の結果を得ています。また、NVIDIA GPU および組み込みシステムデバイス上で異なる解像度の画像に対する当社ネットワークの処理時間を、既存の最先端アーキテクチャと比較しています。

LinkNet: エンコーダ表現を活用した効率的なセマンティックセグメンテーション | 最新論文 | HyperAI超神経