2ヶ月前

CGNet: 軽量な文脈誘導ネットワークを用いた意味分割

Tianyi Wu; Sheng Tang; Rui Zhang; Yongdong Zhang
CGNet: 軽量な文脈誘導ネットワークを用いた意味分割
要約

モバイルデバイスでのセマンティックセグメンテーションモデルの適用需要が急速に増加しています。現行の最先端ネットワークはパラメータ数が膨大であるため、モバイルデバイスには適していません。一方、他の小規模メモリフットプリントモデルは分類ネットワークの精神を踏襲し、セマンティックセグメンテーションの固有特性を無視しています。この問題に対処するため、私たちは新しいコンテキストガイデッドネットワーク(CGNet)を提案します。これは、軽量かつ効率的なセマンティックセグメンテーション用ネットワークです。まず、ローカル特徴と周辺コンテキストの結合特徴を学習し、さらに全体的なコンテキストで結合特徴を改善するコンテキストガイデッド(CG)ブロックを提案します。CGブロックに基づいて、私たちはネットワークのすべての段階でコンテキスト情報を捕捉し、特にセグメンテーション精度向上のために特別に設計されたCGNetを開発しました。CGNetはまた、パラメータ数を削減し、メモリフットプリントを節約するために巧妙に設計されています。同等のパラメータ数のもとで、提案されたCGNetは既存のセグメンテーションネットワークを大幅に上回る性能を示します。CityscapesおよびCamVidデータセットにおける広範な実験により、提案手法の有効性が確認されました。具体的には、後処理や多尺度テストを行わずに、提案されたCGNetは0.5M未満のパラメータでCityscapesにおいて64.8%の平均IoU(Intersection over Union)を達成しました。本システムのソースコードは以下のURLから入手できます: https://github.com/wutianyiRosun/CGNet