16日前

SIGN:空間情報を組み込んだ生成ネットワークによる汎化型ゼロショットセマンティックセグメンテーション

Jiaxin Cheng, Soumyaroop Nandi, Prem Natarajan, Wael Abd-Almageed
要約

従来のゼロショット分類とは異なり、ゼロショットセマンティックセグメンテーションは画像レベルではなく、ピクセルレベルでクラスラベルを予測する。ゼロショットセマンティックセグメンテーションの課題を解決するにあたり、周囲の文脈を考慮したピクセルレベルの予測が求められるため、位置符号化(positional encoding)を用いて空間情報を統合する必要がある。本研究では、標準的な位置符号化を改良し、特徴レベルで空間情報を統合可能な「相対位置符号化(Relative Positional Encoding)」の概念を導入することで、任意の画像サイズに対応可能な手法を実現した。さらに、ゼロショットセマンティックセグメンテーションにおいて広く用いられている自己学習(self-training)手法では、偽ラベルの生成が行われるが、本研究では新たな知識蒸留(knowledge distillation)に着想を得た自己学習戦略、すなわち「冷却型自己学習(Annealed Self-Training)」を提案する。この手法は、偽ラベルに自動的に異なる重みを割り当てることで、性能の向上を実現する。本研究では、相対位置符号化と冷却型自己学習の有効性を包括的な実験評価を通じて体系的に検証し、3つのベンチマークデータセットにおける実証結果から、本手法の有効性が確認された。

SIGN:空間情報を組み込んだ生成ネットワークによる汎化型ゼロショットセマンティックセグメンテーション | 最新論文 | HyperAI超神経