17日前
位置情報を考慮したアップサンプリングによるセマンティックセグメンテーション
Xiangyu He, Zitao Mo, Qiang Chen, Anda Cheng, Peisong Wang, Jian Cheng

要約
最小化Dice損失や交差エントロピー損失といった多くの成功した学習目標が、セグメンテーションタスクにおいて前例のない飛躍を可能にした。これらのセマンティック指標に加えて、本論文ではセマンティックセグメンテーションに位置情報の監視(location supervision)を導入することを目指す。この考えに基づき、学習可能なオフセットにより補間座標を適応的に修正する「位置認識補間(Location-aware Upsampling, LaU)」を提案する。さらに、ピクセルが正確に分類された位置へと移動することを促すことで、位置認識損失を構築する。LaUはオフセット予測と補間を統合したモジュールであり、粗い段階から細かい段階へと、端末から端末までエンド・ツー・エンドで学習され、各位置における信頼度スコアを生成する。位置認識損失によってガイドされたこの新モジュールは、そのまま「プラグアンドプレイ」の形で従来の補間手法(例:双線形補間)を置き換えることができ、最先端のエンコーダ・デコーダ型アーキテクチャの性能をさらに向上させる。広範な実験により、ベンチマークデータセット上で既存の最先端手法に対して一貫した性能向上が確認された。本研究のコードは、https://github.com/HolmesShuan/Location-aware-Upsampling-for-Semantic-Segmentation にて公開されている。