
要約
セマンティックセグメンテーションは、画像の各ピクセルにクラスラベルを割り当てるタスクである。本研究では、完全監督と弱い監督の両方に対応し、以下の3つの一般的な問題を解決する領域ベースのセマンティックセグメンテーションフレームワークを提案する。オブジェクトは複数のスケールで存在するため、複数のスケールでの領域を使用すべきである。しかし、これらの領域が重複しているため、ピクセルレベルでのクラス予測に矛盾が生じる。実際のデータセットにおいて、クラス頻度は極めて不均衡である。各ピクセルは単一のクラスにのみ割り当てられるため、クラス間で競合が生じる。我々はこれら3つの問題を、最終的なピクセルレベル出力ラベリングに対して定義された多クラス損失を最適化する共同キャリブレーション手法により解決する。この手法は単純な領域分類とは異なり、全体的な出力ラベリングに焦点を当てている。我々の手法は、SIFT Flow [18] データセットにおいて完全監督および弱い監督設定の両方で最先端の方法を大幅に上回る結果を示した(それぞれ+6% および +10% の改善)。