要約
本稿では、多数の画像レベル分類ラベルと少数のピクセルレベルのアノテーションが利用可能な、半教師ありおよび弱教師ありセマンティックセグメンテーション(SWSSS)の課題に取り組む。我々は、SWSSSを解決する上で最も重要な点は高品質な疑似ラベル(pseudo labels)を生成することであると考え、本手法はこの点を二つの視点から対処する。第一に、ネットワーク学習にクラス意識型交差エントロピー(CCE)損失を導入する。従来の交差エントロピー損失と比較して、CCE損失は同時に出現するクラス間の区別にのみ注目させ、疑似ラベル生成の学習目標を単純化する。第二に、動的評価メカニズムを備えた二つのネットワーク間での相互監督を構築するための段階的相互学習(PCT)手法を提案する。このPCTは、高品質な予測結果を段階的に追加の監督情報として導入することで、ネットワーク学習を促進する。本手法は、アノテーションが極めて限られた状況下でも生成される疑似ラベルの品質を著しく向上させる。広範な実験により、本手法が最先端の手法を顕著に上回ることを示した。