
要約
弱教師ありセマンティックセグメンテーション(WSSS)は、クラスレベルのラベルからセグメンテーションラベルを学習することを目的とする困難なタスクである。従来の研究では、クラス活性化マップ(CAMs)から得られる情報を活用することが広く行われている。しかし、CAMsは分類ネットワークから得られるため、対象オブジェクトの最も判別力の高い部分に注目する傾向があり、セグメンテーションタスクに必要な完全な事前情報が得られず、不完全な情報となる。本研究では、セグメンテーションラベルと整合性の高いCAMsを獲得するために、分類とセグメンテーションの両タスクを同時に行える修正されたエンコーダ・デコーダ型のセグメンテーションモデルを用いた反復的アプローチを提案する。真のセグメンテーションラベルが与えられない状況下で、このモデルは密な条件付き確率場(dCRF)を活用して疑似セグメンテーションラベルを生成する。その結果、提案手法は反復的自己改善型のモデルとして機能する。DeepLabv3およびUNetモデルを用いた実験により、Pascal VOC12データセット上で顕著な性能向上が確認され、特にDeepLabv3を用いた場合、現在の最先端の指標を2.5%向上させた。実験に伴う実装コードは以下のGitHubリポジトリにて公開されている:https://github.com/cenkbircanoglu/isim。