11日前

WSSSにおけるしきい値の重要性:しきい値に対してロバストかつ正確なセグメンテーションモデルのための活性化の操作

Minhyun Lee, Dongseob Kim, Hyunjung Shim
WSSSにおけるしきい値の重要性:しきい値に対してロバストかつ正確なセグメンテーションモデルのための活性化の操作
要約

弱教師付きセマンティックセグメンテーション(WSSS)は、画像レベルのラベルのみを用いてセグメンテーションモデルを学習できるという可能性から、近年注目を集めている。従来のWSSS手法は、CAM(Class Activation Map)のスパースなカバレッジがWSSSの性能ボトルネックを引き起こしていると一般的に主張している。しかし、本論文では、実際のボトルネックがスパースなカバレッジにあるのではなく、CAMの後に適用されるグローバルしきい値処理にあるという、分析的かつ実証的な証拠を提示する。その後、この問題は以下の2つの条件を満たすことで軽減可能であることを示す:1)前景活性化の不均衡を低減すること、および2)前景と背景の活性化の差を拡大すること。これらの知見に基づき、ピクセル単位の分類損失とラベル条件付けモジュールを備えた新しい活性化操作ネットワークを提案する。ピクセル単位の分類は、活性化マップに自然に二段階の活性化を誘導する。これにより、最も特徴的な領域に対するペナルティを課し、特徴が弱い領域を強化し、背景領域を非活性化することができる。一方、ラベル条件付けは、偽マスクの出力ラベルが真の画像レベルラベルのいずれかに一致するように制約する。これにより、非対象クラスに誤って割り当てられた活性化をペナルティ処理する。広範な分析と評価を通じて、各モジュールが正確な偽マスクの生成に寄与し、グローバルしきい値の選択に対して堅牢性を発揮することを実証した。最終的に、本モデルはPASCAL VOC 2012およびMS COCO 2014の両データセットにおいて、最先端の性能を達成した。