11日前
鉄道は列車ではない:弱教師付きセマンティックセグメンテーションにおける類似性を用いた擬似ピクセル教師信号
Seungho Lee, Minhyun Lee, Jongwuk Lee, Hyunjung Shim

要約
弱教師ありセマンティックセグメンテーション(WSSS)における既存の研究は、画像レベルの弱教師信号を用いる手法にいくつかの限界を抱えている。具体的には、オブジェクトカバレッジが疎であり、オブジェクト境界の精度が低く、非ターゲットオブジェクトに由来する共起ピクセルが混在する問題が挙げられる。これらの課題を克服するため、本研究では新たなフレームワーク「明示的擬似ピクセル教師(Explicit Pseudo-pixel Supervision: EPS)」を提案する。本手法は、2つの弱教師信号を統合することでピクセルレベルのフィードバックから学習を行う。画像レベルのラベルは、オブジェクトの識別情報をローカリゼーションマップを通じて提供する一方、既存のサリエンシーディテクションモデルから得られるサリエンシーマップは、豊富な境界情報を供給する。さらに、両者の補完的な関係を最大限に活かすため、統合的な訓練戦略を設計した。本手法により、正確なオブジェクト境界を獲得するとともに、共起ピクセルを排除でき、擬似マスクの品質を顕著に向上させることができる。実験結果から、本手法はWSSSにおける主要な課題を効果的に解決し、PASCAL VOC 2012およびMS COCO 2014の両データセットにおいて、従来の手法を大幅に上回る性能を達成し、新たな最先端(state-of-the-art)水準を確立した。