
要約
限られたラベリングデータから視覚情報を理解する能力は、機械学習の重要な側面です。画像レベルの分類は半教師あり設定で広く研究されてきましたが、限られたデータでの密集ピクセルレベルの分類は最近になって注目を集め始めました。本研究では、限られたピクセル単位のアノテーションサンプルから学習し、追加のアノテーションなし画像を活用する半教師ありセマンティックセグメンテーションの手法を提案します。この手法は、自己学習を含む半教師あり分類と半教師ありセグメンテーションを結びつける2つのネットワークブランチを使用します。二重ブランチ手法は、少ないラベルでの学習時に典型的に発生する低レベルおよび高レベルのアーティファクトを軽減します。特に非常に少ないラベリングサンプルで学習した場合、既存の方法よりも大幅な改善が見られます。PASCAL VOC 2012、PASCAL-Context、Cityscapesなどのいくつかの標準的なベンチマークにおいて、本手法は新しい最先端の半教師あり学習を達成しています。