11日前
大規模な教師なしセマンティックセグメンテーション
Shanghua Gao, Zhong-Yu Li, Ming-Hsuan Yang, Ming-Ming Cheng, Junwei Han, Philip Torr

要約
大規模なデータセット(例:ImageNet)を活用することで、大規模データにおける教師なし学習は分類タスクにおいて顕著な進展をもたらしました。しかし、大規模な教師なしセマンティックセグメンテーションが達成可能かどうかについては、まだ不明な点が多く残っています。この分野には2つの主要な課題があります。第一に、アルゴリズムの評価に用いる大規模なベンチマークが必要であること。第二に、カテゴリと形状の表現を同時に教師なしの形で学習する手法を開発する必要があることです。本研究では、新たなベンチマークデータセットを構築することで、大規模教師なしセマンティックセグメンテーション(Large-scale Unsupervised Semantic Segmentation: LUSS)という新しい課題を提示します。ImageNetデータセットを基盤として、120万枚のトレーニング画像と5万枚の高品質なセマンティックセグメンテーションアノテーションを備えた「ImageNet-S」データセットを提案します。本ベンチマークは高いデータ多様性と明確なタスク目的を備えており、研究の進展を支援します。さらに、LUSSに対して効果的であることが示された、シンプルながら高い性能を発揮する手法も提案しています。併せて、関連する完全教師あり・弱教師あり・教師なしの手法についてもベンチマーク評価を行い、LUSSにおける課題と今後の研究方向性を明らかにしました。ベンチマークデータセットおよびソースコードは、https://github.com/LUSSeg にて公開されています。