11일 전
대규모 비지도 의미 분할
Shanghua Gao, Zhong-Yu Li, Ming-Hsuan Yang, Ming-Ming Cheng, Junwei Han, Philip Torr

초록
대규모 데이터셋(예: ImageNet)을 기반으로, 대규모 데이터에 대한 비지도 학습은 분류 작업에서 중요한 진전을 이끌어냈다. 그러나 대규모 비지도 의미 분할(semantic segmentation)이 가능할지는 아직 알려지지 않았다. 이 분야에는 두 가지 주요 도전 과제가 존재한다. 첫째, 알고리즘을 평가할 수 있는 대규모 벤치마크가 필요하다. 둘째, 카테고리와 형태 표현을 동시에 비지도 방식으로 학습할 수 있는 방법이 필요하다. 본 연구에서는 이러한 문제를 해결하기 위해 새로운 문제인 대규모 비지도 의미 분할(Large-Scale Unsupervised Semantic Segmentation, LUSS)을 제안하고, 연구 발전을 지원하기 위해 새로 구축한 벤치마크 데이터셋을 제시한다. ImageNet 데이터셋을 기반으로, 120만 개의 훈련 이미지와 5만 개의 고품질 의미 분할 레이블을 포함하는 ImageNet-S 데이터셋을 제안한다. 본 벤치마크는 높은 데이터 다양성과 명확한 작업 목표를 갖추고 있으며, 관련된 비지도, 약지도, 전지도 학습 방법들을 함께 평가하여 LUSS의 과제와 가능성을 탐색한다. 또한, LUSS에 효과적으로 작동하는 간단하면서도 강력한 방법을 제시한다. 벤치마크 및 소스 코드는 공개되어 있으며, https://github.com/LUSSeg 에서 확인할 수 있다.