2달 전

FSS-1000: 소수 샷 세그멘테이션을 위한 1000 클래스 데이터셋

Xiang Li; Tianhan Wei; Yau Pun Chen; Yu-Wing Tai; Chi-Keung Tang
FSS-1000: 소수 샷 세그멘테이션을 위한 1000 클래스 데이터셋
초록

최근 몇 년 동안, 대규모 인간 주석 데이터셋인 PASCAL VOC, ImageNet, COCO 등의 존재 덕분에 딥 러닝이 이미지 인식 분야에서 성공을 거두었습니다. 이러한 데이터셋들은 다양한 객체 카테고리를 포함하고 있지만, 여전히 많은 수의 객체들이 포함되어 있지 않습니다. 많은 인간 주석 없이 같은 작업을 수행할 수 있을까요? 본 논문에서는 5개만 주석이 달린 훈련 예제를 사용하는 소수 샷 객체 분할(few-shot object segmentation)에 관심을 가지고 있습니다. 우리의 접근 방식의 성능을 평가하고 검증하기 위해, 1000개의 객체 클래스와 픽셀 단위로 주석이 달린 정답 분할(ground-truth segmentation)으로 구성된 소수 샷 분할 데이터셋인 FSS-1000을 구축하였습니다. FSS-1000의 독특한 점은 이전 데이터셋에서 보거나 주석이 달리지 않았던 많은 수의 객체들을 포함하고 있다는 것입니다. 예를 들어, 작은 일상용품, 상품, 만화 캐릭터, 로고 등입니다. 우리는 VGG-16, ResNet-101, Inception과 같은 표준 백본 네트워크를 사용하여 기준 모델을 구축하였습니다. 놀랍게도, FSS-1000을 사용하여 모델을 처음부터 학습시키는 것이 ImageNet으로 사전 학습된 가중치를 사용하여 학습시키는 것보다 더 나은 결과를 얻었으며, ImageNet은 FSS-1000보다 100배 이상 큰 데이터셋입니다. 우리의 접근 방식과 데이터셋은 간단하면서도 효과적이며, 매우 적은 주석이 달린 훈련 예제로 새로운 객체 클래스의 분할을 배우는 데 쉽게 확장될 수 있습니다. 데이터셋은 https://github.com/HKUSTCV/FSS-1000에서 이용 가능합니다.