2달 전

일반화된 범주 발견

Sagar Vaze; Kai Han; Andrea Vedaldi; Andrew Zisserman
일반화된 범주 발견
초록

본 논문에서는 라벨이 부착된 이미지 집합과 라벨이 없는 이미지 집합이 주어졌을 때, 라벨이 없는 모든 이미지를 분류하는 매우 일반적인 이미지 인식 환경을 고려합니다. 여기서 라벨이 없는 이미지는 라벨이 있는 클래스에서 나올 수도 있고, 새로운 클래스에서 나올 수도 있습니다. 기존의 인식 방법들은 이러한 환경을 처리할 수 없는데, 이는 라벨이 없는 샘플들이 알려진 클래스 또는 알려지지 않은 클래스에서만 나온다는 등의 몇 가지 제한적인 가정을 하기 때문입니다. 또한 알려지지 않은 클래스의 수가 사전에 알려져 있다는 가정도 포함됩니다. 우리는 이러한 제약 조건들을 모두 도전하며, 더 자유로운 환경을 다루고 이를 '일반화된 카테고리 발견'이라고 명명합니다. 먼저, 알려지지 않은 카테고리 발견 알고리즘 중 최신 연구 결과를 가져와 이 과제에 맞게 적응시켜 강력한 베이스라인을 설정합니다. 다음으로, 이 오픈 월드 환경에서 대조적 표현 학습(contrastive representation learning)을 사용한 비전 트랜스포머(vision transformers)의 활용을 제안합니다. 그 후, 간단하면서도 효과적인 반지도 $k$-means 방법을 소개하여 라벨이 없는 데이터를 자동으로 관찰된 클래스와 미관찰된 클래스로 클러스터링하는데 사용되며, 베이스라인보다 크게 성능을 향상시킵니다. 마지막으로, 라벨이 없는 데이터 내의 클래스 수를 추정하기 위한 새로운 접근 방식도 제안합니다. 우리는 일반 객체 분류 및 세부적인 데이터셋(fine-grained datasets)에서 최근 개발된 의미적 변화 벤치마크(Semantic Shift Benchmark) 스위트를 활용하여 본 접근 방식을 철저히 평가하였습니다. 프로젝트 페이지: https://www.robots.ox.ac.uk/~vgg/research/gcd

일반화된 범주 발견 | 최신 연구 논문 | HyperAI초신경