2달 전

iNaturalist 종 분류 및 검출 데이터셋

Grant Van Horn; Oisin Mac Aodha; Yang Song; Yin Cui; Chen Sun; Alex Shepard; Hartwig Adam; Pietro Perona; Serge Belongie
iNaturalist 종 분류 및 검출 데이터셋
초록

컴퓨터 비전에서 사용되는 기존 이미지 분류 데이터셋은 일반적으로 객체 카테고리 간에 이미지 분포가 균일하다는 특징을 가지고 있습니다. 반면, 자연계에서는 일부 종이 다른 종보다 훨씬 많고 촬영하기 쉽기 때문에 극단적으로 불균형한 상태입니다. 실제 세계의 어려운 조건에서 더 많은 발전을 유도하기 위해, 우리는 iNaturalist 종 분류 및 탐지 데이터셋을 소개합니다. 이 데이터셋은 전 세계에서 촬영된 5,000여 개의 식물과 동물 종으로부터 수집된 859,000장의 이미지를 포함하고 있습니다. 이 데이터셋은 시각적으로 유사한 종들을 다양한 상황에서 포착하였으며, 다양한 카메라 유형으로 촬영되어 이미지 품질이 다르고, 큰 클래스 불균형을 보이며, 여러 시민 과학자들에 의해 검증되었습니다.데이터셋의 수집 과정과 최신 컴퓨터 비전 분류 및 탐지 모델을 사용한 광범위한 베이스라인 실험 결과를 논의합니다. 실험 결과는 현재 앙상블 기반 방법을 사용하지 않는 방법들이 1위 분류 정확도가 단 67%에 불과함을 보여주어, 이 데이터셋의 어려움을 입증합니다. 특히, 학습 예제 수가 적은 클래스에서는 성능이 매우 저조하여 저 샷 학습(low-shot learning)에 더 많은 주목이 필요함을 확인할 수 있었습니다.

iNaturalist 종 분류 및 검출 데이터셋 | 최신 연구 논문 | HyperAI초신경