4달 전

잡음 데이터의 비합리적인 효과성에 대한 고도의 인식

Jonathan Krause; Benjamin Sapp; Andrew Howard; Howard Zhou; Alexander Toshev; Tom Duerig; James Philbin; Li Fei-Fei
잡음 데이터의 비합리적인 효과성에 대한 고도의 인식
초록

현재의 세부 인식(fine-grained recognition) 접근 방식은 다음과 같습니다. 첫째, 전문가들을 모집하여 이미지 데이터셋을 주석화하고, 필요에 따라 부위 주석과 경계 상자 등의 구조화된 데이터를 수집합니다. 둘째, 이 데이터를 활용하여 모델을 훈련시킵니다. 세부 인식 문제 해결을 위해 우리는 대안적인 접근 방식을 제시합니다. 이 방법은 웹에서 얻은 무료이고 노이즈가 있는 데이터와 간단하며 일반적인 인식 방법을 활용합니다. 이 접근 방식은 성능과 확장성 면에서 장점이 있습니다. 우리는 이를 네 개의 세부 인식 데이터셋에서 검증하였으며, 단 하나의 라벨도 수동으로 수집하지 않았음에도 불구하고 기존 최신 기술(state of the art)을 크게 초월하는 결과를 보여주었습니다. 또한 10,000개 이상의 세부 카테고리로 확장하는 초기 결과를 제시하였습니다. 정량적으로, CUB-200-2011에서는 92.3%, Birdsnap에서는 85.4%, FGVC-Aircraft에서는 93.4%, Stanford Dogs에서는 80.8%의 top-1 정확도를 달성하였으며, 이는 주석화된 훈련 세트를 사용하지 않은 상태에서 이루어진 것입니다. 우리는 우리의 접근 방식을 세부 인식 데이터셋 확장을 위한 활성 학습(active learning) 접근 방식과 비교하였습니다.