2달 전

십억 규모의 반지도 학습을 이용한 이미지 분류

I. Zeki Yalniz; Hervé Jégou; Kan Chen; Manohar Paluri; Dhruv Mahajan
십억 규모의 반지도 학습을 이용한 이미지 분류
초록

본 논문은 대형 컨볼루션 네트워크를 활용한 준지도 학습에 대한 연구를 제시합니다. 우리는 교사/학생 패러다임을 기반으로 하는 파이프라인을 제안하며, 이는 최대 10억 개의 라벨이 없는 이미지 컬렉션을 활용합니다. 우리의 주요 목표는 ResNet-50 또는 ResNext와 같은 특정 타겟 아키텍처의 성능을 향상시키는 것입니다. 우리는 접근 방식의 성공 요인에 대한 광범위한 분석을 제공하며, 이를 바탕으로 준지도 학습을 통해 이미지 분류 모델의 정확도를 높이는 데 대한 몇 가지 권장 사항을 제시합니다. 결과적으로, 우리의 접근 방식은 이미지, 비디오 및 세부 분류를 위한 표준 아키텍처에서 중요한 성능 향상을 가져옵니다. 예를 들어, 10억 개의 라벨이 없는 이미지를 활용함으로써, 우리가 학습한 기본 ResNet-50은 ImageNet 벤치마크에서 81.2%의 상위 1등급 정확도를 달성했습니다.

십억 규모의 반지도 학습을 이용한 이미지 분류 | 최신 연구 논문 | HyperAI초신경