2달 전
CurriculumNet: 대규모 웹 이미지에서 약한 감독 학습 수행
Sheng Guo; Weilin Huang; Haozhi Zhang; Chenfan Zhuang; Dengke Dong; Matthew R. Scott; Dinglong Huang

초록
우리는 인터넷에서 텍스트 쿼리를 사용하여 크롤링한 대규모 약간 지도된 웹 이미지를 이용해 깊은 신경망을 훈련시키는 간단하면서도 효율적인 접근법을 제시합니다. 이 방법은 인간의 주석 없이 수행됩니다. 우리는 커리큘럼 학습을 활용하여 원칙에 입각한 학습 전략을 개발하였으며, 이는 대량의 노이즈 라벨과 데이터 불균형을 효과적으로 처리하는 것을 목표로 합니다. 우리는 특성 공간에서 데이터 분포 밀도를 측정하여 데이터의 복잡성을 평가하고, 이를 비지도 방식으로 순위를 매기는 새로운 커리큘럼 학습 방법을 설계하였습니다. 이는 대규모 웹 이미지에 대한 커리큘럼 학습의 효율적인 구현을 가능하게 하며, 노이즈 라벨의 부정적 영향을 크게 줄이는 고성능 CNN 모델을 생성합니다. 특히, 실험 결과 매우 노이즈가 많은 라벨을 가진 이미지들이 규제 형태로 작용하여 모델의 일반화 능력을 놀랍게 향상시킬 수 있다는 점을 보여주었습니다. 우리의 접근법은 WebVision, ImageNet, Clothing-1M 및 Food-101 네 가지 벤치마크에서 최고 성능을 달성하였습니다. 다중 모델 앙상블을 사용하여 1000개 카테고리 분류 문제에서 WebVision 도전 과제에서 상위 5개 오류율 5.2%를 기록하였습니다. 이 결과는 두 번째 성능보다 상대적으로 거의 50% 낮은 오류율로 가장 우수한 성능을 보였습니다. 코드와 모델은 다음 링크에서 제공됩니다: https://github.com/MalongTech/CurriculumNet .