2달 전

훈련-테스트 해상도 불일치 수정

Hugo Touvron; Andrea Vedaldi; Matthijs Douze; Hervé Jégou
훈련-테스트 해상도 불일치 수정
초록

데이터 증강은 이미지 분류를 위한 신경망 훈련의 핵심 요소입니다. 본 논문에서는 기존의 증강 방법이 훈련 시와 테스트 시에 분류기가 보는 객체의 일반적인 크기 사이에 상당한 차이를 유발한다는 점을 처음으로 보여줍니다. 우리는 실험적으로 검증하여, 목표 테스트 해상도에 대해 더 낮은 훈련 해상도를 사용할 때 테스트 시에 더 나은 분류 성능을 얻을 수 있음을 확인하였습니다.다음으로, 훈련 해상도와 테스트 해상도가 다를 때 분류기 성능을 최적화하기 위한 간단하면서 효과적이고 효율적인 전략을 제안합니다. 이 전략은 테스트 해상도에서 네트워크의 계산량이 적은 미세 조정(fine-tuning)만을 포함합니다. 이로 인해 작은 훈련 이미지를 사용하여 강력한 분류기를 훈련시킬 수 있습니다. 예를 들어, 128x128 이미지에서 훈련된 ResNet-50으로 ImageNet에서 77.1%의 top-1 정확도를 얻었으며, 224x224 이미지에서 훈련된 경우 79.8%의 정확도를 얻었습니다. 또한 추가적인 훈련 데이터를 사용하면 224x224 이미지에서 훈련된 ResNet-50으로 82.5%의 정확도를 달성할 수 있습니다.반대로, 약하게 감독된 방식으로 9억 4천만 개의 공개 이미지에서 224x224 해상도로 사전 학습(pre-trained)된 ResNeXt-101 32x48d 모델을 320x320 해상도로 추가 최적화(further optimizing)하였을 때, 단일 자르기(single-crop) 방식으로 테스트 top-1 정확도 86.4%(top-5: 98.0%)를 달성하였습니다. 우리의 지식 범위 내에서는 이 결과가 현재까지 가장 높은 ImageNet 단일 자르기, top-1 및 top-5 정확도입니다.

훈련-테스트 해상도 불일치 수정 | 최신 연구 논문 | HyperAI초신경